光年SEO创始人国平老师是阿里巴巴第二批SEO的负责人,该视频教程大约是五六年前录制的,虽然过去了五六年。但其中的思维观念是非常科学的,相比现在的一些SEO培训都有价值的多。所以本渣花时间整理了一下,分享给大家。
如何做到SEO可控
如今大部分SEO都无法可控,只能猜测是引起流量变化的因素,运气成分大。
SEO可控是指通过数据的统计、分析、知道流量变化的具体原因,实现流量的可控,预测未来的流量走向。
SEO的目的是获得大量的相关流量
计算公式
SEO流量=整体收录量×整体排名×整体点击率
做到影响SEO流量的每个环节可控,从而实现SEO可控
案例分析
排除节假日(一般跌一半流量)
根据数据化的排名,对比各个搜索引擎数据。得知整体排名略微上升
根据站长平台点击率计算,得知点击率不变
统计收录,降低
SEO流量=整体收录量(降低)*整体排名(上升)*整体点击率(不变)→→问题出在收录环节
查看日志 所有蜘蛛的抓取 蜘蛛抓取之前很连贯 现在不连贯。可能原因(未列举完全)
- 防采集系统规则:同IP在某一段时间内,访问超过一定数量网页就屏蔽,导致屏蔽爬充
- 防火墙规则设置不合理
- 404页面301重定向导致蜘蛛不抓取(多个状态吗都不抓)
- 服务器升级(网卡补丁缺失导致爬虫和用户访问慢)
找到问题:物理机虚拟化成三台 硬盘转速有限,爬虫和用户访问慢
整体收录量
根据搜索引擎基本原理,我们可以将收录拆分,获得公式
影响整体收录=搜索引擎抓取量×质量标准
搜索引擎抓取量
搜索引擎抓取量=爬虫总的停留时间÷单个页面停留时间
网页质量
网页质量分内容(原创)和技术(http头优化等)
收录趋势数据化
根据页面URL特征从数据库中查询到页面总量,再该特征的页面收录量除以页面总量,得到收录率
case:
搜索:site:www.4xseo.com inurl:/case/ 收录量
注意:site:数据不准确,因此,我们监测的是收录趋势的涨跌、而不是具体的收录率
优化方法:
- 合理运用nofollow,帮助搜索引擎更好的抓取有效内容
- 优化网页下载速度,减少页面抓取时间,从而提高抓取量(国外测速工具:tools.pingdom.com)
- http头Last-Modified,content-length等的设置(工具:httpwatch,类似于谷歌浏览器F12 Network功能)
知识点:
- DNS有缓存
- 如果网站使用CDN加速:CDN日志+网站日志=完整日志
- 权重=搜索引擎对网站的重视程度,他包括原创以及其他所有优化的正面因素
- 10万个链接链接到10万个页面效果远远大于10万个链接链接到一个页面
- 做排名是针对页面,做首页排名 不如做整站页面排名
- Last-Modified 最后被修改时间,降低搜索引擎蜘蛛重复抓取
- content length 内容长度,也是搜索引擎判断网页更新的信息 建议出现
- content-language设置应正确。
- 排名与PR没有非常直接的关系,PR只能体现外部链接,相对而言相关性更重要
case
某外贸网站content-language是中文,导致英文SEO很难做起流量
整体排名
网页是排名的基本单位
网页排名=45%页面外部因素(降)+15%页面内部因素+30%其他(升)
外部因素
- 网站外部链接流行度 广泛度
- 这个网页/内外部链接中的锚文本
- case:阿里巴巴大量页面 “国际站”指向 阿里巴巴,排名稳定第一
- 网站在主题相关的网站群中的链接流行度
- 外部链接页面本身的链接流行度(权威链接)
- 网站新外部链接的产生速度
- 外部链接页面的主题性
内部因素
- 标题是否含有关键词
- 关键词在网页内容上的位置等
- 网站内部链接结构(pr的传递、导航条、推荐等等)
- 页面内容和关键词的相关性(语义分析)
- 关键词在网站主域名中的使用
- 关键词在页面URL中的使用
case
针对核心关键词添加关键词密度,流量立即下跌
原因:不存在核心关键词。大型网站核心关键词带来的流量非常少,网页关键词自由组合成大量长尾,才能给网页带来更多流量
其他因素
- 权重(正面因素的集合:例如原创性、用户喜欢、权威网站的流行度等)
- 内容原创性
- 用户行为
内容部分
原创性是影响权重的重要因素
知识点:
- 搜索引擎首先会净化网页,去除模板内容。然后通过多种方法来判断是否远程内容:比如:标点符号,选取内容映射成特征码,所以掐头去尾,替换关键词其实是不成功的伪原创方式
- H标签分配其实不重要
- 一个页面没有所谓的核心关键词
- 从用户体验的角度布局关键词的位置更利于SEO
- 换友情链接的标准:第一、流量 第二、相关性
- 物以类聚,人与群分,成千上万的相关关键词,聚合在一起,最核心的内容关键词将获得更好的排名
- 被主题相关的页面链接也能促进关键词排名
- 建议阅读谷歌站长指南
SEO频道
- 网站达到一定规模,搜索引擎无法抓取到所有页面,搜索结果也URL处理成静态URL,然后曝光给搜索引擎,(相当于提供了大量的支干页面)从而增加入口
- 搜索结果页内容本省为原创,可以直接带来流量
- 也利于用户查找内容
- 搜索结果页达到一定数量,会因为重复内容被惩罚,临界值=产品数量/搜索结果列表产品数量*某一个值(某个值指的搜索引擎允许一定的重复)
- 搜索结果产品个数,建议38个左右
- 百度不能单纯这么做搜索结果页,需要关联出更多的相关,内容:例如讨论、新闻
case1
假设:产品数量800万、SEO频道页面38个结果、允许重复3
临界值=800万÷38个×3
case2:
类SEO频道:http://hpgary.iteye.com/wiki/blog/569164(创始人一开始的思路是内链和原创内容)
case3
采集暗网,让搜索引擎认为网站每天发布500原创文章+SEO频道。蜘蛛抓取和流量直线飙升
通过数据库统计出链接被推荐次数,有些推荐很多,有些0推荐。平衡内部推荐提高整体排名
推荐的做法:词库
google adwords相关性推荐出来的词 去掉SEO频道中没有的关键词, 则相关性强,将关键词进行分组合理分配推荐数量
计算排名质量分
建立词库,从词库抽取2万左右热度中等关键词,批量查询排名(工具rank tracker),筛选出前10排名的关键词,并根据各个关键词的点击率 给予不同分值,例如:第一名点击率39%,就给39分, 第七名点击率8%,就给8分
计算总分/有排名的关键词个数=排名质量分
每周统计一次
知识点:
- 监控的是趋势,所以2万样本就可以了
- 如果网站数据发生剧烈改变,对比竞争对手是否改变,如果改变则是搜索引擎算法修改导致
统计分析
粘度=pv/uv
计算出比例涨跌比例,对比各个搜索引擎之间的变化涨跌趋势
case1
多个搜索引擎同时下跌,且比例相近,一周后恢复,得出结论:网站访问出了问题
case2
连续7天比例下降,可以判断是SEO引擎的,如果一天降第二天上涨可以判断不是SEO引起的
点击率
点击率可以通过百度站长平台或谷歌管理员工具查询
点击率=点击次数÷展现次数
方法
- 准确命中目标的需求
- 描述的撰写
- 标题的撰写
case
一个人找杭州某A郊区想找合租信息。用户搜索“A 合租”,返回大部分结果包含结果为“杭州租房”、“杭州A租房”、“杭州合租”均不能100%命中需求。标题包含“杭州A 合租”的结果 与用户需求匹配度高,会获得更好的点击
搜索用户分类
导航型:用户明确知道某存在的网页 搜索特征词
问答型:用户搜索问题
产品型:搜索产品和服务
知识点
- 导航型流量是问答型流量的4~5倍,问答型流量比产品型流量的1.2~1.5倍
- 问答型竞争小于产品型
- 工具google adplanner可以查询网站关键词、流量
case:
- 七天连锁酒店 电话、评价、周边设施等围绕做内容 去竞争导航型
FAQ
排名与PR没有非常直接的关系,PR只能体现外部链接,相对而言相关性更重要
搜索引擎可以识别图片特征
搜索引擎会抓取并识别JS
标题简短,主题集中,主题集中对于涨流量没有直接关系
扩展思维
搜索引擎给予一个权威网站,在一个关键词上的多个排名,网页结果已经非常丰富,宁愿让用户看到权威结果,相关性弱些的网页,也不愿给予相关性强的垃圾页面
教程下载
密码: ugyx