- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一期︰搜索引擎基础篇
交艺网搜索引擎优化培训第一期:搜索引擎基础篇 搜索引擎对页面的收录 网页分析 页面排序 关键字查询(搜索引擎命令,此处略,后详) SEO项目所需基本技能 培训重点 了解SEO的现实意义——技术研发 技术研发 满足开发需求,为提升网站整体流量提供功能支持 以页面加速为前提,了解SEO的对前端性能优化的需求 成为更有潜力、具备开发能力的个人站长 相关知识:对搜索引擎友好的URL地址、前端性能优化、后台文本编辑功能、特殊状态码、网站地图、内容挖掘 了解SEO的现实意义——前端设计 前端设计 从搜索引擎的角度了解用户访问页面的习惯 与SEO共同成长,提升对UE/UCD的理解 相关知识:栅格系统、前端Web标准、信息架构、交互设计、人机交互界面、可用性、易用性、ROI模型、纸质/低保真/高保真原型图 了解SEO的现实意义——内容中心 内容中心 从搜索引擎的角度了解: 1)如何收集内容; 2)基本的搜索引擎命令; 3)搜索引擎是收录页面的原理、规律及排名提升技巧; 与SEO共同成长,提升对UE/UCD的理解 相关知识:关键字设置、有规律地的更新、文章主题、文章长度、避免内容重复、关键字堆砌、关键字密度、隐藏文本/链接、内容伪原创、内部链接、针对外链的推广 了解SEO的现实意义——市场运营 市场运营 了解多种搜索引擎营销推广方式/针对外链和效果的推广: ①收录比例→②产品转化→③KPI →④数据分析(循环至①); 了解满足客户的排名要求需要哪些条件; 相关知识:微博/博客推广、论坛推广、网摘/开放目录提交、友情链接、百科类站点操作、Alexa排名与流量的关系、其他社会化媒体推广、邮件营销/EDM、链接购买、链接更新周期、影响排名的因素、QQ/MSN群营销 搜索引擎对页面的收录 收录是大前提——先有收录,再有排名,才有流量 页面收录流程 页面收录原理 页面收录方式 如何避免重复性收录 页面维护方式 1、页面收录流程 搜索引擎派出蜘蛛,通过URL抓取页面 蜘蛛的爬行途径: a)站内链接:爬取网站首页,然后通过广度、深度方式遍历; b)外部链接:开放目录(如Dmoz)、搜索引擎站点提交入口、通过爬取其他正常收录的站点上的交换友链; 2、页面收录原理 搜索引擎派出蜘蛛,通过URL抓取页面 1)、收集待索引网页的URL:以Google为例,数据中心派出freshbot,发现并维护一个庞大的URL列表供deepbot使用。当爬取一个页面时,目的不是收录,而是找出这个页面中的所有链接;freshbot记录的信息包括网页的URL、TimeStamp(网页创建或更新的时间戳),以及网页的Head信息; 2、网页的索引与收录:接下来才进入真正的索引与收录网页过程,deepbot会首先索引优先级较高的网站/网页,优先级越高,出现在Google索引数据库并出现在自然搜索结果中的速度也越快 2、页面收录原理 搜索引擎派出蜘蛛,通过URL抓取页面 3、数据中心间的同步: deepbot索引某个网页时会由特定的数据中心完成,而不会出现多个数据中心同时读取该网页,分别获得网页最近版本的情况,在索引过程完成后,便需要一个数据同步过程,将网页的最新版本在多个数据中心得到更新;这就是之前著名的GoogleDance。在BigDaddy更新后,数据中心间的同步不再象那样集中在特定的时间段,而是以一种连续的、时效性更强的方式进行。 3、页面收录方式 广度优先 - 也叫宽度优先,一层一层的爬行,按照层的分布与布局,去索引处理与抓取页面; 深度优先 蜘蛛将会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再返回上层并转入下一个起始页,继续跟踪链接; (先广度优先,再深度优先为主流搜索引擎爬取的方式) 用户提交 由用户主动提交到主流搜索引擎、开放目录,或与权重较高的网站进行链接交换。 4、如何避免重复性收录 重复内容:主要包括镜像内容和转载内容 镜像内容,内容完全相同的页面互为镜像,SE会将页面分成N个区域进行比较,再综合多个因素(页面权重、最后修改时间等)识别源页面和镜像页; 转载内容,是指与原创页面相近或相似的页面,同样SE会将页面分成N个区域,假如其中有M个区域相同,且M/N的值介于一个阀值区间时,认为这两个页面是互为转载的。 如何避免重复内容:将页面中的元素重排(例如更换页面模板, 对模板进行重构)、对页面中的标题和正文内容进行伪原创处理。 5、页面维护方式 定期抓取(周期性抓取) SE周期性地堆网站中已收录的页面进行全面更新,更新时用抓取到的新页面替换原有的旧页面,删除不存在的页面,并存储新发现的页面; 特点:页面权重同步再分配;周期较长。 增量抓取(周期性抓取) 增量抓取是通过对已抓取的页
您可能关注的文档
- 第9章位置服务和地图应用﹝5﹞.ppt
- 第9章信息安全和社会责任﹝5﹞.ppt
- 第9章元素形态解析.ppt
- 第9章企业可持续发展能力解析.ppt
- 第9章公共政策解析的方法论与模型.ppt
- 第9章公司财务报表解析.ppt
- 第9章协整与误差修正模型.ppt
- 第9章_财务会计报告.ppt
- 第9章单片机应用系统设计和调试﹝5﹞.ppt
- 第9章国际投资法I.ppt
- (高清版)DB41∕T 738-2012 学生公寓配套用纺织品.pdf
- (高清版)DB41∕T 626-2010 商场、市场消防安全管理规范.pdf
- (高清版)DB41∕T 773-2012 水果质量安全监督抽查检验规范.pdf
- (高清版)DB41∕T 707-2011 规模牛场口蹄疫免疫技术规范.pdf
- (高清版)DB41∕T 652-2010 杏鲍菇生产技术规程.pdf
- (高清版)DB41∕T 648-2023 地理标志产品 陈化店矿泉水.pdf
- (高清版)DB41∕T 796-2013 屋顶绿化技术规范.pdf
- (高清版)DB41∕T 683-2011 森林防火总体规划编制规范.pdf
- (高清版)DB41∕T 653-2010 西瓜嫁接育苗技术规程.pdf
- (高清版)DB41∕T 746-2012 轻型电动三轮车.pdf
最近下载
- 《信息技术应用创新软件适配改造成本评估规范》.pdf
- 中国行业标准 YY/T 1939-2024医疗器械细菌内毒素试验方法 重组C因子法.pdf
- 各类游资炒股心法及感悟,套利模式.pdf
- 【客户管理】龙湖客户细分及工作模式分享精华篇-102p.pptx
- 学校智慧平台管理制度范文.docx VIP
- ASME中国制造-ISO12944-5-2018 中文译稿 第5部分 防护涂料体系.pdf
- 《诫子书》公开课课件(共24张ppt)部编版语文七年级上册.ppt
- 三年级数学下册期中试卷及答案【可打印】.doc
- 关于《佛山市市级财政资金投资建设项目工程概算预算结算.doc
- 二年级上册语文选择题强化练习(一).docx
文档评论(0)