- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎优化解决方案汇编
搜索引擎优化(SEO)解决方案在此之前,希望大家能重新审视搜索引擎,通俗来讲就是我们日常所用的百度、谷歌、搜狗、雅虎等。磨刀不误砍柴工,知己知彼,百战不殆!----杨浩瑞2015.02.13一、搜索引擎是什么?搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。二、搜索引擎如何工作?第一步:爬行搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。第二步:抓取存储搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。第三步:预处理搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。⒈提取文字⒉中文分词⒊去停止词(如:的,啊等)⒋消除噪音(搜索引擎需要识别并消除噪声,如版权、导航条、广告等)5.正向索引6.倒排索引7.链接关系计算8.特殊文件处理除了HTML 文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如 PDF、Word、WPS、XLS、PPT、TXT 文件等。但搜索引擎还不能处理图片、视频、Flash 这类非文字内容,也不能执行脚本和程序。第四步:排名用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。三、搜索引擎优化(SEO)是什么?SEO是英文Search Engine Optimization的缩写, 中文意译为“搜索引擎优化”。 简单地说, SEO是指从自然搜索结果获得网站流量的技术和过程。复杂但更严谨些的定义:SEO是指在了解搜索引擎自然排名机制的基础上, 对网站进行内部及外部的调整优化, 改进网站在搜索引擎中的关键词自然排名, 获得更多流量, 从而达成网站销售及品牌建设的目标。四、为什么要做SEO?1、SEO能让网站的架构更合理,提升客户浏览网页速度,提升用户体验满意度。2、SEO能让网站的产品和服务更完善,提升网站的竞争力。3、SEO可让行业网站更规范和成熟,以获得投资商信赖。4、SEO让行业网站不会在将来因为当初没有SEO而损失惨重。5、SEO让行业网站的流量增加从而获得巨额收入。五、外链、内链、反链概念和关系外链:外部链接,除本站以外的所有链向本站的链接。包含友情链接。内链:站内链接,同域名的链接。例如站内A页链到B页。反链:内链+外链,也就是所有指向本站的链接。五、搜索引擎优化怎么做?看了这么多,现在回到正题,也是我们最关注的东西。我认为要做优化,应该先从自身做起,俗话说:酒香不怕巷子深!在这样一个高科技网络化的时代,首先把网站内部做完善,这样蜘蛛通过外链过来后看到网站如此精美,一定会变成回头客。相反,如果网站内部不好,那么外链再怎么厉害,蜘蛛看到我们的网站后一定会降低权重,以后遇到公司域名直接pass掉。那样就不好了。内链优化:1、网站尽量采用仿静态(据说有影响)(url伪静态),甚至采用静态化(内容静态)。这样可以加快爬虫效率。更有人说,某些搜索引擎爬虫不太喜欢动态网站。2、网站编码尽可能的小,加载速度快,爬虫喜欢,用户也喜欢,如百度首页不到4k。3、网站开发标签减少嵌套,杜绝使用table标签,采用div+css布局,减轻爬虫负担,遍历一棵树是一件很费神的事情,所以一定要爬虫很轻松的检索到网站最重要的信息,而不是将文章内容放到很深的地方。4、网站内链一定要合理,不能出现死链和断链,爬虫能够识别链接是导航、版权、文章还是广告,所以一定要注意这些问题。5、注重摸索标签的重要性,如:b/b h1/h1 title/title直接的文字重要性肯定比一个span/span之类的重要,所以要好好的利用标签的含义。爬虫很大成都上就是靠标签来识别重要性,因为真正理解文字含义的爬虫还不多,甚至没有。6、优化网页关键字,内容简介,标题等7、减少使用大量图片,视频,flash等,既影响访问速度,而且还影响爬虫识别能力,爬虫根本无法识别图片的内容,对他来说就是一片空白。如果真的要使用图片的话,一定要使用alt属性标明该图片的用途和含义,帮助爬虫理解网站精
文档评论(0)