SEOer必须知道的搜索引擎工作原理

  搜索引擎的工作原理是非常复杂的,现实当中其实没有任何人可以研究透他的工作原理。其实SEO人员必须知道搜索引擎原理即可。没必要去研究他的代码是怎么写类似的深奥的技术问题。

  搜索引擎的工作过程大致分为三大阶段。

  第一阶段:抓取与爬行。

  搜索引擎通过跟踪链接访问抓取网页,获得网页的HTML代码然后存入数据库。用来抓取网页的程序被成为蜘蛛baiduspider。google的成为机器人bot。这里要说明的是每个搜索引擎的抓取程序最先访问的是robots.txt文件,因此,这个文件一定要慎重对待,如果,不很熟悉建议就不要写了。否则,写错了导致整个网站不被抓取。

  这个阶段是最初的一个阶段。

  第二阶段:预处理

  被存入数据库的文件会被索引程序处理加工,要作的工作有:文字提取,中文分词,索引编制等。有点像编写书本一样,什么内容放在那里,怎么放,前后顺序如何安排等。索引分为正向索引和反向(倒序)索引。其中正向索引就简称索引。经过文字提取,分词,消噪,去重后,搜索引擎得到的是独特的,能反映页面主要内容的的,以词为单位的内容。接下来搜索引擎索引程序可以提取关键词,按照分词程序划分好的词,把页面转化为一个关键词词组成的集合,同时记录每个一个关键词在页面上出现的位置,频率,H标签,锚文本等,包括网页的权重等都记录下来。然后,索引程序将页面以及关键词形成词表结构存储进索引库。

  但是,正向索引库还不能参与排名工作,因此就要用到倒序索引。(倒序索引这里就不细说了)

  第三阶段:排名

  本阶段是搜索引擎排名的最后阶段。经过搜索引擎抓取程序对网页抓取,然后,索引,当用户在搜索框输入关键词时排名程序经过处理就给出合适的搜索结果页面。整个搜索引擎工作原理基本就是这样。

  对于SEO工作人员来说掌握了这些基本的搜索引擎优化原理其实已经够用了,当然,你也可以更深入的研究。只是,搜索引擎优化的重点还是内容。因为,搜索引擎不会理会你和我,他更在乎的是他的搜索用户,如果,谁能给用户最有价值的内容,自然,谁的排名就越好。

目前留言:2   其中:访客:2   博主:0

  1. semwhat

    貌似大家都只关心排名哈。

  2. 中国品牌

    不错的内容

评论加载中...

给我留言

图片 表情