点击这里给我发消息 客户专员
点击这里给我发消息 客户专员
客服电话:021-31126365
值班电话:021-31126365
您现在所在的位置 :主页 > 文章资讯 > 网站优化技术 >

搜索引擎的原理

时间:2014-12-21 17:26  来源:网站优化  作者:www.websitemgt.com  点击:
搜索引擎的原理分析。
搜索引擎的原理
 
网站优化公司想要做好客户网站的关键词排名就必须了解搜索引擎的原理。搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。在搜索引擎的后台,有一些用于搜集网页信息的程序。所收集的信息一般是能表明网站内容(包括网页本身、网页的URL地址、构成网页的代码以及进出网页的连接)的关键词或者短语。接着将这些信息的索引存放到数据库中。搜索引擎的系统架构和运行方式吸收了信息检索系统设计中许多有价值的经验,也针对万维网数据和用户的特点进行了许多修改,如右图所示的搜索引擎系统架构。其核心的文档处理和查询处理过程与传统信息检索系统的运行原理基本类似,但其所处理的数据对象即万维网数据的繁杂特性决定了搜索引擎系统必须进行系统结构的调整,以适应处理数据和用户查询的需要。 
搜索引擎原理大致可以分为4步:从互联网上抓取网页、建立索引数据库、在索引数据中搜索排序、对搜索结果进行处理和排序。
 
搜索引擎的原理图
 
1.从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其他网页,重复这过程,并把爬过的所有网页收集回来。
2.建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其他网页的链接系等),根据一定的相关度算法进行大量复杂计算,得到每一-个网贞针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
3.在索引数据库中搜索排序
在搜索引擎原理第三步,当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早巳计算好,所以只需按照现成相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地和页面内容摘要等内容组织起来返回给用户。
4.对搜索结果进行处理和排序
所有相关网页针对该关键词的相关信息在索引库中都有记录,只需综合相关信息和网级别形成相关度数值,然后进行排序,相关度越高,排名越靠前。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

以上只是搜索引擎原理的浅析,实际要高深的多,锐虎网站优化公司的搜索引擎工程师今天就分析到这里。

 
(责任编辑:admin)

锐虎网络--专业网络营销服务提供商