点击这里给我发消息 客户专员
点击这里给我发消息 客户专员
客服电话:021-31126365
值班电话:021-31126365
您现在所在的位置 :主页 > 文章资讯 > 网站优化技术 >

智能搜索引擎的Web挖掘技术

时间:2015-01-10 18:52  来源:网站优化  作者:www.websitemgt.com  点击:
智能搜索引擎的Web挖掘技术。
智能搜索引擎的Web挖掘技术
 
智能搜索引擎的Web挖掘技术
 
数据挖掘,也称为数据库中的知识发现KDD,是近几年来随着数据库和人工智能发展起来的一门新兴的数据库技术,帮助人们从庞大的目标数据集合中抽出可信的、新颖的、有效的并被人们理解的知识。互联网是一个巨大的信息资源库,其分布广泛,涉及诸多信服务,并包含丰富的超链接信息和Web页面使用访问信息,结合机器学习的方法,合理地地对这些信息进行挖掘建立用户规则库和信息资源知识库,可以为搜索引擎提供智能化的信息服务提供保证。
Web内容挖掘对搜索器收集的Web页面中的文本进行适当的分析解释,避免传统搜索引擎分析方法的简单化,结合索引器建立更加精确的Web文档索引库。为了有效地进行Web文档挖掘,必须解决好文档的表示问题,实现文本的自动分类和检索结果的联机聚类,文本的自动分类可称之为有导师学习,基于一组预先分类好的文档,对新收集的Web文档加以分类,从而建立更加精确的分类索引数据库,便于用户检索。常用的自动分类法有朴素贝叶斯分类和K-最临近分类等。检索结果从某种角度讲可算是大量返回信息组成的Web文档,通过对检索结果文档集合进行聚类,使与用户检索需求相关的文档聚类较近并提交这样的结果给用户。
Web行为挖掘是通过对用户以往使用搜索引擎的日志文件(包括检索时间、检索词、路径以及检索中浏览的检索结果)进行分析,总结出用户检索行为的模式,实现智能性信息过滤,个性化和主动信息服务。
(责任编辑:admin)

锐虎网络--专业网络营销服务提供商
本文由上海网站优化公司-锐虎网络版权所有,未经批准转载必究。