宁波seo优化专栏

搜索引擎个性化关键技术刍议

发布时间:2018-12-13 20:41:37
  摘要:现在,中文个性化查找引擎的开发现已越来越引起了国人的留意,尽管现在现已有了必定的根底,但它距离成为一个成熟的产品,道路还很漫长。本文从网络机器人、索引引擎、Web效劳器三个方面对查找引擎的“个性化”进行讨论。
  关键词:查找引擎;个性化;信息过滤
  中图分类号:TP391.3文献标识码:A文章编号:1007-9599(2011)13-0000-01
  KeyTechnologyDiscussiononSearchEnginePersonalized
  WangYulong1,2
  (1.WuweiCityPoliceWanganDetachment,Wuwei733000,China;2.LanzhouUniversityInstituteofInformation,Lanzhou730000,China)
  Abstract:Atpresent,Chinesepersonalizedsearchenginedevelopmenthasattractedmoreandmorepeoplesattention,althoughitisalreadyhadcertainbase,butitfrombecomingamatureproduct,theroadisstillverylong.Thisarticlefromthenetworkrobot,searchengine,WebServerthreeaspectsofthesearchengine"personalized"werediscussed.
  Keywords:Searchengine;Personalization;Informationfiltering
  一、查找引擎的组成
  一个查找引擎由查找器、索引器、检索器和用户接口等四个部分组成。
  (一)查找器。查找器的功用是在互联网中漫游,发现和收集信息。它常常是一个计算机程序,日夜不停地运转。它要尽可能多、尽可能快地收集各种类型的新信息,一起由于互联网上的信息更新很快,所以还要定时更新现已收集过的旧信息,以防止死衔接和无效衔接。
  (二)索引器。索引器的功用是了解查找器所查找的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。当数据量很大时,有必要完成即时索引,否则不能够跟上信息量急剧增加的速度。
  (三)检索器。检索器的功用是依据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的成果进行排序,并完成某种用户相关性反馈机制。
  (四)用户接口。用户接口的作用是输入用户查询、显现查询成果、供给用户相关性反馈机制。首要的目的是方便用户运用查找引擎,高功率、多方法地从查找引擎中得到有用、及时的信息。
  二、查找引擎的构成
  (一)网络机器人。网络机器人也称为“网络蜘蛛”(Spider),是一个功用很强的WEB扫描程序。它能够在扫描WEB页面的一起检索其内的超链接并参加扫描行列等待以后扫描。由于WEB中广泛运用超链接,所以一个Spider程序理论上能够访问整个WEB页面。
  (二)索引与查找。网络机器人将遍历得到的页面寄存在临时数据库中,如果经过SQL直接查询信息速度将会难以忍受。为了进步检索功率,需求建立索引,依照倒排文件的格式寄存,而且索引需求及时的更新。用户输入查找条件后查找程序将经过索引数据库进行检索然后把契合查询要求的数据库依照必定的战略进行分级摆放而且回来给用户。
  (三)Web效劳器。客户一般经过浏览器进行查询,这就需求体系供给Web效劳器而且与索引数据库进行衔接。客户在浏览器中输入查询条件,Web效劳器接收到客户的查询条件后在索引数据库中进行查询、摆放然后回来给客户端。
  三、查找引擎的分类
  结合互联网信息的特点形成了三个不同类型的查找引擎:全文检索查找引擎、目录查找引擎和元查找引擎。
  (一)全文检索查找引擎。是名副其实的查找引擎,例如:百度(http://www.Baidu.com)。它们都是经过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库,检索与用户查询条件匹配的相关记载,然后按必定的摆放次序将成果回来给用户,也是现在惯例意义上的查找引擎。
  (二)目录查找引擎。尽管有查找功用,但在严厉意义上算不上是真实的查找引擎,仅仅是按目录分类的网站链接列表而已。用户完全能够不用进行关键词查询,仅靠分类目录也可找到需求的信息。
  (三)元查找引擎。元查找引擎在接受用户查询恳求时,一起在其它多个引擎上进行查找,并将成果回来给用户。
  四、个性化查找引擎的关键技能
  (一)个性化信息效劳。个性化信息效劳首要包含两个方面的意义:一是信息效劳方法的个性化,即依据个人的喜好或特征进行效劳;二是信息效劳内容的个性化,宁波seo即让人们从个人的职业、爱好等方面取得信息。
  (二)Agent技能。所谓Agent,能够了解为是一个自包含的程序,能够操控自己的动作与决议计划,基于对自己所在环境的感知,寻求一个或多个方针。一般以为Agent具有如下特征:自主性、反应性、适应性、通讯才能、生存才能。
  1.自主性:是指Agent能够在没有人或其他Agent直接干预情况下持续运转,并能操控其自身的动作和内部状态。
  2.反应性:Agent能够感知外界环境,并对外界环境的变化当令做出反应。
  3.适应性:Agent具有学习才能,它不仅能够对外界环境变化做出反应,而且能够采用一种面向方针的行为。
  4.通讯才能:Agent能够经过某种Agent通讯言语(如KQML言语)与其他Agent进行交互。
  5.生存才能:Agent能适应其所在环境,并在必定时刻根底上进行自我调整。
  (三)信息过滤。信息过滤技能是完成个性化查找引擎的另一项关键技能。个性化查找引擎经过信息过滤技能,过滤出用户真实感爱好的信息。信息过滤体系首要包含3个基本的逻辑单元:信源、过滤器、用户。信源向过滤器供给信息及特征描述,过滤器依据用户爱好有选则地向用户递送信息,用户能够决议是否向过滤器发反馈信息指明他们的要求,使过滤器经过学习、调整,能够更好地供给契合用户个性化需求的信息。
  参考文献:
  [1]庄毅,黎浩宏.查找引擎开展现状及意向[J].计算机年代,2002,8
  [2]张晓刚,李明树.智能查找引擎技能的研讨与开展[J].计算机工程与应用,2001,24
  [3]陈建秋,邓飞其.智能化查找引擎分析与讨论[J].广州大学学报(自然科学版),2002,1:3
  [作者简介]王玉龙(1983-)男,甘肃武威人,武威市公安局网安支队科员,兰州大学信息学院08级工程硕士,研讨方向:计算机技能。
  本文转载自
  宁波seowww.leseo.net
  补充词条:宁波谷歌seo  宁波seo优化公司  宁波网站排名优化  宁波网站seo优化  宁波seo排名