宁波seo优化专栏

一种改善的综合Borda元搜索引擎结果排序算法

发布时间:2018-11-30 23:07:32
  摘 要:在传统的元查找引擎中选用了Borda排序算法,即依据成员引擎检索成果的相关方位赋予必定分值,求和后按总分递减排序。这对各个成员引擎检索成果堆叠度较高的检索排序非常有效,但对独立的查找成果作用不好,速度较慢。另有依据检索字符串和检索成果的标题、摘要等类似度进行排序,这种排序快速,实现简略,但回来的信息简略,或许导致摘要信息多的排在前面,而不是内容相关的高的排在前面。针对这两种算法的不足,提出了一种改善的归纳Borda排序算法,核算检索字符串和成果标题、摘要的类似度,再把类似度作为相关分值进行排序,它归纳了两种算法。试验成果表明,他的查准率优于传统的Borda算法。
  关键词:元查找;摘要排序;类似度核算;Borda算法
  中图分类号:TP391.3
  元查找引擎是包含了多个查找引擎的特殊查找引擎。用户输入查询恳求后,元查找引擎向各个成员查找引擎并行发送检索恳求,检索完成后,检索成果通过去重排序处理后回来给用户。将多个查找引擎的成果放到一同,这样可以扩展检索范围,提高查全率。可是要将这么海量的数据交融到一同,这就需求一个较好的排序算法,才能够把用户最想要的成果展示在前面。因此,排序算法是影响元查找引擎性能的关键技能之一。
  1 传统Borda排序算法
  Borda排序算法首要对成员查找引擎的查找成果依据方位联系赋予必定的相关分值,检索成果方位越靠前,它的相关分值越大,反之,它的相关分值越小。实际过程如下描述如下:
  2 对Borda排序算法的改善
  传统Borda排序算法的关键是依据检索成果在各个查找引擎的相关分值的总和进行降序摆放,关于多个查找引擎检索到的成果都能排在前面。试验表明,只要查询成果堆叠率较高,Borda排序算法的查准率就比较高。但关于独立的查找成果排序处理不太好,特别是独立查找成果较多的情况下,许多检索成果的相关分值都是相同的,Borda排序算法是选用随机摆放的,这与实际用户希望成果有必定的误差,导致排在前面却未必是用户最需求的成果信息。基于此,咱们提出了一种改善的Borda排序算法,核心思维是引进检索字符串与检索成果的标题、摘要的类似度。并将类似度作为检索成果的相关分值。
  3 类似度的核算
  类似度是指检索字符串与检索成果之间的关联程度。类似度的核算方法有许多种,因为检索成果 主要是由网址,标题,摘要,内容组成。咱们选用核算检索字符串和标题、摘要之间的类似度。最终依据相关分值的大小进行排序。
  咱们选用的频率核算来核算类似度,先核算检索字符串p与成果标题ri之间的类似度,关于检索字符串中词条pj,有pj和ri的类似度
  5 结束语
  现在,查找引擎的技能现已日趋成熟,在查全率和查准率都有很大的提高,可是元查找引擎在这些方面更具优势。本文提出的改善算法提高了查全率和查准率。信任未来是结合多种算法的排序是元查找引擎的未来的发展趋势。
  参考文献:
  [1]shifu Zheng,ting Liu,Bing Qin.Overview of Question-Answering.Journal of Chinese Information Processing.Vol 6,No.16,pp.46-52,June.2002.
  [2]Dell Zhang,Wee sun Lee.A Web-based Question Answering system[A].In:Proceedings of the sMA Annual symposium 2003[C],Nus,Singapore,Jan 2003.
  [3]lemal H.Abawajy and M.1.Hu,school of Information technology,Deakin university,Geelong,Victoria 3217 Australia——A New Internet Meta-search Engine and Implementation.
  [4]Hongmei Li,Zhenguo Ding,shuisheng Zhou,Lihua Zhou.simearch on simults Merging in Meta search Engine.Vo1.3I,No.s,pp:78-81,Oct 2008.
  [5]万保.元查找引擎关键技能研讨[D].西北工业大学,2007.
  [6]曹林,韩立新,吴胜利.元查找引擎排序技能总述[J].核算机使用研讨,2009(02).
  [7]郭海风,曹林.元查找引擎中Borda算法的改善[J].核算机工程,2011(01).
  [8]董乐,谢红薇.元查找引擎中排序交融算法的优化研讨[J].核算机使用与软件,2012(10).
  [9]周小平,梁一平,邓左祥.元查找引擎研讨[C].2009年中国高校通讯类院系学术研讨会论文集,2009.
  [10]王晓艳,刘春双,刘光华.经典查找引擎排序算法的比较和剖析[J].产业与科技论坛,2012(24).
  [11]杨春明,何天翔.元查找引擎的成果去重及排序研讨[J].软件,2012(06).
  [12]林欣,温传林,韩立新.一种元查找主题偏好的排序算法[J].核算机技能与发展,2013(02).
  作者简介:李兵(1991-),宁波seo优化男,湖南祁阳人,在校学生,软件工程专业,本科,主要研讨方向:Web开发技能。
  作者单位:吉首大学 软件服务外包学院,湖南张家界 427000
  基金项目:大学生研讨性学习和立异性试验计划项目(JSU-CX-2012-54)。
  本文转载自
  宁波seo优化www.leseo.net
  补充词条:宁波网站seo优化  宁波seo排名  宁波seo哪家好  宁波seo网站优化  宁波谷歌优化