宁波seo优化专栏

多元搜索引擎的现状及其典型体系的介绍

发布时间:2018-12-16 22:55:39
  摘要:本文介绍了查找引擎开展过程中出现的一种新技能——多元查找引擎。剖析了多元查找引擎的现状,并对典型的多元查找引擎系统进行了介绍。一起提出了多元查找引擎开展过程中有待改善的一面。
  关键词:查找引擎;多元查找引擎;典型系统
  中图分类号:TP393文献标识码:A文章编号:1009-3044(2007)05-11218-02
  1导言
  查找引擎是敞开网络常识殿堂的钥匙,获取常识信息的东西。随着网络技能的飞速开展,查找技能的日臻完善,中外查找引擎己广为人们熟知和运用。任何查找引擎的设计均有其特定的数据库索引规模、独特的功用和运用方法,以及预期的用户群指向。一种查找引擎不可能满意一切人或一个人一切的检索需求。在某些情况下,如文献查找、专题查询、图画、软件、音乐及视频下载地址查找等等,人们往往需求运用多种查找引擎,对查找成果进行比较、挑选和相互印证。为了有效地运用这些查找引擎,用户必须对各个查找引擎的查询方法以及该查找引擎的位置与检索规模比较熟悉,这无疑给用户带来了负担。多元查找引擎的出现为用户供给了有效的解决方法。它被认为是查找引擎开展的一个重要方向。
  2多元查找引擎概述
  所谓“多元查找引擎”(METASEARCHENGINE)是指调用其它独立查找引擎数据的查找引擎,它们一般没有自己的网络机器人,也没有自己的网页数据库。“多元查找引擎”经过将其它查找引擎的查找成果进行整合、调用、操控和优化,然后构成自身的查找成果。
  它的基本思想是:当接纳到来自用户的查询后,主动将查询恳求一起发送给多个查找引擎,并将查询成果收集起来进行处理,终究以一致的格局在同一界面集中显示给用户。多元查找引擎具有查询多个数据库的优势,用户能够只经过一次查询就得到更完好的信息,无需为了查全某一主题的信息,而在若干个独立查找引擎之间来回切换,也不要适应不同查找引擎不同的查询技能和方法等。
  一般,一个多元查找引擎由三部分组成:检索恳求提交机制、检索接口代理机制、检索成果显示机制。“恳求提交”负责完成用户“个性化”的检索设置要求,包含调用哪些查找引擎、检索时间约束、成果数量约束等。“接口代理”负责将用户的检索恳求“翻译”成满意不同查找引擎“本地化”要求的格局。“成果显示”负责一切源查找引擎检索成果的去重、合并、输出处理等。当然,现在有不少多元查找引擎并不完全具备以上三点。
  多元查找引擎分为并行处理式和串行处理式两大类。并行处理式元查找引擎将用户的查询恳求一起转送给它调用链接的多个独立型查找引擎进行查询处理,串行处理式元查找引擎将用户的查询恳求顺次转送给它调用链接的每一个独立型查找引擎进行查询处理。两种方法比较,串行处理准确性高,但速度慢;并行处理速度快,但准确性低,有较多的重复内容。
  3多元查找引擎现状
  运用Google、百度和查找多元查找引擎实例的网页,并经过一些著名的引擎攻略网站所供给的线索来断定有代表性的多元查找引擎,然后对所找出来的引擎进行了测验,现作扼要的介绍。
  3.1在国外多元查找引擎已经十分广泛,而且构成了自己的商业模式。
  SavvySearch:http://www.savvysearch.com/,可调用200多个查找引擎或攻略,内容涵盖新闻、共享软件、Usenet等27个主题范畴,一次可并行调用5个查找引擎,也能够作为一个专用查找引擎的导航东西运用。简略的查找界面答应用户挑选查找类目,支撑And和短语检索类型。最具特征的是其个性化检索设置效劳,用户有时机从100多个查找东西中挑选调用并指定重要性系数(First,Middle,Last),建立自己的查找模型。用户可挑选显示查找引擎的一切查找成果,默认值是每个查找引擎回来20个射中记载,并以相关度摆放输出。SavvySearch一起供给包含中文在内的23种语言版本,但其高档功用只适用于英文版。
  MetaCrawler:http://www.metacrawler.com/,是Go2Net的一个组成部分,是公认的功用强大的并行式多元查找引擎。第一个元查找引擎,是1995年由美国Washington大学硕士生EricSelberg和OrenEtzioni的Metacrawler合作研发。具有一起调用Google、Yahoo、AskJeevesAbout、LookSmart、TeomaOverture、FindWhat等查找引擎的功用,然后按相关度给出精确,详细的成果。它能够对网页、图画、音频、多媒体、新闻、购物等进行挑选检索。其检索特性十分丰厚,包含常规检索、高档检索、定制检索、国家或地区的资源检索等检索效劳模式。Metacrawler是一种运用关键词进行检索的查找引擎。查询信息的种类首要包含WWW,Files,Newsgroups。它的查询语法支撑“anywords"、"allwords”的“asaphrase”等。为了进步查询成果的专指度,能够用布尔逻辑算符“十”、“一”对查询成果的规模加以约束。查询的成果包含文档的标题、相关系数、摘要、文档的地址(URL)以及发送查询成果的独立查找引擎的名称。别的,检索成果中包含一个以1000为最大值的相关度目标。
  Vivisimo:http://vivisimo.com/,2000年1月由卡耐基梅隆大学的几个科技人员创立,2001年,2002年和2003年连续3年被美国专业查找引擎咨询网站(www.searchenginewatch.com)评为年度最佳多元查找引擎。Viviaim特别擅长于文本安排和文本主动聚类技能,自称为“elusteringengine”并且由于回来成果受竞价排名等商业因素影响十分小而深受好评。
  Dogpile:http://www.dogpile.com/,是最早、最受欢迎的多元查找引擎之一,曾被SearchEngineWatch评为2000年度最佳多元查找引擎。它能够调用14个www引擎(包含主题目录),和11个usenetnews,mailinglists,ftp等引擎,共计25个查找引擎。现在包含Google、Yahoo!Search、Ask.com、MSNSearch等著名的查找引擎。Dogpile界面简练明了,选用并行的查询方法:首要并行地调用3个查找引擎,假如没有得到10个以上的成果则并行地调用别的3个查找引擎,如此反复。可设最大查询时间,免费供给用户在自己的主页上加入Dogpile查询东西。能够挑选运用那些独立的查找引擎,可运用模糊和布尔检索,成果按来源顺序列出。
  ByteSearch:http://www.bytesearch.com/,是一个检索界面极端简练、以检索速度著称的多元查找引擎。其查找搜盖规模比较广泛,包含Web、城市信息、公司名录、域名、FTP网站、多媒体、新闻组、包裹盯梢等,并供给新闻阅读、URL提交、最新的20个检索阅读、联机商店等内容方面的效劳。针对不同的资源类型,用户可挑选完全匹配(All),部分匹配(Any)、短语检索(Phrase)等特性检索功用。检索成果经去重处理后,以相关性排序,一次显示15条记载,显示内容包含网页名称、URL、文摘、源查找引擎。最大的缺点是,没有供给源独立查找引擎列表,用户不能操控源查找引擎的挑选。
  Mamma:http://www.mamma.com/,1996年面世,自称为“查找引擎之母”的并行多元查找引擎,能够调用8个www查找引擎,可一起调用7个最常用的独立查找引擎,并且可查询新闻组、图画、商业黄页等资源。其特点是检索界面友爱,检索选项丰厚,首要包含:可操控调用的独立查找引擎、挑选运用短语检索功用、设定检索时间、设定每页可显示记载数等。
  3.2国内的多元查找引擎现在尚处于起步阶段。
  技能比较先进的有北京赛得在线信息技能有限公司的soaso多元查找:http://www.soaso.com,它调用了GOOGLE中文、百度、慧聪和天网的数据。
  万纬查找:http://www.widewaysearch.com/,它是现在为数不多的中文元查找引擎中比较优异的一个,但与国外同类产品比较还有不足之处。
  2005年8月推出的常识查找:http://www.zhihere.com/search/,首要用作学习东西。
  一家搜:http://www.ejear.com/,2005年11月发布测验版,2006年6月更新了查找源成果的获取规则;选用多线程获取成果;加入了超时约束;升级后进步了获取成果的速度,但有时因超时会丢掉某一个源的成果。
  Bbmao元查找:http://www.bbmao.com,Bbmao在2006年2月发布了我国首家聚类元查找引擎。Bbmao新推出的社会化查找将继续带给用户领先及创新的效劳。是国内唯一具有主动聚类功用的元查找引擎,技能和功用上都比较强,除了元查找,还供给网摘的查找功用,是一个值得继续关注的元查找引擎。2006年2月份改版,新增求职查找。
  狠搜:http://www.hensou.com/,能够定制源查找引擎,一起供给商业信息查找,中心功用上一般。
  3.3多元查找引擎有待改善的几个方面
  现在运营的多元查找引擎各具特征,宁波seo优化功用各有偏重,一些多元查找引擎在某些方面较为优异,而其它功用则欠缺或需改善。归纳起来有以下几点有待进步:
  进步检索功能。多元查找引擎完成检索语法转化的能力是有限的,而且高档检索模式常常只是注册或定制检索中的一部分,更适用于单用户计算机环境。别的,由于多元查找引擎不支撑指定字段检索等特别检索特性,不能发挥各个独立查找引擎的高档检索特征,影响了检索作用和质量。
  进步调用查找引擎的数量。大部分多元查找引擎只支撑调用A1taVista,Excite,GoTo.com,Yahoo,Infoseek,Lycos等首要的查找引擎,有许多大型查找引擎被排除在外。如大部分元查找引擎不包含NorthernLight,HotBot等,影响了信息查找的覆盖面。
  进步检索成果的数量。检索速度的约束从一个旁边面反映出了多元查找引擎在检索成果的数量上的局限性,也就是意味着只能从各个独立的查找引擎中检索少数的最符合要求的射中记载,一般约束在10~50个之间,因此必然影响了检索成果的全面性。
  进步多种语言的检索。2000年7月,Excite公司的科学家对全球的Internet网页进行了语言认证,发现其中英文信息内容占了71%,而日文是6.82%、德文是5.08%、法文是1.75%、中文则为1.52%。现在大多数国外多元查找引擎只支撑英语,对于汉语、法语、日语等语种却不能很好地支撑,有些引擎虽有支撑上述语言的,但回来的成果却令用户绝望。对于我们国内用户来说是很难体验到多元查找引擎的优越性的。
  调整查找引擎的局限性。从完成机制来看,多数引擎的灵活性不行:添加查找引擎和增加并行度都十分困难;因为多元查找引擎的根底是其他查找引擎,当选入的引擎发生改动时,往往会给系统带来很大的影响,甚至不能正常工作。
  4结束语
  处于起步阶段的国内“多元查找引擎”,还有许多问题需求解决,可是随着查找引擎商场的开展,它们一定会谋得自己的一席之地。
  参考文献:
  [1]陈大平.集成查找引擎与元查找引擎比较研讨[J].大学图书情报学刊,2005,(2).
  [2]黄于蓝,洪,端颐,惠波.查找引擎技能的新开展——多元查找引擎系统[J].计算机工程,2002,(1).
  [3]葛驰.中文元查找引擎万纬查找探讨[J].情报检索,2005,(4).
  [4]刘丽.元查找引擎成果显示方法研讨[J].情报检索,2005,(6).
  [5]刘畅,林剑锋,王雁杰.元查找引擎的查询剖析[J].现代图书情报技能,2004,(9).
  [6]Ixquick的特征.http://us.ixquick.com/jia/what_makes_ixquick
  _special.html#accurate
  [7]2000年元查找引擎.9238引荐奖—ProFusion.http://www.se-express.com/9238/se06.htm
  [8]Bbmao再掀查找浪潮其社会化查找获得重大突破.http://games.sina.com.cn/y/n/2006-06-09/1458154611.shtml.
  [9]《查找引擎观察》2002年最佳元查找引擎,http://chinait.com.cn/blogs/chinait/.
  本文中所涉及到的图表、注解、公式等内容请以PDF格局阅读原文。
  本文转载自
  宁波seo优化www.leseo.net
  补充词条:宁波seo推广公司  宁波谷歌优化  宁波seo外包  宁波谷歌seo  宁波seo排名