宁波seo优化专栏

宁波seo优化:Web元搜索引擎排序算法分析

发布时间:2019-01-31 00:19:10

  [摘要]排序是实现元搜索引擎的关键技术,它与排序算法的质量直接相关。文首先介绍了元搜索引擎的概念和搜索过程,然后总结了元搜索引擎常用的排序算法,然后提出了对元引擎排序算法的改进。
  究。术观点。键词:元搜索引擎;排序算法;算法评估中图分类号:F49文献标识码:增加日期:2012年1月4日I.前言根据研究报告,互联网上的信息量显示出一种爆炸性的趋势。联网上有超过数百亿的网页。

宁波seo优化:Web元搜索引擎排序算法分析_no.73

  您需要的大量信息中查找所需信息已成为人们最重要的事情。索引擎是一种有效的信息搜索工具,旨在帮助用户解决这个问题,这已经成为互联网最重要的部分。是,目前没有可以覆盖整个网络的独立搜索引擎。于不同的机制,算法和应用领域,不同搜索引擎中相同搜索请求获得的查询结果的重复率小于34%。个搜索引擎的准确率低于45%。此,为了获得更完整和准确的结果,有必要同时使用具有不同数据搜索范围的搜索引擎来在几个搜索结果列表之间选择有用的内容,这会增加研究的缺点。Web元搜索引擎的出现在一定程度上解决了这些问题。搜索引擎Web是一个集成了多个搜索引擎的特殊搜索引擎。旦用户输入了请求,系统就会将查询词发送给成员搜索引擎,后者开始搜索。索完成后,系统会收集每个部分的结果,并根据某种排序将它们返回给用户。合多个搜索引擎的搜索结果,增加搜索范围,提高查询率。而,面对如此大量的结果数据,系统本身必须提供更合适的排序算法,以在第一页上显示用户最期望的结果。
  此,排序算法是影响元搜索引擎性能的关键技术之一。次,通过统一的用户界面在Web搜索引擎中搜索Web搜索引擎(称为元搜索),帮助用户选择和使用相应的搜索引擎在多个引擎中执行恢复操作研究通过网络分发。复工具的整体控制机制。索过程如图1所示。图1)可以看出,首先,用户通过统一的界面输入查询词,并且作业调度员将搜索词分配给多个适当的独立搜索引擎;在接收到查询词后,每个独立搜索引擎立即发出相关的文件请求。果文件按相关性排序,然后返回到结果集成中心:结果集成中心收到独立搜索引擎返回的结果文件序列后,所有结果根据某种排序算法进行总结。

宁波seo优化:Web元搜索引擎排序算法分析_no.118

  新排列并将一系列结果文件发送给用户。此期间,用户的问题被不同地转换为不同的独立搜索引擎以适应相应的索引数据库调用;应该强调的是,元搜索是基于独立搜索引擎结果的二次处理,并且元搜索引擎结果基于独立性。
  索引擎查询结果,几个简单的直接调用原始结果页面,但这允许二次处理独立搜索引擎查询结果,如删除重复结果,重新排序结果。自定义结果表单的元搜索引擎中,搜索结果通常指示记录的源搜索引擎及其相关性。Web搜索引擎的排序机制Web搜索引擎排序包括收集和重复删除被调用成员的几个搜索引擎返回的结果,然后按照一定的标准排序,然后显示结果按特定顺序排序。用户的过程。于调用成员的搜索引擎可以变化,所收集的查询结果的组成也是变化的,结果主要由网站(URL),网页标题,内容,相关性等摘要因此,取决于成员的搜索引擎的种类,可以在网页标题和内容概要方面考虑对搜索元搜索引擎进行排序。般来说,排序方法可以从以下三个方面来解释:1。考布局。搜索引擎直接提交的结果顺序,并显示来自不同来源的结果。方法不需要结果很重,只需要格式转换。简单易行。还可以帮助用户知道哪些搜索引擎无法提供,或者很少有关于他们所需信息的信息,然后可以在以后查询。您自己的发动机组合中删除。是这种方法也可能导致搜索引擎的无关结果在与搜索引擎相关的另一结果之前被排名,迫使用户错过重要信息。2.重组。种排序方法相对简单,就像将搜索结果合并到成员搜索引擎中并重新选择一种方法一样。种方法只能提高召回率,对于一些重要的信息,它可以排在较低的位置,难以被用户检索,准确度不高。期的元搜索引擎经常使用这种算法思想。于这种算法思想的方法主要包括直接合并,根据响应速度排序和按摘要排序。3.使用搜索引擎对信息进行排序。个成员搜索引擎返回的结果被重新排列在一起,破坏了原始搜索引擎的排序信息。些信息也是一个非常重要的分类基础。管用于对成员的搜索引擎进行排序的一些方法是未知的,但它们肯定是根据查询结果的相关程度和查询的条款来排序的,除了不同的搜索引擎关注不同的因素。果可以充分利用每个成员搜索引擎的排名信息并基于前述进一步合成,则可以进一步提高准确度。测方法,按星星排序,按Borda排序,按贝叶斯概率模型排序,按位置排序等。4.整合相关分数。关得分合并还涉及使用每个成员搜索引擎的排序信息。于给定查询,每个成员搜索引擎根据不同情况为其自己的搜索的所有结果分配一些相关性分数。于出现在多个搜索引擎中的相同结果,它们的相关分数被合并然后被分类。并相关分数的方法很多,其中梳融合方法(六种类型),SDM合并方法,MEM合并方法,CORINET排序等。最常见的。四,建议改进Web搜索引擎排序算法,因为目前的元搜索引擎开发技术不同,内部算法也存在显着差异,难以使用衡量和衡量研究结果优缺点的统一标准。是,对于元搜索引擎排序算法,改进方法主要体现在以下几个方面:1。接集成至少两种基本算法,这是一种比较常见的改进方法。
  置汇总/排名方法结合了汇总排序方法和排名排序方法。Ixquick和Metor元搜索元搜索结果排序方法基于相关度和星级评分索引排序算法。2.根据加权平均算法(WM)原则,权重归因于成员搜索引擎的不同性能,权重值与引用的搜索引擎的名称和数量相关联,可以突出显示成员搜索引擎之间的差异。权舍入方法,加权标准方法,加权梳组顺序等。是通过基于基本算法为搜索引擎分配权重而获得的。3.根据信息规则集的原则,首先确定成员搜索引擎中所有搜索结果的顺序,然后确定文件名和最终显示的总数。
  统按指定的文件名和文件数对每个文件进行计数。列位置的出现次数,然后系统按降序排列序列中每个文件的出现次数,最后,取决于搜索引擎的数量和聚合程度信息,信息集的规则用于计算每个位置的权重,权重乘以序列中排序文件(后代)的出现次数以获得最终的装配结果。
  降序排列每个文件的最终汇编结果,这是每个文件的元搜索引擎。
  后的订单。了确定成员搜索引擎搜索到的序列的每个位置中每个文件的权重,国内外有许多成熟的算法,如运算符OWA(加权阶平均值),量化器模糊语言,特别是规范。有单调增长的量词(RIM)。4.算法2和3的原理是集成的:首先,给每个元搜索引擎一定的权重,然后给最终结果文件序列的每个位置一定的权重。然,两个加权值和算法是不同的。后,使用定义的结算子原则,计算所有搜索元引擎中每个文件的最终汇编值,并按照集合值的降序对恢复结果文件进行排序,这对应于每个文件的元搜索引擎的最终顺序。于确定这两种加权类型的方法,国内外并没有很多成熟的算法,使用加权平均和加权算子(称为WOWA)的表现最佳。外,尽管目前有许多排序算法,随着新搜索引擎的出现,改进的搜索技术和外部环境的变化,作者认为它是有必要定期评估元搜索引擎的排名结果。乎速率。于召回率,由于搜索引擎元引擎是特殊搜索引擎,因此固定查询的结果来自成员搜索引擎。果,整体召回率由成员的搜索引擎决定;对于精确率,搜索引擎本身提供的排序算法是将结果与最大可能的相关性进行分类,即提高准确度,即:度量元搜索引擎的重要性能。此,为了允许用户尽可能快地检索最有用的文件信息,必须不断优化元搜索引擎技术和元搜索引擎排序算法。搜索引擎排序算法的展望今天,搜索引擎技术正变得越来越成熟,特别是在召回率和准确性以及执行速度方面。得到了显着改善。搜索引擎在中国仍然处于起步阶段,但它仍然有自己的生存优势,因为它结合了多个搜索引擎并具有很高的召回率,这在搜索引擎中是不可用的。他搜索引擎。而,由于不同搜索引擎的数量,范围和控制方法的差异,以及搜索引擎技术的隐藏,设计者很难获得他们的技术细节。于元搜索引擎,无论采用何种排序方法,这都不令人满意。际上,对于某个搜索引擎(已经确定了排序方法),不同的查询,其准确性和召回率都不同;对于相同的查询,不同的排序方法也会造成很大的差异。个问题的主要原因是信息重叠率的差异。
  胜利和麦克莱恩表示,当信息重叠率不同时,不同的排序算法会有很大差异。
  此,为了提高排序算法的元引擎的准确性和召回率,除了改进基本算法外,宁波seo优化还必须根据不同的查询选择不同的算法。业搜索引擎的出现可以作为元搜索引擎的参考,也就是说,专业搜索引擎可以集成到专业的元搜索引擎中,或者可以使用元搜索引擎。索引擎可以更聪明。
  户输入的查询字符串将自动排序,然后根据类别选择最佳排序方法。然,对于固定搜索元引擎,成员搜索引擎的技术细节也可以通过科学统计方法检测,虽然检测到的技术细节不是很精确,但它们可以在一定程度上反映成员的搜索引擎。术情况这些技术的结合提供了统一的排序方法来重新排列所有结果,这只能提高用户的满意度。"
  本文转载自
  宁波seo优化www.leseo.net
  补充词条:宁波谷歌seo  宁波seo哪家好  宁波seo推广公司  宁波网站优化推广  宁波seo优化公司