随着互联网上信息的快速增长,用户越来越难以找到传统搜索引擎感兴趣的信息。此,本文个性化搜索引擎元仅具有分组功能,获取系统用户注册的用户数据和不同用户组的所有用户形成用户模式集群生成疾病,引擎用户模式编程模块搜索选择适当的搜索引擎以安排自定义搜索结果,然后对检索到的结果进行分组以将个性化结果返回给用户。析了具有分组功能的自定义元搜索引擎系统结构,详细介绍了各个模块的功能,并对其发展前景进行了展望。键词:信息检索,元搜索,聚类,个性化中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)34-1581-02Design定制的元搜索引擎基于ClusteringCHEN菊-Hong (西南交通大学信息科学与技术学院,四川成都610031)摘要:随着在线信息的快速发展,用户越来越难以搜索信息他们的兴趣,传统的搜索引擎不能1.搜索引擎调度系统按自定义用户类型选择搜索引擎的类型,以获得自定义的搜索结果,然后集群处理和显示搜索引擎。终结果。
文介绍了Omable搜索引擎,详细介绍了各个模块的功能和技术发展。文最后讨论了该搜索引擎的视角。键词:信息检索,元搜索引擎,自定义分组型号说明随着Internet / Intranet的迅猛发展,互联网上的信息处理/内联网将日益成为人们关注的话题[1]。对在线资源的快速增长,用户正在寻找存在重大困难的信息,包括:1)接收信息过载:收到或已下载的数据难以消化,导致用户访问大量不相关信息的请求经常存在2)信息的魅力:用户不知道有必要确切地知道他们在线资源是什么真的很想要。
前,搜索引擎是用户在互联网上获取信息的主要工具,但目前单个搜索引擎的覆盖范围有限。统计,搜索引擎索引的网页不是页面总数的三分之一,但复苏,沙滩,算法等的不同机制还因为,导致请求相同的结果查询搜索引擎的另一个重复频率相对较弱。据艾瑞咨询调查[2]的最新调查结果,在中国搜索引擎用户不满意的因素中,搜索结果不佳和搜索结果过于复杂的比例分别为43%和37%。索引擎获得非常大的结果,并且通常会返回数千个正常查询结果。如,在Google中搜索“数据挖掘”会生成1,850,000个结果,但结果是一个线性列表。),相关信息和无关信息混合在一起。户必须逐个浏览搜索结果,因此找到他们真正需要的信息就像在大海捞针中找到针一样困难。解决上述问题,提出的设计框架定制元搜索引擎功能与分组,用户使搜索请求由元搜索引擎处理,转换为多个搜索引擎单独搜索以及搜索结果在处理后返回给用户。个系统的关键是对用户个人模板和搜索结果使用Cluster Analysis来训练不同的用户组,并为不同的用户返回个性化搜索结果。索引擎元元搜索引擎[3]建立在搜索引擎搜索引擎的基础上,它通过界面向更多成员发送查询,调用搜索引擎返回的搜索结果的成员搜索,而无需提前建立和维护自己的庞大数据库。索元引擎通常包含三个组件:用户界面,查询分发器和结果集成器。些流程之间的关系如下图所示:根据箭头的方向,处理用户请求时搜索引擎的处理流程是可见的。1元搜索引擎结构图用户界面:负责提供统一的查询界面和结果显示界面。找用户友好的界面,简单的使用,以符合人们的使用和思维习惯。询分配:如果成员数量较少的搜索引擎没有规划引擎元素,则模块直接将用户的搜索查询格式转换为每个成员,可以由搜索引擎识别,很多搜索引擎,如果成员引擎的不同成员数量覆盖一个非常不同的域,那么模块负责以每个成员搜索引擎的格式规划用户的搜索请求可以识别,以及规划成员搜索引擎。果合并器:在搜索引擎结果页面制作和结构分析的负责的成员,结果集检索,并且将结果集进行二次加工,例如去掉重复的结果,结果集成,重新排序和处理的搜索结果显示给用户。面的三个模块是元搜索引擎不可或缺的一部分,但您也可以在这些模块的基础知识中添加新模块以执行特殊功能。
统架构和功能介绍系统架构的该系统旨在克服搜索引擎的弱点traditionnels.Selon现有搜索引擎[4],充分考虑的需要定制和便利性方面,并结合技术代理和数据挖掘。用技术设计。系统结构如图2所示。统功能概述用户模式生成模块用户模式生成模块负责用户与系统之间的交互,提交关键字用户的请求并生成用户的兴趣模型。模块可以分析用户的注册信息并对用户组进行聚类以形成新的兴趣数据库。以通过利用用户的使用日志和用户的评论来更新兴趣数据库。需要登录以在输入和输出界面上输入他们的查询之后,将从用户的兴趣信息数据库中选择用户感兴趣的用户模式。户,然后发送到模块以检索下一层。式生成用户模块具有一定的学习和响应能力,它是由用户提出的问题和用户不断访问分析结果和培训所要求的,这样用户可以更好地模型化应该改变用户的动态需求。着用户的持续使用,可以获得更准确的用户兴趣模型和一些适用的体验,这对于定制搜索信息非常有用。复模块恢复模块主要包括两个模块和数据库:搜索引擎规划模块,查询格式转换模块和搜索引擎知识库。索引擎调度模块存储搜索引擎调度算法,并根据该算法在搜索引擎知识库中搜索适当的引擎。求格式转换模块将请求的要求转换为搜索引擎可识别的搜索格式。识库存储各种搜索引擎的搜索条件和搜索格式,包括搜索主题的划分,某些主题的搜索速度,准确度和召回率,以及搜索速率。复权威页面。果每个搜索引擎的结果处理模块的处理模块返回搜索结果进行处理,包括将文本数据转换为相应的结果格式,处理搜索结果的整合,删除不相关的页面,冗余,冗余和冗余删除然后对数据进行分组,并根据用户的兴趣模式对类的结果进行排序。果最终以统一格式返回到输入和输出接口。时,搜索引擎的评估模式提取在获得的搜索引擎的提取情况下的有用数据项,以更新搜索引擎的知识库。
划系统执行搜索引擎搜索元数据库和用户计算的关键规划技术:)查询引擎查询q相关性rel(q,di)其中dd表示数据库引擎成员; q表示用户请求; sim(q,Si(Di))表示查询相似度q的近似合成熵数据库(其中twij表示在所有数据库的权重中取得的第i个数据库中的tj) tj按重量比; distj表示查询项tj和其他术语区分的能力),PC(Di)是用户偏好数据库权重Di的权重,m是总数(点击(用户点击平均值)k的请求(电机单元Di)。后,根据相关程度对成员引擎进行排序;)为用户查询服务选择上层成员引擎(通常为3到10)。询格式转换策略在确定要由搜索元搜索引擎调用的成员搜索引擎之后,我们必须将用户的查询条目转换为每个成员搜索引擎的查询语法,将其发送给每个成员搜索引擎。1显示了几个已知搜索引擎的查询语法:%searchkeywords%是输入的查询关键字。
果要添加新成员搜索引擎,只需在成员搜索引擎中输入查询关键字,搜索它,然后根据搜索引擎中指定的地址获取新搜索引擎的查询语法。址栏。(下转第1611页)分组查询结果本文使用相关的组合方法,使搜索引擎返回的结果进行初步分组,然后分析了不同类型和用户查询请求之间的相关性类的分类,然后计算。

级中每个结果与用户兴趣模型的相关性,并根据相关程度对班级中的结果进行排序。本步骤如下:对每个搜索引擎的查询结果进行分组,形成查询结果的自动分类。本分组基于“分组假设”,这是一种无监督的文本分类,它将一组文本划分为多个称为分组的子集,每个组中的文本之间具有更大的相似性。且组之间的文本具有很小的相似性。本文中,我们使用模糊c均值分类算法,这是聚类分析中最流行的算法之一。将聚类问题归因于非线性规划问题,
宁波seo并使用替代优化策略来解决无监督分类问题并获得满意的结果。
类算法描述如下:步骤1:获取初始类的总数c,然后使用K-means聚类方法获得初始聚类。骤2:计算Ç聚类中心Cl,I = 1,...,C,使用公式步骤3:根据公式(其中为uij是0和1之间是集群中心模糊组I,DIJ = || || XJ下面是群集的所述第一中心和数据点j个欧氏距离和m∈[1,∞)之间的关系是一个加权指数。)计算值函数。果它低于某个阈值或者其相对于最后一个值的值低于某个阈值,则算法停止。骤4:计算新的U矩阵。回步骤2.分析用户的不同类型和查询之间的相关性,并根据类别的相关性确定类的顺序。确定每个类之后,有必要计算类的每个结果与用户的兴趣模型之间的相关性,并根据相关程度对类中的结果进行排序。)将最相关的类中的结果返回给用户。
用最后一种语言引入分组功能的自定义元搜索引擎改进了传统的搜索引擎:捆绑技术和智能技术应用于搜索元引擎,不仅提高了搜索引擎的准确性。索引擎。查全价,并根据用户的兴趣定制返回的结果,这提高了返回结果的准确性和可用性。而言之,该模型更好地考虑了用户的个性化,可以探索用户想要表达的查询要求并具有一定的智能。文将继续探索增强用户兴趣模型和分类算法,以提高系统的运行效率。
本文转载自
宁波seowww.leseo.net
补充词条:
宁波seo哪家好
宁波seo网站优化
宁波网站seo
宁波谷歌优化
宁波seo优化公司