宁波seo优化专栏

宁波seo:基于多代理的搜索引擎的设计和实现

发布时间:2019-03-03 00:20:31

  搜索引擎的出现改变了人们访问信息的方式,搜索引擎可以快速找到他们需要的信息,这是我们访问信息的有效方式。联网上的信息。而,随着互联网的发展和在线信息的激增,用户越来越难以准确,快速地找到他们所需的信息。据搜索引擎和代理技术,本文提出的智能搜索引擎基于多代理技术的概念,它可以有效地提高研究和服务的搜索引擎的质量,并提供了解决方案对当前搜索引擎中存在的一些问题有所了解。法关键词:搜索引擎,代理,智能功能,智能搜索中图分类号:TP18文献标识码:A文章编号:1009-3044(2010)05-1186-03Conception和搜索引擎在重建使用多镧AgentYU盛,唐旭荣(南南,长沙410083大学信息科学与工程学院,中国)摘要:搜索引擎的出现改变了人们如何获取信息。们可以快速找到所需的信息,但在互联网上有效,但随着互联网和网上信息泛滥的发展,人们越来越难以快速,准确地找到所需的信息。于搜索引擎,代理技术文章,提出了基于多代理技术的智能搜索引擎的概念,它可以有效地提高研究和客户服务的搜索引擎的质量,以解决当前搜索引擎遇到的问题数量。Nd有效方法。键词:搜索引擎;剂;情报功能;随着信息技术的进步和互联网的日益普及搜索信息,人承诺在本会带来真正的信息,比如报纸的信息史上的重大项目。纸,书籍,专利文件等所有这些都放在互联网上,并继续同时在互联网上生成无数的新信息。个网络变成了前所未有的极其庞大的数据库。他们尚未建立提供信息的有效方式。联网用户要求越来越多的信息,并且变得越来越不耐烦。

宁波seo:基于多代理的搜索引擎的设计和实现_no.132

  索引擎的出现改变了人们获取信息的方式,搜索引擎可以快速找到他们需要的信息。天,搜索引擎是最重要的互联网技术之一,由于其受欢迎程度和在线信息的快速增长而越来越受到关注。索引擎的出现,是在互联网上获得信息的有效途径,但随着互联网的发展,网上信息泛滥,用户觉得有必要迅速而准确地将他们所需要的信息。变得越来越困难。了进一步提高搜索引擎用户的搜索和服务质量[1],人们越来越倾向于将人工智能的结果引入搜索引擎。如AI近年来该领域的研究中心,智能代理技术被广泛使用,因为自主性,反应性,适应性和社会性[2-3]其特点。不仅可以对自己采取行动,还可以对环境采取行动。可以接受来自环境的反馈,重新评估其行为[4-6],同时与其他代理一起工作。理技术的出现为解决这些问题提供了一种新的有效方法。索引擎和代理技术搜索引擎技术是一种用于收集,分类和查询Internet上信息资源的系统,包括收集,排序和检索功能。
  疑用户。
  个好的搜索引擎系统也应该能够处理用户提交的搜索请求,并能够组织搜索结果并将其提交给用户。)搜索引擎分类:成千上万的网站可以提供搜索服务。些网站的搜索引擎有窝,内容和不同的恢复方法,但它们大致可以分为:有三种类型:基于ROBO,目录和元搜索引擎的搜索引擎。是基于手动发现或信息过滤基于机器人的搜索引擎,但被称为“机器人”的计算机程序被发现,处理,并在互联网上组织操作:基于机器人搜索引擎根据一些网络协议。息并为用户提供搜索服务。于目录的搜索引擎:与基于机器人的搜索引擎不同,目录数据库由全职发布者或志愿者构建,他们在访问网站后编写网站描述。据网站的内容和性质,它被归类在一个预定义的类别,而网址和网站描述都放在这个catégorie.Lorsque用户点击一个特定的关键字,搜索软件只搜索这些描述。搜索引擎:也称为多搜索引擎,其特征在于不存储网页信息的数据库。用户查询关键字时,他将其查询转换为其他搜索引擎可以并行接受的命令格式。问多个搜索引擎以查询此关键字,并将这些搜索引擎返回的结果返回给用户。索引擎的工作原理:搜索引擎并不真正搜索Internet,而是搜索预先组织的Web索引数据库。索引擎无法真正理解页面的内容,它只能机械地匹配页面的文本。索引擎的原理可以看出,在三个阶段:网页从互联网上的探索,利用自动收集从互联网网页,自动访问互联网和探索Spider系统方案包含任何网页所有网址的其他网页,重复此过程并收集所有上传的网页。建索引数据库,通过分析索引系统程序分析收集的索引页,提取相关的网页信息,并根据算法进行大量复杂的计算。定相关程度,并为页面文本和字符串中的每个关键字获取每个网页。关性(或重要性),然后使用此相关信息来创建Web索引数据库。索在索引数据库中排序。用户输入搜索的关键字时,搜索系统程序在网页索引数据库中找到与该关键字对应的所有相关网页。于此关键字的所有相关网页的相关性已经很好,因此您只需对现有相关性值进行排序。关性越高,排名越低。技术的概念是从分布式人工智能,定义为的试剂的是存在于一种环境中的实体,可以检测环境中,从环境接收消息和反应并响应。环境中从最终用户的角度来看,代理是用户的代理和助手。代表并帮助用户实现他的目标并完成某些任务。系统的角度来看,代理作为抽象实体,实现形式可以是软件,也可以是硬件(需要软件控制),一般搜索是软件代理。理特征:自治:代理具有自己的资源(数据)和行为控制机制(处理过程),无需人员或其他代理的直接干预即可工作。据他的内部状态和感知的环境信息,他可以控制自己的行为和内部状态。交性:代理人和其他代理人(包括人)通过某种沟通语言进行互动,以获得协调与合作。
  应性:代理人观察其环境(可能是物理世界,图形世界,一系列其他代理人等),并在特定时刻做出反应来修改环境。动:代理不仅可以响应环境,还可以接受某些提示,并采取主动反映目标导向的行为。力:代理具有一定程度的智能,可以执行一系列智能行为,包括推理和自学。通能力:代理商(包括人员)可以交换信息。理之间的通信机制:当多个代理形成多代理系统时,代理之间会发生通信和相互协调的问题。理商之间的沟通不能仅仅是字符或二进制数,代理商与一些情报和一定的自主权实体流,通信必须表示,理解并在沟通知识。果,出现了代理通信语言(ACL)。是用于在代理之间共享和交换知识的协议语言,以及多代理系统的重要部分。
  理的功能模块可以分为三组:表达模块,通信模块和其他应用模块。图1所示。能多代理搜索引擎的设计和实现全局设计解决方案基于代理的系统采用智能且独立的问题解决代理,自动搜索和发送用户通过自动化工具向用户提供的信息。一代的设计在这里搜索引擎有两个功能:信息过滤和搜索引擎:自定义功能,建立独立的用户兴趣模型,通过自己的搜索引擎提交用户利益的能力并返回过滤后的信息。技术的实现的角度来看,这种设计基本上集成在传统的搜索引擎智能代理机构和形成经由所述用户接口,所述用户接口的自定义用户侧层搜索引擎,信息过滤代理以及搜索引擎,用户界面和信息过滤代理之间的交互机制,智能地适应用户兴趣的变化。那些环境。本体系结构如图2所示。记为“智能网页提取”的网页分析代理网页与常规文档不同。的信息反映在以下三个部分:网页的文本(包括标题),包含在网页中的超链接的标志和网页之间的超级页面。接,如图3所示:图3的网页信息架构网页分析结构剂如图4所示图的代理提取功能的网页结构的4分析网页首先,超文本Web过滤是必要的,然后获得网页文本正文,超文本标记和超文本链接。页的过滤后的主体与普通文档的主体相同。的处理可以转换成中文文档处理。骤如下:)设置分词词典:对于中文文档处理,首先要做的是创建一个更好的分词词典。我们的后台系统,为了简单和方便起见,我们已经开发了其中的内容是相对固定的证券字典分词的信息,主要包括姓名股票,股票代码和某些常用证券条款。标签信息中提取特征:超文本是一种半结构化数据,由标签,标记内容,标签末端和其他标签组成。这里,我们提取有关功能的有效信息。于智能多代理搜索引擎,许多语言可以构建基于代理的应用程序的原型,但它们不能称为代理语言。非所有语言都提供足够的功能来有效实施智能代理。伍尔德里奇和詹宁斯,代理语言是可以用来构建硬件和软件符合由代理的理论家,包括一些结构与代理相一致所提供的概念的语言。
  些专家总结了面向代理的编程语言的标准。
  据这一标准,宁波seo因为与平台和安全的独立带来的好处的,Java是更适合于代理制的发展,现有的任何其他语言更适合面向代理的编程语言的适用标准。维矢量表当从HTML文档中提取对象的建设,做的第一件事就是网页收集的文本信息转换为二维数据阵列,列在游戏是一组实体,每列都是一个功能:一组行是所有页面的集合,每个页面的行为类似于网页功能的集合。种构建二维数组的方法包括:i)首先使用改进的分词算法对页面进行分词,ii)每列是一个单词和整个列(特征集)在我们的分词词典中很有价值。就是说,因此,在我们的系统中,所有列包含超过2000列三)每一行存储有关页面上的话,所有相应的组列的页面上的文字(信息功能集)。果列集中没有出现,则列集中的每列都为0;如果它出现k次,则其值为k;如果页面的单词没有出现在列的集合上,则表示该单词没有特殊值,可以删除。过这种方式,您可以表征页面上单词的频率。些改进由于我们分析的对象是HTML文档,因此HTML格式的一些特殊标记表示不同的含义,并且不能忽略对整个HTML页面的这些标记的分析。
  此,基于上面的二维数组,我们对页面进行更深入的频率更改。
  容包括:i)将根据上面提出的八个层的分类符号,对应于页的二维数组的值进行加权和更新,并且重量为64和1之间,并且每个状态是的例如((9个级别的值),如果“四川长虹”在表中对应于二维页的值是1,并且标记“TITLE”被变更为“四川长虹”线“蜀长虹锚“字值在1+(9-1)Z = 65依此类推,其他词的频率是可以改变的。i)用于在字更新”“因为”的锚“通常与页面密切相关,我们认为单词”锚“具有与”第一级标题“相同的权重,即单词”每次出现“的权重”锚“是49. Iii”对于每一行的单词,前四个单词的频率最高t用作HTML文档中的关键字,HTML文档的标题和地址放在主索引表中以供查询。据上面的基本设计,我们使用Java语言实现基于多代理技术的搜索引擎。
  本文转载自
  宁波seowww.leseo.net
  补充词条:宁波网络seo公司  宁波网站排名优化  宁波网络seo  宁波谷歌seo  宁波网站优化推广