宁波seo优化专栏

浅谈基于Web发掘的个性化搜索引擎技术

发布时间:2018-12-08 22:12:12
  摘要:本文针对搜索引擎存在的问题,简要介绍了Web发掘的相关技能,并构建了用户个性化数据库,规划出根据Web发掘的个性化搜索引擎模型,使检索成果愈加契合用户的实际需要。
  关键词:Web发掘;搜索引擎;个性化效劳
  搜索引擎的基本概念呈现于20世纪70年代,并于20世纪90年代中期得到快速的开展。跟着Web信息的迅速添加,搜索引擎市场呈现了史无前例的繁荣景象,搜索引擎正向着智能化、个性化等习惯不同用户需求的方向开展。目前,搜索引擎依然存在许多的局限性,首要表现在以下几个方面:查询精度不高且不能根据用户爱好回来信息、材料检索与用户的交互不够、查询成果排序不合理、不能处理多种格局的文件等。
  Web发掘[1]是指从异构的分布式互联网数据中搜集信息,利用计算机网络技能和人工智能技能,不断地发现有用的数据模型和隐含知识。根据发掘方针的不同,Web发掘可分为Web内容发掘、Web结构发掘以及Web日志记载发掘。
  Web内容发掘是根据Internet中各种网站的数据内容,以获得有效的知识驱动模型,并自动检索网络资源,进步网络数据的运用。
  Web结构发掘是研讨Web文档的链接结构,找到链接中隐含的可用模式。其中两个最著名的算法是PageRank算法和HITS算法。
  Web日志记载发掘也称为Web日志发掘,以Web效劳器拜访日志为首要数据,剖析用户的阅读行为与页面之间的结构类型,改善站点结构,为用户提供个性化效劳。
  用户个性化数据库以用户的多维信息为根底,不断深入发掘用户的阅读行为,并根据页面权重、时刻间隔、下载信息等要素不断更新数据库,协助用户查找实在需求的资源信息[2]。用户个性化数据库包含信息搜集与信息更新。
  1.搜集用户拜访信息
  如何获取有关用户的个性化信息是用户个性化数据库需要解决的首要问题。用户个性化数据库的数据信息首要来自于用户提交的信息以及剖析用户的拜访日志。用户在拜访互联网的过程中,提交的查询关键词、逗留网页时刻、下载状态等信息会在Web效劳器上留下记载,并形成用户拜访日志。用户个性化数据库经过不断剖析用户拜访日志,发掘用户的潜在个性化信息。
  2.更新用户个性化信息
  用户的个性化需求不是原封不动的,大多数用户的个人特征数据会跟着时刻推移而改变。其首要表现形式有两方面,一为爱好领域的改变,二为爱好程度的改变。用户爱好的改变将不可避免地影响用户个性化数据库的内容,这就要求用户个性化数据库具有自主学习的能力,并根据用户的爱好改变不断更新数据库中的相关特征项。
  本文采用改变权重的办法更新用户的个性化特征项,公式如下:
  NewWeight=OldWeight+i×t
  i为用户拜访网站的参数。针对不同用户的拜访行为进行界说,如用户对拜访内容进行下载、对网页进行全文阅读、对部分网页内容进行阅读、未对网页进行阅读等。不同的拜访行为反应了用户对信息的满足程度,依次为i断定不同的数值。
  t是时刻参数。用户通常会长时刻阅读他们感爱好的页面,不然阅读时刻将会变短。
  个性化效劳的方针是反映用户之间的差异,尊重用户的个性特征并向用户提供各种信息效劳[3]。根据Web发掘的个性化搜索引擎模型首要为用户提供个性化的信息检索效劳,便于用户查阅运用。
  本体系首要包含个性化数据库、检索体系、后台办理体系。
  个性化数据库首要表明用户的爱好趋势,经过不断发掘用户拜访日志,自动更新用户的个性化特征项。
  检索体系首要根据用户查询关键词,在检索信息的同时计算相应页面的权重,以此为根据进行排序,宁波seo并把检索成果反馈给用户。
  后台办理体系首要加强子体系之间的通信连接,维持体系的安稳运行。
  跟着互联网信息的急剧添加,搜索引擎技能在信息检索中发挥的作用越来越大。信任跟着科学技能的进步,网络信息检索技能的开展也会越来越快。
  参考文献:
  [1]张彦波.Web发掘研讨微探[J].北京電力高等专科学校学报(自然科学版),2010(27):145.
  [2]冯是聪,单松巍,张志刚等.根据Web发掘的个性化技能研讨[J].计算机工程与规划,2004(1):4-5.
  [3]王术,付关友,朱征宇.面向个性化效劳的网页特征描述[J].计算机工程与规划,2005(3):651-653.
  本文转载自
  宁波seowww.leseo.net
  补充词条:宁波seo外包  宁波网站seo  宁波seo优化公司  宁波谷歌优化  宁波网站排名优化