摘要:本文从用户视点剖析了传统查找引擎检索成果的缺乏,提出在语义网环境下可以从重视剖析用户发问的语义联系、扩展检索方法、改动匍匐战略、优化检索成果界面等方法对传统查找引擎的检索成果进行优化。
关键词:语义网查找引擎检索成果优化
一、导言
跟着信息时代的到来,人们更依赖于经过查找引擎来获取所需信息。但是Internet上资源类型多样,内容丰富,信息量越来越大,传统查找引擎的成果现已不能满意用户的需求,局限性开端闪现:它侧重于从用户发问中抽取关键字(词)进行查询并回来与关键字(词)相关的链接,忽略了从语义视点剖析用户发问;它对检索成果按必定的排序算法进行排序,但并不是所有的检索成果都是依照相关度进行排序,所以有时候用户需求的内容在前1-2页找不到答案[1]。
早在1998年万维网联盟的TimBerners-Lee就提出了语义网这一概念。它是对Web的补充和扩展[2]。它在国外已有很大的开展,其中最显著的一项就是语义查找引擎的呈现,其典型代表有面向任何主题的Kngine和专心于食品、烹饪、食谱的Yummly。我国各大高校都纷纷学习研讨并使用该技能更好地完成智能化。
从国内外研讨现状来看,语义网现已被人们逐步认识并运用到许多方面。本文在对传统查找引擎检索成果剖析的基础上提出语义网环境下查找引擎应朝着理解用户发问的语义联系、进步检准率、供给多种检索方法、检索界面简练等更利于用户运用的方向开展。
二、传统查找引擎检索成果剖析
传统查找引擎是定期收录和整理网络信息,依照关键词查询并回来成果的网络信息检索东西[3]。它经历了较长的开展时期,以百度,google为典型代表。因为查找引擎的首要作用是搜集、整合、标记Web上的各种资源进而便使用户查找,那么咱们将从用户视点对传统查找引擎的检索成果进行剖析。
(一)检准率
检准率是指检出的相关文献数量占检出的文献总量的比率。传统查找引擎的检准率相对较低。因为传统查找引擎针对用户发问进行查询时,重点在剖析该发问中的关键词,并依据关键词进行检索,很少剖析该发问式中的语义联系,所以常常导致在检索成果的前2页[1]很少有满意用户需求的信息。查询成果的冗长和不相关会直接导致用户运用该查找引擎的积极性。
(二)重链率
重复链接率是指检索成果中重复内容占悉数成果的百分比。该指标越低阐明检索成果越好[4],进而导致在其检索成果中经常会呈现不同资源标题、不同URL和不同描绘项等指向同一成果,这样不只糟蹋用户的时刻也影响用户对检索东西的再次使用。
(三)空链率
空链接率是检索成果中检索成果为空或许检索成果无法链接占总悉数检索成果的百分比。在当时查找引擎检索成果中用户无法直接判别当时链接是否正确,需求点击进去之后才能断定当时链接是否为空链,尤其是空链的内容恰好是用户需求的内容,这种情况下会影响用户对该查找引擎的运用。
(四)检索成果的权威性
检索成果的权威性和正确性与信息发布者的权威性和专业度有很大联系。在平时检索中若是对概念性的词进行检索咱们会喜爱于百度百科、维基百科等,再比方当咱们要查“郑州大学情报学2015考研参考书目”时,尽管从其他网站上也能查到相关信息,但咱们却更相信由郑州大学官网发布出来的信息,所以若其他网站也整理了相关信息最好是能标示信息的原始出处并附上链接,这样会进步当时网站的可信度。
(五)检索成果展示方法
传统查找引擎一般地会将查询成果以链接和扼要描绘方法回来以便用户在简单的描绘中判别检索成果的相关性进而点击链接进行检查,但对是否是死链以及该链接的网页具体内容是否与前面链接重合等都无法进行判别,所以以链接方法回来的检索成果在某种程度上也潜藏了问题。
三、语义网环境下的优化办法
经过对传统查找引擎的检索成果剖析得到,那些依据关键词匹配和排序算法的查找引擎在检准率等方面现已呈现了许多问题,所以在当时语义网技能已得到较快开展的常识经济时代,从语义网视点对查找引擎检索成果进行优化已有了较强的必要性和可行性。当时国外现已有了13例典型的语义查找引擎,语义查找引擎是经过对网络资源进行语义标示以及对用户查询恳求进行语义处理,完成语义推理和精确、全面的检索[4]。借鉴国外已有的成功事例,
宁波seo优化在语义网环境下首要经过以下方面对传统查找引擎的检索成果进行优化:
(一)重视理解用户发问的语义联系
首要传统查找引擎可以使用OWL2(WebOntologyLanguage)[5]描绘Web上的信息资源,理解并剖析资源间的语义关联,树立相应的常识图谱,然后使得查找引擎针对用户发问进行检索时扩展检索范围并深度发掘信息。
同时重视理解用户发问的语义联系,而不是单纯的对该发问式进行切割抽取关键词,这方面咱们需求凭借语义技能来完成,在充沛理解用户发问的基础上,查找引擎便可采用依据常识和计算的方法遍历常识图谱并计算出答案。
(二)语音查找
传统查找引擎大都供给简单检索和高档检索,但跟着互联网的普及,查找引擎的运用者现已从专业人士扩展到普通群众,同时,跟着人们查找习惯的改动,语音查找现已成为一种群众遍及承受的方法,而传统查找引擎首要是经过剖析用户输入的内容进行检索,而不支撑语音查找,所以,跟着语音查找功用的扩展,传统查找引擎已不再能满意人们的需求。阿密特·辛格尔说“查找引擎的三个首要功用将需求改善,查找将需求:答案,对话,预测”[6]。故而传统查找引擎也需有支撑语音查找的功用。语音查找这种功用在国外已有的语义查找引擎中已有应用,比方在Congnition中语音问“为什么要承受LASIK手术?”“LASIK手术的程序有哪些?”语音导航员一边解答,一边在网页上显现答复的内容[4]。
(三)检索成果显现简练直观
传统查找引擎将查询成果按链接方法回来,用户需求依据该链接的扼要描绘判别是否进入该链接,而且该链接的网页内容是否与前面链接内容重合、是否为空链都要进一步点击之后才能断定,这在某种程度上糟蹋了大量时刻。
借鉴语义查找引擎的特色,语义网环境下传统查找引擎可以将检索成果直观化,在成果页面上直接显现成果,这样减少了链接的次数,也便使用户直观地获取信息;语义网环境下传统查找引擎也可以将检索成果可视化,以用户可以理解的图表方法显现出来,这样可防止用户从大批文字中剖析答案而占用较长时刻;语义网环境下传统查找引擎的检索成果页面应干净整齐,过滤掉广告、废物信息。
(四)优化匍匐战略
当时Web上信息内容丰富,更新频率不一致,各种信息间呈网状多样联系,这种情况给查找引擎搜集网上信息资源提出了更严苛的要求。在语义网环境下,查找引擎应愈加重视剖析各种信息资源间的联系,从深度发掘信息。在这方面查找引擎可以优化匍匐战略,针对每个网页信息都能找寻它的开始链接,这样既可以进步当时网页的可信度,也剖析了各网页间的联系,增强查找引擎内部信息的关联度也便于更深层次剖析信息,更好地为用户服务;当然查找引擎也要依据各类型网站的更新频率设置相应的匍匐时刻和次数,以便能在第一时刻内搜集归纳新的信息,便使用户查询。
参考文献
[1]王渊.面向用户的查找引擎检索成果点评[J].河南图书馆学刊,2007,27(4):74.
[2]Berners-LeeT,HendlerJ,LassilaO.ThesemanticWeb[J].ScientificAmerican,2001,284(5):28-37.
[3]赵夷平.传统查找引擎与语义查找引擎服务比较研讨[J].情报科学,2010,28(2):265-270.
[4]郭卫宁,司莉.国外语义查找引擎查询与剖析[J].图书情报工作,2013,57(23):121.
[5]曾新红,吴鹏,林伟明.OWL2Web本体语言入门.http://nkos.lib.szu.edu.cn/OWL2/OWL2PrimerSimplifiedChinese.htm.
[6]胡祝.查找引擎的最新进化[N].电脑报,2014-4-21(13).
[7]张海涛,高松.查找引擎检索成果的网页安排及其优化战略[J].情报科学,2006,24(6):900-903.
[8]苏分明,宋文.依据本体的语义查找引擎解决方案与研讨新进展[J].现代图书情报术,2008(11):24-28.
[9]语义网.http://baike.baidu.com/link?url=P7TLysay0heBDC4WuYCOH7f1ORSpnKJSRopNco6KngTmb8dNtd-lJfVXpn1Wkkeq8KpcjP6StZTE-GyM99F2FK.
本文转载自
宁波seo优化www.leseo.net
补充词条:
宁波网络seo
宁波seo外包
宁波谷歌优化
宁波seo推广公司
宁波网络seo公司