宁波seo优化专栏

我国网络搜索引擎研究现状及未来发展

发布时间:2018-12-04 21:53:44
  (云南大学 公共管理学院,云南 昆明 650500)
  【摘 要】网络时代,人们检索各种信息都离不开可种各样的查找引擎,对查找引擎的研讨也越来越成为热门。文章首要针对我国网络查找引擎研讨的相关文献做出近十年的文献计量计算,剖析了有关查找引擎的类型、作业原理以及存在的缺乏并对未来开展做出展望。
  【关键词】查找引擎;现状剖析;未来开展
  跟着互联网的高速开展,网络信息量激增,用户要想在众多信息海洋中找到所需的资源就离不开网络查找引擎。查找引擎(Search Engine)是以必定的技能在互联网中查找发现信息,并对信息进行提取与整合,为用户供给检索效劳。因为技能的不断成熟,从著名查找引擎效劳供给商到国内外软件工程师,都先后推出自己品牌的查找引擎,对查找引擎的也研讨越来越成为热门。
  一、数据来历和研讨办法
  (一)数据来历
  我国知识资源总库(CNKI)的数据库之一我国学术期刊网络出版总库是国内最大的中文期刊全文数据库,本文以“我国全文期刊数据库”为检索东西,以“查找引擎”为检索词,以篇名检索为进口,对2004至2013这十年的期刊文献进行准确检索,并进行筛选、去重,终究得到5158条文献数据。
  (二)研讨办法
  本文首要采用文献计量办法对相关文献的数量、著者散布、期刊散布、首要研讨组织进行剖析以提醒其研讨现状。然后对数据进行抽样,选取宣布时刻为近五年即2009 -2013年的核心期刊论文,对其所研讨的主题内容进行剖析并提醒出该范畴的研讨热门及开展趋势。
  二、文献调研与查找成果剖析
  (一)文献年份计算剖析
  表1 文献年度计算
  年份 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
  篇数 163 491 546 638 690 689 640 585 492 218
  宣布文献的数量在必定程度上代表了某段时刻某个范畴的研讨水平缓开展趋势,经过对2004至2013年文献数量的剖析计算(因为查询时刻为2013年8月,因此2013年的数据并不具备参考价值,重点对2004至2012这九年进行剖析)。能够看出,2004至2009年是相关研讨的陡增期,在2007年有一个开展高峰,2008-2009年到达顶峰。2010年开始略有下降,应该是进入又一稳定开展时期。
  (二)文献作者剖析计算
  表2 最高发文量作者计算
  序号 作者 作者单位 发文篇数
  1 赵恒永 北京化工大学 11
  2 维尼拉.木沙红 新疆大学 11
  3 吕学强 北京信息科技大学 10
  4 刘奕群 清华大学 9
  5 张敏 清华大学 7
  6 刘俊熙 上海政法大学 7
  7 马少平 清华大学 7
  8 杨晓江 南京师范大学 7
  9 李村合 我国政法大学 7
  10 崔志明 苏州大学 7
  表3 最高被引作者计算
  序号 榜首作者 文献来历 宣布年月 被引次数
  1 印鉴 计算机工程 2005.07 127
  2 余惠佳 中文信息学报 2007.01 111
  3 刘畅 情报科学 2007.01 76
  4 杨思洛 现代图书情报技能 2005.01 73
  5 高琰 微机开展 2004.10 71
  6 黄武双 知识产权 2007.09 61
  7 蒋萍 微电子学与计算机 2004.12 59
  8 李勇 计算机工程与科学 2008.03 57
  9 陈新颜 现代情报 2004.09 57
  10 罗丽珊 图书馆学研讨 2006.12 53
  发文量计算可识别该范畴的高产作者,其间超越5篇的共有28位,但因为许多为合著文章,咱们只视榜首作者是论文的首要职责者和撰写人,计算成果如表2所示。论文的被引频次可反映其学术影响力,截止检索日被引次数前十的作者见表3。
  其间,发文量排名榜首的是北京化工大学计算机系的赵恒永;被引量排名榜首的是印鉴,第二的为余惠佳,与余惠佳合著的还有刘奕群、张敏、马少群,他们也都是发文量前十的作者。其间清华大学刘奕群博士和马少华教授还合著过《查找引擎技能根底》一书。以上两表咱们能够看出高产作者和高被引作者并不共同,这表明投入到查找引擎这一研讨范畴的专家虽然许多,但专心于此的人并不多。
  (三)文献高产组织计算
  表4 组织计算
  排名 组织 发文量 排名 组织 发文量
  1 电子科技大学 61 11 清华大学 38
  2 北京邮电大学 59 12 苏州大学 37
  3 武汉大学 57 13 西安电子科技大学 57
  4 北京大学 56 14 复旦大学 35
  5 浙江大学 52 15 华南理工大学 34
  6 武汉理工大学 49 16 南京大学 33
  7 华中科技大学 48 17 郑州大学 31
  8 吉林大学 48 18 北京交通大学 31
  9 北京化工大学 41 19 我国石油大学(华东) 28
  10 上海交通大学 39 20 天津大学 28
  从论文数量上看,电子科技大学以61篇的数量排在榜首位,排在第二的是北京邮电大学,其他排名比较靠前的还有,武汉大学、北京大学、浙江大学等。该范畴的高产组织首要是我国发达地区的重点高校,其间武汉大学、北京大学、
  南京大学和浙江大学皆是图书情报范畴比较突出的研讨组织,清华大学、吉林大学、电子科技大学是计算机科学范畴领先的组织,一起也有少量归纳实力不是很强的高校对查找引擎研讨较为突出。
  (四)文献高产期刊计算
  据计算,载文量在25篇以上的期刊有39种,所载论文总数为1533篇,占所有论文的29.7%;载文在30篇以上的期刊有30种,所载论文总数为1290篇,占所有论文的25%;载文在35篇以上的有21钟,地点论文总数为974篇,占所有论文的18.9%。其间10种期刊归于计算机软件与应用范畴,7种期刊归于图书情报范畴,另外3种是大学自创期刊。能够看出,对于查找引擎的研讨者首要来自以上两个范畴。
  表5 期刊计算
  排名 期刊 发文量 排名 期刊 发文量
  1 电脑知识与技能 89 11 图书馆学研讨 47
  2 现代情报 71 12 北京邮电大学 45
  3 科技情报开发与经济 61 13 计算机工程 43
  4 计算机工程与规划 51 14 科技信息 41
  5 福建电脑 51 15 软件导航 40
  6 计算机国际 49 16 吉林大学 37
  7 情报科学 48 17 情报探究 37
  8 电子科技大学 48 18 计算机工程与应用 37
  9 情报杂志 47 19 我国计算机报 37
  10 现代图书情报技能 47 20 微计算机信息 35
  (五)高频关键词剖析
  表6 高频词剖析
  排名 关键词 频次 排名 关键词 频次
  1 查找引擎 89 11 网络爬虫 47
  2 数据检索 71 12 网络蜘蛛 45
  3 元查找引擎 61 13 互联网 43
  4 Lucene 51 14 查找引擎营销 41
  5 笔直查找引擎 51 15 索引 40
  6 中文分词 49 16 数据发掘 37
  7 个性化 48 17 PageRank 37
  8 查找引擎优化 48 18 Nutch 37
  9 笔直查找 47 19 向量空间模型 37
  10 本体 47 20 Google 35
  排在榜首的关键词是“查找引擎”,也是本研讨的根底地点。接下来是各种新式查找引擎,如元查找引擎、笔直查找引擎、个性化查找引擎、智能查找引擎等。第三类关键词属技能范畴如Luence、网络蜘蛛、网络爬虫和数字发掘,它们很大程度上决议了查找引擎的质量。终究Google作为全球最大的查找引擎也一起遭到国内学者的关注。
  三、研讨主题总结
  (一) 查找引擎的作业原理
  查找引擎的作业原理,能够分为五步:从互联网上抓取网页,树立索引数据库,宁波seo在索引数据库中进行查找,对查找成果进行处理和排序,终究回来契合用户要求的检索成果。
  具体进程为用户输入关键词后,蜘蛛(Spider)在互联网上沿着网页中的URL爬到其他网页,并将爬过的所有网页搜集回来。通过查找体系程序对搜集回来的网页进行剖析并提取相关信息,用这些信息树立网页索引数据库,再从该数据库中找到契合关键词的所有相关网页,然后计算相关度并进行排序。一起,查找引擎要定期从头拜访所有网页,更新数据库,并根据网页文字和链接关系的改动从头排序,由页面生成体系将查找成果的页面内容和链接地址等组织起来回来给用户。
  (二)查找引擎与相关法律保护
  我国查找市场上竞争正在进入白炽化状态,查找引擎存在的众多法律危险也注定了在激烈市场竞争的一起也将会面临法律纠纷,包含商标侵权、网页复制、埋置链侵权等,发作在网络查找效劳商与广告商、用户以及网站与之间的各种知识产权纠纷也将越来越多。加之网络非法内容的众多,网络查找效劳商不得不担负起更多的信息过滤与检查职责,政府也将加强这一范畴的管理和操控。
  结合实际情况,有学者给出了如下主张:(1)清晰对查找引擎效劳商进行法律定性。(2)清晰查找引擎效劳商法律职责构建的目的地点。(3)协调好权利人与查找引擎效劳商的利益平衡,促进二者的协作,以冲击网络侵权行为。
  (三)查找引擎的牢靠性
  互联网为广阔的网络用户供给了一个庞大的信息空间和自在获取信息的时机,而查找引擎为用户找寻信息供给了攻略,是获得信息资源的重要途径,能否得到社会认可,能否真实意义上推动技能立异和科技进步,质量的牢靠性是根本。研讨表明查找引擎在必定程度上是牢靠的,但有时也会遇到搅扰,为人们的网络生活带来不便。但在提高查找引擎牢靠性的一起,咱们或许提高自己对信息的甄别才干。
  通过对个体用户点击行为的上下文布景环境剖析,可对用户在点击进程中的思想决策进程有所判断和定位,进而对点击的牢靠性给予有效评估。根据信息嫡概念,用户提交查询和点击确实定性程度和用户点击的牢靠性相关.,查找成果位置也对成果的相关性有必定的影响,回来的首位成果牢靠性较高。
  (四)查找引擎的类型与功用
  查找引擎的功用决议着能在多大程度上满足用户的需求,在查找引擎的研讨中有着非常重要的地位。信息膨胀速度远远超越了查找引擎检索规模,一个查找引擎通常不能找到用户所需的全部信息,用户在进行检索时需求在多个查找引擎间进行切换,在这种情况下,元查找引擎呈现了,它有效处理了独立查找引擎信息覆盖率缺乏和查准率不高的问题,它增加了检索的规模,起到了整合网络资源的功用。
  笔直查找引擎是应用于查找某一学科范畴或某一类信息(如图画、影像)的专业查找引擎,是查找引擎的细分和延伸,是相对归纳查找引擎的信息量大、查询不准确、深度不够等提出来的新的查找引擎效劳形式。例如学术查找引擎、农业查找引擎、博客查找引擎、人肉查找引擎、少儿查找引擎、军事查找引擎等,这此功用各异的查找引擎是笔直查找引擎的具体表现。此外,智能查找引擎和个性化查找引擎也是新式的查找引擎。
  (五)查找引擎的用户行为剖析
  用户既是查找引擎的直接使用者,也是效劳质量的终究评判者。查找引擎给网络用户带来巨大快捷的一起也暴露出了不少问题,要及时地处理这些问题,优化查找引擎就需求很多的用户信息。尤其要关注用户在使用查找引擎时不满意的方面,对很多的用户资料进行剖析,制定出相应的优化措施。
  最常用的办法是“流量剖析”,通过对流量剖析,不仅能够发现用户拜访网站的规则,还能够得知网站的主页阅读数,主页阅读数可用于丈量拜访者的整体情况。对用户的首要进入页面进行优化并重点保护,对首要的离开页面进行改善规划或删去。这样可削减查找引擎的作业强度。一起,网站也需不断保护和更新,在访间高峰到来之前获得查找引擎的青睐。
  四、查找引擎的现状及未来开展
  因为社会分工的加大,用户从事的工作有很大不同,不同用户对信息查找也有不同的要求。因为归纳性的查找引擎录入多方面、多学科、多职业的信息,会查找出许多不相关的信息,因而越来越多的专题性查找引擎呈现了。笔直(专业)查找引擎只面向某一特定的范畴,专心于自己的专长和核心技能,确保对该范畴信息的完全录入与及时更新,是查找引擎的一个开展趋势。一起业内的资深人士认为:纯粹的Web查找因为遭到1E的束缚而表现出应用才干偏低的特性,而根据桌面的查找则相当于一个“客户端+数据库”这样的应用形式,这也使得查找功用的多样化、个性化成为可能,是查找引擎的另一开展趋势。
  此外,查找引擎的智能化应不断提高,新一代查找引擎应该能够通过剖析检索者的检索和阅读行为来判断检索者的需求,有挑选地为检索者供给个性化的检索效劳;用户界面应进一步完善,实现检索的可视化,使数据库内在的语义表述转化为可见的几何图形;多语种检测和翻译技能应得到提升。
  五、结语
  通过以上剖析,能够看出查找引擎的方针已经由发现信息转变为协助用户处理问题,效劳对象正从针对所有人转为特定人群,效劳方法也由web检索提升为桌面检索,查找引擎的开展正朝着更直观、精准、智能化、人性化的方向。所以改动查准率不高以及检索成果排序不合理的现状,满足各类互联网用户的需求,并在权利人利益与社会效应之间寻找到一个适宜的度,通过立法或政策的形式加以断定,以缓解两者之间的利益冲突,是查找引擎在未来开展中需求进一步完善的。这样那些为用户供给良好效劳,一起不为了盈余而损害用户利益的查找引擎才干得到很好的开展。
  参考文献
  [1] 罗丽姗.笔直查找引擎开展概述[J].图书馆学研讨, 2006,12.
  [2] 刘畅.归纳查找引擎与笔直查找引擎的比较研讨[J].情报科学,2007,01.
  [3] 黄武双.论查找引擎网络效劳供给商侵权职责的承担——对现行干流观点的质疑[J].知识产权,2007,05.
  [4] 李勇,韩亮.主题查找引擎中网络爬虫的查找战略研讨[J].计算机工程与科学,2008,03.
  [5] 寿周翔.专业查找引擎的研讨与规划[D].浙江大学, 2005.
  [6] 王晓伟.笔直查找引擎若干关键技能的研讨[D].浙江大学,2007.
  [7] 岑荣伟,刘奕群,张敏,茹立云,马少平.网络检索用户行为牢靠性剖析[J].软件学报,2010,05.
  [8] 徐海燕,刘勇.查找引擎的作业原理及开展趋势[J].科技立异导报,2010,11.
  [9] 焦文铭.查找引擎侵权的法律剖析[J].江苏警官学院学报,2007,02:73-80.
  [10] 刘畅.查找引擎网络效劳商的法律职责剖析[D].复旦大学,2010.
  [11] 费巍.查找引擎检索功用的功能评价研讨[D].武汉大学,2010.
  [12] 费巍,黄如花.根据用户行为剖析的查找引擎优化战略[J].图书情报作业,2005,10:75-77+110.
  [13] 韩进军,安园园.查找引擎的未来开展[J].医学信息学杂志,2007,05:431-434.
  作者简介:刘诗璐(1989- ),女,现为云南大学公共管理学院情报学2012级在读硕士研讨生,研讨方向:网络信息安全。
  本文转载自
  宁波seowww.leseo.net
  补充词条:宁波网站seo  宁波seo哪家好  宁波seo优化公司  宁波seo排名  宁波网络seo