摘要:面临汗牛充栋的网络信息,挑选最适宜的查找引擎快速、精确地找到所需求的信息成为人们在信息检索中最重视的问题。经过试验,从数据库更新、检索功用、呼应时刻、查准率、个性化效劳等五个方面,对我国市场现在最具影响力的三种归纳查找引擎百度、谷歌、360进行比较研讨,总结了三种查找引擎的优势与缺乏,提出合理挑选查找引擎的战略和进步检索功率的技巧。
要害词:查找引擎;数据库更新;检索功用;呼应时刻;查准率;个性化效劳
中图分类号:TP391文献标识码:A文章编号:1009-3044(2018)17-0211-03
Abstract:Howtochoosethebestsearchengineandfindtheinformationwhichweneedquicklyandaccuratelyfromthehugevolumesofdatahasbecomethebiggestconcernofinformationretrieval.Basedonexperiments,thethesismakesacomparativestudyofthethreemostinfluentialsynthesizedsearchenginesinChinesemarket,Baidu,Googleand360,fromthefiveperspectivesofdatabaseupdate,searchfunction,responsetime,precisionratioandpersonalizedservice,presentingadvantagesanddisadvantagesofthem.Italsoputsforwardstrategiesofselectingthemostsuitablesearchengineandsearchtipsofinformationretrieval.
Keywords:synthesizedsearchengines;databaseupdate;searchfunction;responsetime;precision;personalizedservice
在互联网技能普及的今天,人们查阅材料都会挑选一种便捷、全面、精确的办法——查找引擎。现在国内外的查找引擎形形色色,面临汗牛充栋的互联网信息,怎样才能运用最适宜的查找引擎便利、快速、精确地找到所需求的信息,这成了人们在信息检索中最重视的问题。关于查找引擎的点评研讨一直是研讨热门之一,现在,国内外学者在该领域的研讨大多是理论层面的、定性的研讨。虽然国内学者也进行了一些定量的点评,但是很少有人從用户的角度考虑,经过试验进行定量剖析比较研讨。本文以用户快速、精确、便利查找信息为主导方向,经过试验,对我国市场现在最具影响力的三种中文归纳查找引擎:百度、谷歌、360进行比较研讨,期望本文的研讨能辅导用户挑选适宜的查找引擎,进步检索功率,并能辅导我国查找引擎的改进和开展。
1我国市场最具影响力的中文归纳查找引擎基本情况
查找引擎是一种采用高效的Spider程序进行网络资源的搜集、整理与组织,为用户供给查询效劳的信息效劳体系[1]。常见的查找引擎有归纳查找引擎和特别查找引擎[2]。从我国用户角度、市场比例及有关媒体统计数据看,现在我国市场上最具影响力的中文归纳查找引擎是百度、谷歌(香港)、360等[3]。
百度查找引擎是最了解我国文明、更懂我国人的心理、愈加靠近我国的生活,它是现在世界上规模最大的中文归纳查找引擎;Google查找引擎是被公认为全球最大的查找引擎,在国内外都具有很大的影响力;360查找引擎是现在我国市场最具影响力的查找引擎之一,上市几天其归纳查找访问量比例达8.97%,敏捷成为我国第二大查找引擎[4]。
2百度、谷歌、360比较研讨
本文从三种中文归纳查找引擎影响力特征出发,以用户快速、精确、便利查找信息为主导方向,从数据库更新、检索功用、呼应时刻、查准率、个性化效劳等五个方面进行比较研讨。
2.1办法
剖析比较的原始数据经过详细试验获取,试验中采用了“网页快照”、“时刻戳”[5]和时刻间隔检索办法来获取网页更新的时刻变化。试验时刻从2017年3月10日至31日,试验在华中师范大学校园网网络环境下,运用360浏览器进行。试验检索课题集是从“百度查找风云榜”中挑选出更靠近用户爱好和检索需求的五个检索要害词,详细是:KW1:王大治(人物)、KW2:国五条(社会民生)、KW3:欧文退役(体育)、KW4:QQ(科技)、KW5:大众(汽车品牌)。用挑选的这五个要害字分别在三种查找引擎中进行试验,剖析统计数据,并结合相关文献得出成果、定论。
2.2试验成果及剖析
2.2.1数据库更新
为进步查全率,各种查找引擎都尽力扩展数据库,而数据库的更新周期直接影响了查准率。试验中经过“网页快照”“时刻戳”和时刻间隔检索办法进行试验,记录检索成果总数变化及时刻变化并对成果进行剖析对比,得到三种查找引擎的数据库更新情况,如表1。
成果标明,百度在数据库更新方面做得相对好一些;谷歌在数据库更新方面敏感度稍差;而360主要依托百度和谷歌的数据库,它的页面改写频率更高,能查找到最新信息。
2.2.2查询功用
查找的强度是评估查找引擎质量的一个重要目标。下面主要从检索办法、布尔检索、限制检索及截词检索四个方面进行试验测试,成果如表2所示。
成果标明:三种查找引擎检索办法相似,百度还支撑二次检索;百度和谷歌都支撑布尔检索,而360支撑与、或检索符;百度和谷歌都有限制检索功用,谷歌的限制能力最强,而360没有;三种查找引擎都支撑截词检索,但谷歌和360此功用有限。
2.2.3呼应时刻
呼应时刻是指用户经过某个查找引擎从提交要害词检索式到体系返回检索成果所用的时刻,它标明一个查找引擎的检索速度。速度越快,用户也就越对它有所偏好。用选定的要害字试验测试,成果发现只有谷歌在检索成果中显示检索呼应时刻。依据试验测试过程中的观察标明,在网络疏通的情况下百度查找上万网页通常只需零点几秒,是三种查找引擎呼应时刻最短的,号称为毫秒级检索呼应速度[6]。
2.2.4精确率[7]
精确率是衡量检索体系信噪比的目标[7],也是用户最关怀的问题,查询精确率高能够减少重复检索,节约用户的检索时刻。对选定要害字集进行检索得到的原始数据如表3,三种查找引擎的查准率如表4所示。试验成果主要是作为剖析比较的依据,在同等条件下,增大或减小数值不影响剖析比对成果,为了便利比对数据,表4中数据均作了消阶处理(即每个数都乘上1000)。
从试验成果来看,360的查准率比其他查找引擎更胜一筹,百度和谷歌的检索返回成果总数比360大一些,360的查全率要差一些,而谷歌的检索相对更全面一些。
2.2.5效劳个性化[8]
效劳的个性化实质是为不同用户供给个性化的效劳内容和活动,尽量满意各种用户的需求[9]。对于查找引擎而言,个性化效劳是影响用户对网站偏好的一个重要目标。下面从功用设置、要害词输入、查找设置、检索成果等方面临三种查找引擎的个性化效劳进行比较、剖析得出:三种查找引擎在个性化效劳方面各具特征。成果如表5所示。
3定论
经过以上试验并对三种查找引擎进行了比较、剖析研讨,得出以下定论:
3.1百度、谷歌、360查找引擎优劣并存
百度查找引擎更重视效劳的本地化,更多地融入了中文检索的特征,收录的中文信息掩盖面广、数据库更新快、检索速度快,对于我国本乡文明的了解和适应能力更強。百度的短处是检索成果排序不合理、精确度不高级,这些都需求进行优化和改进。
比较而言,谷歌的检索功用强大、灵敏,
宁波seo优化支撑多种语言检索,谷歌能够对网页的重要性做出客观的点评,成果排序客观公平,收录速度快,以杂乱而全主动的查找办法排除了任何人为因素对查找成果的影响。谷歌的缺点在于“不懂我国”[10],中文数据库更新慢。因而,网络上热传着“内事不解问百度,外事不解问谷歌”之说。
360强调的是人在查找中的重要性,它采取了机器学习技能和首创的PepoleRank算法,高质量网页的排名靠前可为用户供给更清洁,安全和可靠的查找成果。360的缺点是没有彻底识别字母组合检索词,没有高级检索功用,信息相关性、杂乱性、抓取速度等方面也需加强、改进。
3.2合理挑选查找引擎,充分利用互动问答平台解决问题
用户在进行检索时,要依据详细的检索要求挑选适宜的查找引擎,进步检索功率。比如要检索具有我国地域特征的信息、国内热门问题、我国人物等具有中文习惯说法的信息等,用百度查找引擎作用更好;若要检索世界事件、名词、英文等,特别是要取得非中文信息时,用谷歌查找引擎查准率更高;假如用户对查全率要求不是太高,用360查找引擎能够得到比较精确的检索成果。别的,还能够经过百度的“百度知道”、360的“问答”等功用进行提问或检索答案,充分利用互动问答平台解决问题。
3.3把握检索技巧,进步查询功率
进步查询要害词的挑选技巧,有助于进步检索速度、取得精确信息。为了选好要害词,要把握一些必要的技巧,要避免用含义广泛的一般性词语作为要害词,如要查某方面的学习信息,挑选“英语学习”之类的要害词就比“学习”更精确;当查询成果中有太多不相关的信息时,能够增加要害词滤除不相关成果;将要害词内包含的疑问词、连词、感叹词、辅助词等删去有助于进步查询质量。当然,在查询中,也能够依据一次查找的成果,不断批改要害词,最终找到想要的信息。
4结语
查找引擎中还有许多问题,如信息量缺乏,查询精确度低;信息改写速度跟不上,网络上信息的变化无法控制;办理信息内容和多样化的格式很困难;精确性和可靠性差;数据错误、遗漏、过期等等。期望查找引擎能认清缺乏,不断改进,加强效劳的个性化,进步主动查找软件的智能化程度,加速信息改写速度,让用户能够便利、快速、精确地找到所需求的信息。
参考文献:
[1]方志坚,张瑞林,童小素.查找引擎归纳剖析[J].计算机工程与规划,2007,28(16):4039.
[2]刘畅.归纳查找引擎与垂直查找引擎的比较研讨[J].情报科学,2007,25(1):97-98.
[3]2012年12月我国查找引擎市场比例排行榜[OB/OL].[2013-01-11].
http://www.weste.net/2013/1-11/87960.html.
[4]2012年度我国互联网最具影响力产品——360查找.[J/OL].[2012-02-03].
http://www.ciweekly.com/article/2012/1228/A20121228558016.shtml.
[5]周辉,曹兰芳.查找引擎数据库更新战略比较剖析[J].图书馆学研讨,2012,19:50-55.
[6]什么是个性查找[OB/OL].[2013-01-28]..http://www.nev.cn/a1article-70883-1.html.
[7]ChristopherD.Manning,PrabhakarRaghavan,HinrichSchutze.信息检索导论[M].北京:人民邮电出版社,2010:105.
[8]李树表,韩忠愿.个性化查找引擎原理与技能[M].北京:科学出版社,2008:36
[9]吴建军.浅谈百度查找引擎的功用与效劳特征[J].科技情报开发与经济,2007,17(15):216.
[10]Google查找引擎特征[EB/OL].[2013-01-25].
http://wenku.baidu.com/view/bd2c1d23192e45361066f508.html.
本文转载自
宁波seo优化www.leseo.net
补充词条:
宁波seo外包
宁波网站优化推广
宁波seo推广公司
宁波seo优化公司
宁波网络seo