本文介绍了一种新的恢复模型,旨在提高经典搜索引擎恢复的召回率和效率。属词引入搜索词是一个新的搜索短语,不再局限于字面匹配搜索词本身,而且该文件列表的分类考虑到了创新的综合模型学术价值,基于相关性和相关性。术价值的全面评分机制提供了搜索结果的有序输出。

模型具有一定的科学性和实用性,但其分类和评分机制需要在未来的研究中进一步完善和改进。扩展模型主要用于需要高召回率的学术系统和网站。键词:学术搜索引擎扩展搜索文献中的模型中图分类号:G64文献标识码:A文章编号:1674-098X(2015)06(c)-0243-01本文不同于网站或搜索引擎系统的。
大学研究搜索引擎是一种搜索引擎的专门为知识库,对象是比较独特的,这是一种数字资源,如期刊和文学。文以CNKI为例。前搜索学术搜索引擎的模式一般采用传统的搜索模式,如布尔模型和矢量模型[1]。种类型的搜索无法与搜索到的关键字完全匹配,同时忽略了其内在含义的相似性并降低了学术搜索引擎的召回率。文介绍了一种更全面的搜索模式,以提高恢复效率。本文中,该模型统称为扩展模型。论基础当用户输入搜索词时,他返回包含相关信息的文献排名列表。
列表的确定取决于关键词或文档主题与从属于搜索词的词之间的对应关系。
列表的排名取决于文献与研究术语和文献学术价值的相关性。文基于文献所属期刊的影响因素来评估文献的学术价值。

此,一旦模型获得了期望的术语,首先,根据已建立的主题词汇表(表1),开发和扩展从属词以成为扩展的搜索词,然后是文档标题或关键字是从库中提取的。
伸研究短语的文献;然而,搜索词和其下属的字可以给(第三部分将详细介绍),对相关文献的分数可以计算并可以根据获得的文件清单相关的不同的权重,作为确定的评分机制得分。模型引入了提高基于文献中的专家恢复方法文学的召回率的模型[2]结合专业词汇,也就是说,在这之后用户输入了搜索词,词汇表用于开发搜索词。体设计如下。题词汇词汇的第一和第二词汇是通过在中文分类的主题词汇中按主题对词汇的相应分类来构建的。
业化的词汇分为三个层次。一和第二的词汇列于表1。每一个二级字,是适当的建立第三级的对应文件:从大量对学术研究成果的关键词集合长搜索周期揭示了搜索结果内容的一般特征和搜索内容之间的固有内容。系,大学的研究和开发指南[3]的发展,本文所使用的数据库CNKI 2010年至2014年中国文学的网络,其中列出了所有关键字,词汇的三个来源水平。定文档列表用户输入搜索词后,搜索词的子词将用于开发。二,
宁波seo根据文献的标题和在文件CNKI数据库的表中的关键字,生成包含在标题或关键字搜索短语范围的文件。是与查询主题相对应的专业文献。
献的排名的排名是根据两个方面:第一是基于文献和搜索项的相关性,二是基于文档的学术价值。此基础上,尽管文献的最终成绩与包含搜索短语的文献中的单词数量有一定的关系,但这并不意味着两者绝对正相关,而只是对于同一文档,用相关的词。

着数量的增加,最终得分也会增加。
后,从文献中的最高分到最低分获得有序的文档列表。常,标题和关键字可以关注于文章的主要内容,即,文档的标题和关键字用于衡量相关性。据仿真程度,为它们分配不同的系数。0.6和0.4(式(2))。次,在搜索短语中,单词本体及其下属具有不同的相关程度,并且它们的权重设置为0.7和0.3(等式(4))。后,由于期刊的层次不同,它们的权威性也不同,因此期刊影响因子可以用来衡量文献的学术价值。关系数和学术价值分别固定在0.8和0.2(公式(3))。号公式为:Wk = Skrel + Skval(1)Wk是文档k的得分; Skrel是文档k的相关性分数; Skval是文件k的学术价值分数。Wk =(0.6×Pktil + 0.4×Pkkey)+ Skval(2)Pktil是搜索短语的单词出现在文档k的标题中的频率; Pkkey是搜索短语的单词出现在文档k的关键字中的频率。Wk = 0.8×(0.6×Pktil + 0.4×Pkkey)+ 0.2×Skval(3)Wk = 0.8×[0.6×(0.7Pkts + 0.3Pt)+ 0 ,4×(0,7Pkks + 0,3Pkke)] + 0.2×Skval(4)和PKTS Pkte是搜索术语和词语的扩展标题中的频率,分别Pkks和Pkke是的频率本体和在文档关键词中出现的词汇。计算3.2节中获得的文档列表中每个文档的分数后,您可以通过对分数进行排序来获取有序文档列表。
论该模型的创新之处在于打破布尔模型和矢量模型等传统模型的刚性匹配模式,并通过从属词匹配提高模型的召回率。

智能的恢复。

时,在分类时考虑学术价值因素。模型可用于需要高召回率的系统。而,该模型也存在一些缺陷,其评分标准需要改进和进一步研究,同时提高准确率。
考文献[1]王娟琴。种研究模型的比较研究:布尔方法,概率,向量空间模型[J]。报科学,1998(3):225-230 260. [2]卢伟,刘杰,秦希言。于专业知识词汇的图像领域专家研究与评价[J]。国图书馆学报,2010(2):70-76。3]李文兰,杨祖国。文报刊信息科学关键词频率分析[J]。
报科学,2005,23(1):68-70,143。
本文转载自
宁波seowww.leseo.net
补充词条:
宁波网站优化推广
宁波seo网站优化
宁波seo排名
宁波网站seo
宁波seo推广公司