随着大数据的出现,如何从大量信息中选择人们需要的信息成为一个关键问题。帮助用户更好地获取所需信息,本文档旨在通过两种方式提高搜索引擎性能,构建智能搜索引擎,并帮助用户找到所需信息。们需要在信息的海洋中。绍查询建议,为用户提供查询内容的查询建议,并帮助他们更好地找到所需信息。键词智能搜索引擎;相关性;审讯推荐;审讯的建议;数据挖掘CLC编号TP39文件识别码A文章编号1674-6708(2015)130-0129-01简介当前时代是大数据,商业,社会,科学和技术我们日常生活中的医疗和医疗数据被注入互联网并存储在各种文件中。设备中,可用数据会爆炸。何在这些一般信息中获取人们所需的知识是非常紧迫的。索引擎技术诞生并在当时流行起来。过二十多年的发展,搜索引擎取得了显着成效。天,为了更好地帮助用户找到他们最需要的信息,减少内容的偏差和遗漏,搜索引擎开始智能地开发,本文提供了两个实现搜索引擎智能的方面,即提高恢复的准确性。容推荐。关内容查询表明,在搜索引擎中使用传统查询时,很可能会出现以下情况:1。户主要查询他们习惯的网站,但会错过新网站随着与设计相关的网站数量的增加;由于用户不完全理解查询的内容,他无法细化关键词,同义词中文丰富。某些情况下,不同的词汇涵盖不同的内容,导致偏差和请求结果的不完整性。要搜索引擎来帮助用户继续通过被搜索的网页查询相关内容,包括网站和相关关键字。是查询建议。度用作相关网站的示例。搜索网站时,百度将为用户提供与网站主题相似的网站,以供参考。如,如果您进入Dangdang.com并点击百度,除了显示有关当当网的各种信息外,您还可以向用户提供指向“假设您喜欢”的其他相关网站的链接。如:淘宝网,京东网等搜索引擎描述了网站的主题,该描述主要涉及关键字的提取。先分析网站作为一个例子,消除噪音,例如:广告,各种无关信息等,然后考虑到文本不同部分的权重(如标题,摘要更有可能生成关键字,所以增加这些内容中关键字的计算。
权重,计算密钥权重的公式是(1)。

定关键字后,创建网站模板。
L:模型;重量;问:关键字数量。用相似度计算算法查找相关主题的网站。索引擎将提供类似于用户的网站。在许多类型的相似度计算,并且基于矢量空间模型的相似度计算在此是最广泛使用的。文本中提取的关键字是矢量化的(P1,P2,P3,... Pi)。每个关键字定义权重,即(Pi),其构成向量空间。P =(P1,P2,P3,... Pi),
宁波seoP` =(P1`,P2`,P3,...... Pi`)。几个公式用于计算两者之间的相似性:矢量余弦系数:)内部乘积矢量:)骰子系数:)雅各卡系数:相关的关键字推荐类似于相关的网站查询,当我们将查询的内容输入搜索引擎。后,搜索引擎将生成与关键字匹配的相关内容。如,查询百度“量子力学”,它将生成相关的字符,例如:ErwinSchrödinger等。联规则挖掘技术可以支持此功能。据挖掘是从广泛的信息中提取可用的模型。标是使用用户日志计算在搜索问题时由不同用户处理的相关搜索,并将其作为查询建议推荐给用户。联规则挖掘技术关联规则是一种挖掘技术,用于在规模数据中查找频繁的关系模型。
义项集I = {i1,i2 ... im},事务集D = {d1,d2 ... dn}。于每笔交易,交易。

联规则的形式为X→Y,其中X,Y是I和Y的子集。则X→Y的支持是交易集中包含的公司的百分比,规则X→Y的可信度是当X出现在交易中时Y出现的概率。式如下:一旦定义了阈值,我们就会根据提取算法提取阀门关系之上的规则。用户的搜索内容相关联的知识被提供给用户。助用户更好地理解他们需要的内容。束语本文介绍了智能搜索引擎,它引入了轮询推荐功能,通过为用户提供相关网站和查询相关内容来提高用户召回率。考文献[1]兰维贞,李海生,智能搜索引擎技术及其发展趋势[J]。技信息,2010(28)。
本文转载自
宁波seowww.leseo.net
补充词条:
宁波网络seo
宁波网站seo
宁波seo网站优化
宁波网站优化推广
宁波seo哪家好