协同过滤技术的核心思想是用户倾向于将产品用于类似的用户群,并在智能搜索引擎中发挥重要作用。同过滤推荐系统使用统计技术来搜索最接近目标用户的多个邻居,然后基于最近的评估来预测目标用户对目标项的评估。元素旁边,并生成相应的推荐列表。文分析和设计了智能搜索引擎的协同过滤技术,提出了协同过滤分析的推荐方法和相关算法。键词:智能搜索,协同电子商务过滤,引入,随着电子商务的发展,各种电子商务平台得到迅速发展,为用户提供了更广泛的选择,已成为一种传统零售,寻找顾客和购买商品的另一个重要渠道。
着用户数量和产品数量的快速增长,互联网上的大量产品也给我们带来了很多不便,使得搜索有需要的产品变得越来越困难。能搜索引擎已成为解决此问题的方法之一。
于用户的不同兴趣和不同的业务环境,对查询结果的需求是不同的。能和个性化搜索引擎收集和分析用户信息,并根据该信息向用户返回更准确的结果。
常用技术中,协同过滤技术具有很大的优势,是在线购物系统的理想选择。同过滤(也称为社交过滤)分析用户的兴趣,搜索用户组中特定用户的类似用户,并且整合这些类似用户对某些信息的评估以形成用户偏好的预测。此信息指定。

的基本想法是用户倾向于使用具有类似用户群的产品。此,在预测给定用户的使用趋势时,根据用户组的情况来确定。荐协同过滤的主要方法协同过滤推荐技术可以在实际应用中以不同的方式实现。前,主要采用以下方法:基于用户的协同过滤推荐方法,基于现有信息搜索相似度。户计算每个预测的所有用户之间的相似度,并且随着用户数据库的增加,信息的数量增加,并且所有用户之间的相似性资源的消耗太重要为推荐结果提供一个很好的解释。于模型的协同过滤方法该方法基于现有信息创建用户级评估模板,并使用某些技术来识别信息片段之间的关系,然后使用这些关系来预测偏好。户。
于项目得分预测的协同过滤推荐在大型系统中,用户评分数据非常稀缺,导致系统建议质量显着下降。于用户得分数据的极度稀缺,基于项目得分预测的协同过滤推荐算法通过计算项目之间的相似性来预测未评级项目的用户得分,然后使用用于计算用户最近邻居的相似性度量。验结果表明,基于项目得分预测的协同过滤推荐算法可以显着提高推荐系统推荐质量。于用户的协同过滤的上述方法的好处是显而易见的。先,它可以根据用户对用户的相互支持和用户项目评估的相似性对用户进行分类,推荐结果更准确。同过滤技术的算法分析协同基于用户的过滤是最广泛使用的定制推荐方法。根据邻居的兴趣预测目标用户的偏好,并使用其他用户的现有经验。算法首先使用统计技术来查找与目标用户具有相同偏好的邻居,然后基于其邻居的偏好为目标用户生成推荐。滤推荐系统的算法协同算法过滤可以主要分为三个阶段:输入数据的表示:用户的过去行为和使用兴趣由矩阵m表示m×n(如下表1所示),n是用户数。m是搜索结果的元素数,矩阵元素Sij表示第i个用户的第j个结果的评估值。立类似社区:这是协同过滤推荐系统中最重要的一步,它计算用户之间的相似性,作为未来建议的基础。
成建议:从社区成员中获取为目标用户推荐的前n个产品。估值可以是0,1的二进制数或0到9的等级。里使用的评估值是从0到9的分类方法。于确定技术的推荐系统的核心基于邻居的基于用户的协同过滤是为需要推荐服务的目标用户寻找最相似的“最近邻居”,即图1协同过滤中的邻居训练过程:计算目标用户0与其他用户之间的相似度(如计算欧几里德距离),
宁波网站优化k = 5个最近的用户居中在点0上被选为邻居。户之间的相似度的计算可以基于Pearson相关方法和常用的向量空间相似度计算方法。常,存在两种用于确定邻居用户的方法:基于预定的相似度阈值选择相关性大于阈值的邻居用户;基于预定数量的邻居N User选择具有最相关性的N个第一用户作为邻居。生推荐结果产生建议:在生成目标用户的“最近邻居”集之后,可以计算两种类型的结果:用户期望的任何元素的感兴趣值和推荐的N个第一表格。息计算传统的数据挖掘应用程序关联规则可以分析客户对项目的选择,但它们有一些缺点:生成大量规则,其中大多数是显而易见的或不相关的;领域知识和专业直觉,没有提供好的规则来衡量兴趣程度,并从数据中提取有趣的目标。先,事件依赖的统计定义扩展到规则的利益定义.Piatetsky-Shapiro首先将事件依赖的统计定义扩展到规则的利益定义提出了PS方法。
关联规则A→B设置为N.,│A&B│,│A│,B│分别表示数据集D中元组的总数,而满足A和B的元组的数量,满足的元组的数量和满足B的元组的数量这也给感兴趣的规则的定义,并介绍了模型的概念:如果一个规则相匹配的包括模型(包括模型),它被认为是有趣的;如果规则对应于受限模型(限制模型)被认为是缺乏兴趣。前存在问题和解决方案。

于协作用户的推荐还存在分散问题和冷启动问题的缺点:在许多情况下,每个用户只会评估几个项目,即整个用户。
目矩阵非常稀疏,通常不到1%。这种情况下,用户之间的相似性的计算是不正确的,并且获得的相邻用户不可靠,这带来了棘手的问题。
某种意义上,冷启动问题可以被认为是分散问题的极端情况。一个新项目第一次出现时,因为没有用户对其进行评估,因为在新项目开始时用户评估不太先进,建议的准确性也很差。
对上述问题,系统采用以下解决方案:棘手的问题:用户只是简化和评估一些研究结果的评估结果不到10%。于冷启动问题:在系统开始时没有建议,每个用户必须搜索多个搜索项并为页面分配值的评估。些是入场信息,从用户数量大于200开始。
本文转载自
宁波网站优化www.leseo.net
补充词条:
宁波网站seo
宁波网站排名优化
宁波谷歌优化
宁波seo外包
宁波seo哪家好