网络信息的快速增长使信息的定位和获取变得复杂。
过分析当前网络的信息过载问题,比较现有用户模型表示和更新技术,提出行为和操作数据。为数据源,感兴趣的衰减用于漂移用户兴趣的问题,也就是说感兴趣的学习算法和当前的滑动窗口。后,在数字图书馆的自定义搜索引擎中设计和实现用户建模系统,比较普通向量空间的表示模型和用户感兴趣时的后续学习。移证明优化算法更好。达用户兴趣对于提高个性化信息服务的质量具有实际价值。键词:数字图书馆,自定义搜索引擎,用户建模,向量空间模型中图分类号:TN911? 34; TM417文件代码:A货号:1004? 373X(2016)07? 0097? 06总结:网络信息的不断增长表达导致复杂的定位和信息获取。过分析当前网络的信息过载问题,比较现有的用户模型表达方法和更新技术。出了数据源。益减少方法被用于用户的兴趣漂移,其与感兴趣的学习和所使用的滑动窗口算法的使用相结合。比该模型的经验,并通过共同的向量空间表示模型,和学习而获得t时的优化算法感兴趣的可以更好地表达用户的兴趣的监测和在提高高度个性化信息服务质量方面具有实用价值关键词:数字图书馆,自定义搜索引擎,用户建模,向量空间模型简介以用户为中心的服务理念你越往图书馆行业的每个角落。一个个性化信息服务侧重于实现个性化服务的特定技术,如推荐技术,信息检索技术和用户聚合技术。而,随着个性化信息服务研究的深入,人们逐渐认识到个性化信息服务的质量不仅取决于具体的推荐技术,回收技术,也是可计算的说明用户兴趣的特征,后者更具相关性。要[1]。此,对用户建模技术的研究已经开始作为信息服务的核心技术独立。
年来,国家对用户驱动的自定义信息提取模型的研究主要集中在用户模型表示方法,用户建模方法,用户建模技术和用户模型优化。如,最常用的用户自定义模板由以下表示:向量表示,概念的层次表示等。[2]。联网为人们提供了越来越丰富的资源,但迫切需要解决必须从相当多的资源中获取必要信息的问题。户对搜索结果的满意度是优质搜索引擎服务的关键之一。户希望在搜索和访问数字图书馆中的信息时能够获得更智能的服务。种智能服务的一个关键因素是个性化[3]。得用户的搜索趋势:在进行研究时,搜索关键词的分析和开发以及搜索结果的过滤可以在一定程度上提高搜索引擎的质量研究。时,可以定期在网络上搜索新信息并主动向用户提供他们感兴趣的信息。过沟通,不同的用户模型可以更合理,更完美[4]。性化搜索引擎不仅可以提高搜索效率,还可以使搜索结果更加人性化。通过建立用户兴趣描述并为不同用户提供不同的信息服务来满足用户的需求。为个性化服务的基础和核心,用户模型与个性化信息服务的质量直接相关。自定义搜索引擎中,首先探索有关用户兴趣的信息,建立合理的模型,然后管理它们,通过不断的更新和维护逐步优化它们,提高用户需求表达的准确性并遵循自定义搜索。供基础。户建模的理论和技术目前有许多系统提供个性化的信息服务。些常用的方法包括:信息定制服务,最新信息转介服务,专家咨询服务,个人知识管理服务和个性化信息检索服务。实现个性化服务,首先要了解用户的个性,并确定这个用户的兴趣是个性化主动信息服务的基本原则。前,收集用户信息和发现用户兴趣的主要方法有三种:显示获取方法,隐式获取方法和评估反馈。用户信息获取技术中,最常用的方法是前两种采集方法的组合。系统采用这种方法,主要使用隐含的行为信息,需要较少的主动用户参与。式信息主要包括用户的基本信息和用户信息,隐含信息主要包括用户的浏览行为信息和搜索行为信息。当的建模方法可以跟踪用户的个性和使用模式,系统可以不断学习和利用用户的潜在兴趣。统使用有针对性的机器学习方法进行建模。先,很明显,这些行为可以代表用户的利益,并决定他们可以表达的兴趣程度,然后从行为信息的数据挖掘,分析和提取收集用户计算模型信息。针对性的机器学习提高了学习的准确性,并通过调整感兴趣的权重参数来提高模型的表达能力。于用户漂移问题,采用LRU算法和滑动窗口算法的组合。果用户正在主动更新,例如通过修改和提交自定义信息,则活动行为占主导地位并且系统自动更新。果用户没有主动参与,则完全采用系统的自动更新。种方法不仅利用了用户的个性化兴趣,而且消除了用户参与的需要,
宁波网站优化但确保了模型的准确性。户建模系统的分析和设计向量空间模型的一些局限性目前,用户建模过程受到基于向量空间的方法的限制。户建模的大多数信息源都基于用户访问的页面和文本内容,或者基于用户的查询字段;向量空间表示是信息资源的共同表示,但没有考虑域的含义和特征元素的词汇表达。[5]中描述的固有同义词和简单滑动窗口方法,当感兴趣的量大于窗口[L]的大小时,最初到达的兴趣以到达的顺序被移除。以删除一些先到先得但非常有趣的兴趣描述。系统将结合利益下降,兴趣学习和滑动窗口来提高感兴趣表达的准确性。息资源模型必须提供关于用户使用的对象的情况的基本信息,包括至少代码,名称,类别,关键字/介绍。象的特征由类别和关键字表示,即{category,keywords of keywords}。这种表示法中,类别使用的数据结构是树,如图1所示。户兴趣模型在自定义服务用户建模中,最常见的方法是组合显式和隐式方法,使用显式方法获取静态用户信息,并使用隐式方法获取动态用户信息[6]。模的用户信息源包括以下几个方面:用户正在浏览的页面,用户在页面中的行为,例如将网页添加到书签,打印页面页面,复制页面内容,保存页面等,用户的自定义信息,来自用户关键字的搜索行为查询,查询数量,以及最后一次查询的时间。用户使用信息资源(例如某些文档中的导航)时,将使用等式(3)生成并计算资源的感兴趣值。于用户的导航行为,假设它对应于图2.在系列2中,图2中的系列2和系列3分别代表用户的三种类型的书籍风帆。户对系列1的兴趣稳步增加,对系列2的兴趣首先增加,然后减少,然后是系列3,但增长速度较慢。于用户的导航,通过简单滑动窗口算法获得的用户兴趣序列如图3所示。图3可以看出,当兴趣稳定时,模型简单的滑动窗口更准确,但是当用户的兴趣发生变化时,也就是说系列1和2的兴趣变为系列1和3的兴趣,主题变化从根本上说,稳定性是平庸的。果将兴趣衰减,兴趣学习和滑动窗口组合在一起,则得到的用户兴趣表达如图4所示。
日兴趣得分对应于前一天的兴趣得分和当天导航得分的衰减。此,对于三个方面的组合,可以从位于模型的滑动窗口中的滑动对象获得感兴趣的得分图,如图5所示。个过程,考虑到用户利益的权重的减弱,新导航行为的影响,当用户的兴趣发生变化时,虽然有延迟,但是它可以快速调整兴趣跟进的变化,表达能力优于滑动窗口法,更加一致。前情况滑动窗口的大小与用户的平均兴趣,访问资源的频率和资源量有关。户的兴趣越大,所用的资源越多,所需的光滑窗口就越大。统功能设计本文档中的系统功能模块包括信息采集模块,用户建模模块和提取模块,信息采集和检索功能模块获取所需数据。过与客户的互动并提供服务。户建模功能模块是系统功能。心收集系统所需的相关信息,包括基本用户信息,用户行为等,并将从客户端获取的用户信息收集到数据库中,以提供所需的信息。他模块,即系统建模。要数据基于。户建模代理是系统的主要部分。过关注用户模型,使用可调参数建立用户模板,并提供更新模板的方法。用户使用对象时,很明显他对该对象感兴趣。于对象,您可以使用相应的类别代码和关键字或对象的简要说明。

后,根据参数的权重,计算由用户的行为表示的类别的兴趣程度和该类别的某些关键词的兴趣程度,并将结果记录在模型中。户。索代理是使用用户模板提供服务的功能模块,并通过过滤和重置搜索结果向用户提供优化的搜索记录。用户模型,可以知道用户感兴趣的类别。此,可以根据他们的兴趣对不同类别的对象进行分类。以根据关键字列表的分数对同一类别中的对象进行排序。句话说,基于用户模板中的关键字列表和类别得分来计算每个对象的关键字得分。数最高的分数很高。整体设计模式中恢复自定义信息是基于用户的兴趣和特征,并返回与用户需求相关的恢复结果。传统的信息检索系统相比,自定义信息检索系统增加了信息处理,用户建模,模型更新和查询优化等模块。索引擎个性化技术主要包括:建立更好地反映用户偏好的用户模型,用户能够自适应地适应新用户行为和搜索结果用户可以使用后者重新排列。数字图书馆环境中,信息资源是文献资源。定义信息服务的一般设计如图6所示。文档中的系统主要基于服务器。基于通用矢量的用户模型系统和数字图书馆的文献信息资源相比,该系统做了以下改动和改进:对于文献资源,中产阶级分类和关键词列表代表信息的特征;权重的向量空间方法用于对用户进行建模,考虑时间的有效性。用户建模完成后,如果提供的行为信息长于一定时间,则认为它们无效,资源相关性分析,读者与不同类型资源的偏好有一定的相关性,同时优化有趣的缓解和使用过程。量参数。统使用一些可调参数来满足不同应用的需求,如下表1所示。统实现系统的结构采用三层架构模式。于此模型将复杂的业务逻辑与数据操作分开,因此不需要直接与数据库交互,而是通过使用数据库外部提供的接口更容易访问和更易于管理。CAD图层。示和存储信息对于用户的浏览行为,这通常包括为页面添加书签,复制页面的一部分,将页面保存到本地磁盘,打印页面等必须记录表示用户兴趣的这些行为,以及哪个用户同时进行。必须记录要利用的页面,即不需要用户干预的隐式数据。制感兴趣用户的类别是直接显示用户兴趣的一种方式。要Custom和CustomeTime信息,包括用户ID,用户的个性化信息和用户的自定义日期。用户搜索关键字时,系统会对其进行注册,很明显用户对该关键字有兴趣。户搜索行为所需的信息包括关键字,LastSearchTime和Times.En同时,系统必须知道用户的基本情况,并得到用户的基本信息,如姓名,性别,主要等对于数字图书馆系统,需要文档信息支持,类别代码和关键字列表位于流程的中心,类别代码使用图像分类代码这份文件的中间部分。键字列表使用文档中的关键字来表示逗号分隔的关键字,例如数据挖掘,用户模型,自定义和本体。现用户兴趣模型通过分析各种基本和行为信息,您可以获得用户模型,该模型是整个系统的核心,用于重新组织用户的新搜索行为。户或提供信息推荐服务。户的兴趣由兴趣类别,兴趣得分,兴趣水平和类别的关键字表示。
BookCode分类代码的长度是可重置的,BookCode的长度是类别树的深度。户可以拥有多个共同代表用户兴趣的记录。户建模功能实现模拟和实验数据采集测试所需的实验数据是标题,类别代码,作者,关键词列表,鉴于此信息在某些文献网络中如万方数据库,可以获得更多内容,因此,文献被用作对象使用。收集了1,158本书籍。时,提取所有相关关键词和分类号,将候选搜索词存储在SearchWords搜索词中,共获得3,598个关键词。重加权方法具有一定程度的资源相关性和随时间推移的下降模式,与普通用户模型相比具有一些优势。人参加模拟设计,其标识符分别为1到10.感兴趣的点是:政治权利,经济,文化,天文学,生物学,医学和健康,农业科学,工业技术,运输,环境科学。先,随机选择100篇文章,每个类别10篇文章和10个导航行为数据是根据兴趣点随机生成的。统将10个用户自定义项随机生成到关联的类别中,每个类别自定义大约2个类别,并为某些关联的类别关键字生成搜索行为。个搜索大约2个关键字,生成自定义数据和搜索行为数据,并使用该系统。供的方法和默认建模参数以及建模结果如图7所示。用通用用户模型,建模结果如图8所示。模后,其余1,058本书被重新安排给每位读者,假设1,058本书是特定搜索的结果,第一本书是一本非常感兴趣的文件。于系统仅重新组织预期的搜索结果,因此不建议检查全速率。于准确率,总信息为100.由于资源总数有限,因此存在更多不相关的文档和各种用户模板。有明显的区别,因此仅查看前100条记录的准确性更为有利。度与法向量空间用户模型之间的比较如图9所示。图中,关联双权重,用户行为数据和改进的滑动窗口算法的用户模型可以表达更多正是用户的兴趣趋势比矢量空间模型的普通表示更符合其需求。态学习效果测试为了测试学习算法的动态学习效果,首先使用数学和物理课作为感兴趣的样本,以允许用户浏览,定制,搜索数据,然后从序列4开始,逐步改变兴趣,学习有关工业技术的文献并产生行为。据。每次感兴趣的研究之后,重新组织测试样品文献,然后计算准确度。2显示了用户的学习过程。学和物理域的比例符合用户的利益以及后者的准确性和物化增加,这表明用户模型文件中对该字段的兴趣正在增加,学习算法可以动态捕获过程并同时学习。时更新用户模板。后,随着数学和物理学文献数量的减少以及工业技术文献的进一步研究,第一个的准确性呈下降趋势,后者增加。表明,如果用户的兴趣发生了变化,则其他类别的文献中的文献比例和系统中的起源类别将减少。表明学习算法可以合理地“忘记”用户的过去逍遥时光,因为他的兴趣改变并累积用户的近期兴趣。论系统使用用户的导航,个性化和搜索行为,结合作为建模信息源的操作信息,使用基于向量空间模型的增强双向量表示来表达。户特征,以及减少兴趣,学习和兴趣。

动窗口算法被组合以更新用户模型。后,它在数字图书馆的自定义搜索引擎系统中实现,并通过两组实验,即与公共向量空间用户模型的对比实验和当用户的兴趣转移时,后续学习,经验证明该方法可以更准确地描述读者的兴趣。通过用户模型优化搜索结果,具有一定的使用价值。考文献[1]康海燕,李晨。于J2EE的自定义DL的研究与设计[C] // 2008 IEEE-Pacific计算机智能与工业应用研讨会,中国武汉:IEEE,2008:527-531。[2]朱正宇,徐静秋,任翔等人基于自定义Web搜索模板查询开发[C] //进程? 2007年第3届IEEE语义,知识和网格国际会议。[Sl]:IEEE,2007:128-133。

[3]胡燕,吴虎子,钟伟。于词性的中文文本分类特征提取方法研究[J]。
汉理工大学学报,2007,29(4):132-135。4]曲军,林旭。本分类中特征提取方法的比较与分析[J]。代计算机,2007(4):10-13。[5] Shuangmei林,Wang和陈更生Yiqiu.Dans个性化推荐系统用户建模和特征选择[J].Ingénierie计算机,2007.33(17):196〜199 [6张力。于Web数据挖掘的定制信息智能数据挖掘系统模型[J]。技广场,2006(8):53-55。
本文转载自
宁波网站优化www.leseo.net
补充词条:
宁波网络seo公司
宁波seo推广公司
宁波seo外包
宁波谷歌优化
宁波网站排名优化