为了监控高校网络,以及高校舆论传播的特点,本文提出了一种基于网络的舆情监测系统监测系统。

Nutch搜索引擎技术,用于在校园网和元搜索引擎上搜索信息,以获取互联网上的相关信息。键词数据库的匹配方法用于自动监控网络上的舆论,及时准确地发现舆论信息。键词:互联网上的舆论; Lucene的; Nutch的;元搜索引擎;信息检索中图分类号:TP309.2文献标识码:A文章编号:1006-8228(2014)19-19-03基于技术的校园网舆情监测系统研究荷兰搜索引擎和metaNie YanAbstract:由于舆论监督工作不充分,结合高校舆论信息传播的特点,提出了综合舆情监测系统。于元搜索引擎的信息功能技术在互联网上使用,关键字特征库匹配用于实验的自动监控,并且从中发现舆情信息。时准确的方式。论监测,分析,指导和评论,形成完善的应对机制。键词Ss:舆论; Lucene的; Nutch的;元搜索引擎;信息搜索引言教师和大学生组成了一个网络利用率极高的群体,这也是影响舆论的主要来源。校舆论的形成可以解释为三个主要原因:第一,由于国内外热点话题的引发,第二,在线讨论国内不可预见的事件。校内外,第三,在线电话涉及教师和大学生的利益。年来,由于政府对社会的持续信任危机,高校对网络应急响应机制的研究越来越感兴趣。
时,随着公安部开展的网络信息安全工作的逐步加强,利用自身的技术优势,自主建设舆情监测系统和建立全面应对机制正在逐步成为大学网络信息安全工作的重点。此,在新形势下,在紧急情况下,高校如何尽快在网络上收集相关信息,监控情况,及时通知相关部门,防止滥用网络实践的迅速传播和发展并建立适当的匹配?有效管理和控制网络舆论的应对机制,已成为维护学术稳定,促进社会文明发展的引擎,已成为当务之急。须紧急解决。
校舆情信息网络由两个主要部分组成:一个是校园独立的内部网络,另一个是外部开放的互联网。着大学校园信息化建设的深入发展,校园网网站,论坛,博客等平台上的信息资源数量呈指数级增长。动提取和信息传播审计方法不能有效地监视网络意见信息。切需要技术手段来分析和利用大量网络信息,并迅速将其汇总成舆论信息;互联网上的信息量非常重要,通过垂直搜索引擎获得的高校信息往往存在召回率低的缺点。高校网络舆论的监测不仅要考虑信息收集的深度和广度,还应该提高系统的准确性和精确性,同时允许找到并快速监控公众意见信息。于上述网络意见监测工作存在的不足,本系统提出了构建高校网络意见监测系统的总体方案,并针对以下几个方面的网络处理:监测,分析,指导和反馈。
成固体响应机制的方法系统结构大学网络舆情监测系统由三个功能模块组成,即:校园网络意见信息采集模块,舆情信息采集模块。互联网上,舆论分析和预警模块。1大学网络舆情检测系统的体系结构对校园网络有较好控制的高校,可以通过各种公共广播系统的管理平台获取一些信息。据库的信息和访问权限,另一方可以使用网页爬虫。
据采集方面,以Nutch搜索引擎技术为基础的系统,用于收集校园网络的信息,收集的深度和广度都取得了良好的效果。于互联网上的大量网络信息,如果垂直搜索引擎用于数据收集,所获得的数据质量较差,因此系统使用元搜索引擎技术获取互联网信息,这不仅提高了信息收集的相关性,而且提高了信息收集的范围。围此外,对于某些特定网站,可以采用上述两种方法的组合,以及网络爬虫和搜索元引擎的技术来改进系统监控精度。络舆情预警模块自动使用关键词数据库匹配方法和机器学习算法自动监控网络的舆论。时准确地发现公共信息和与系统界面的连接,如短信预警,以提供公众的实时信息。统主要功能模块Nutch搜索引擎和校园网络上的信息搜索Nutch是Web搜索引擎的开源Java实现,它增加了基于Lucene的网页数据捕获功能,提供创建搜索引擎所需的基本工具模块,包括:Web机器人,文本分析,分词工具,索引,搜索功能和结果过滤。
Lucene是一个高性能,可扩展的信息检索库,它为Nutch提供了一个API,用于索引和搜索文本,索引和搜索应用程序,以及直接从桌面检索数据。据库通过Lucene数据库接口。引并提供搜索界面。用Nutch搜索引擎作为在校园网络上收集公共信息的工具不仅可以缩短开发周期,提高开发效率,还可以实现高质量的数据收集。园网通过其内部接口及其插件机制。Web Crawler模块用于收集校园网网页文件的信息,Lucene接口连接到各种异构数据库,Nutch插件机制用于实现Word等文档,Excel和PDF使用POI和PDFBox插件。读以上三种方法可以收集园区网络中多个异构数据源的信息。搜索引擎和用于因特网信息的元搜索引擎是由独立搜索引擎构建的搜索引擎。搜索引擎没有自己的抓取系统或索引系统。据来自成员的不同搜索引擎(如百度,谷歌,必应等)。

索引擎将用户的搜索请求发送到多个搜索引擎并搜索成员。
引擎查询的结果进行过滤,重复数据删除并返回给用户。
元搜索引擎应用于系统可以有效地提高在Internet上收集舆论信息的范围,准确性和及时性。个独立搜索引擎查询界面的格式和编码都不相同:搜索元搜索引擎中的搜索条件被转换为每个独立成员搜索引擎的可接受格式,然后通过它们各自的查询接口,然后获得生成的HTML源。索文件格式的结果被分析和处理。如,包含在百度搜索引擎返回的结果中的em和href标签。以通过解析和提取标签信息来获得链接地址,页面标题和与标签信息相对应的部分描述。本,上述信息在结构化数据中处理并存储在相应的数据库中。果被过滤和重复数据删除通过最终的结果进行比较和验证的链接地址,以及有关独立成员的不同的搜索引擎获得的网页歌词信息标题,然后进行至分析模块Nutch的文字和细分。引。

档分析和中文分词信息检索的基础是文档分析。档分析主要基于分词模块的语言处理。集信息后,文档分析是主要任务.Nutch的文本分析模块可以处理每个异构文件的结构化标记语言并获得纯文本文件。Nutch的CJK分词模块无法满足中文分词效率和准确性的实际需求。此,比较中国各分词模块后,如我现在分词,过去分词和庖丁ICTCLAS参与庖丁分词是通过这个系统,因为它的开源和其良好的分割。通过Nutch插件机制集成到系统中。原理是抽象类分析器Nutch的实现的配置接口和中国字分割模块的插入限定公共抽象方法的TokenStream(字符串字段名,读取器读取器),它返回一个的TokenStream种类。类型的词从参与庖丁还的TokenStream,所以你必须只使用字段名的参数和驱动器所涉及庖丁输入参数和结果返回给分析类回来。引和信息检索系统为校园网和因特网中的多个异构数据源建立单独的索引文件。了有效地集成索引文件并将它们作为统一索引库提供给Public Opinion Analysis and Early Warning模块,有必要:优化索引文件。引优化实际上包括将多个索引文件合并到一个文件中,以减少索引文件的数量以及在搜索期间读取索引文件所需的时间。Nutch中的IndexWrite类提供了实现此优化的优化方法。化完成后,可以使用Nutch中的MultiSearcher类执行优化索引的统一搜索功能,并按指定顺序组合搜索结果。据高校民意调查的特点,系统采用个性化的排序机制,基于信息的相关性,实际情况和访问量。Lucene的文本相关性公式被用作信息检索的主要分类基础。问时间和次数是重要的排序因素:系统使用Lucene的激励因子增加值来改变文档的分数来调整文档的顺序。息预警系统使用关键字功能的数据库匹配和自动学习算法的组合来提供对公众意见信息的快速警报。实体数据库中组合关键词后,检索舆情信息索引数据库,获取相关信息,通过比较获得发现的最新意见信息。数据库的历史记录。
过分类算法对新发现的抒情信息进行分类,得到抒情信息分析的结果;系统提供人机交互界面和优质信息显示界面,通过消息界面将高级警报信息发送给网络舆情监测人员关于感觉的简短,及时的发现和快速警告信息。对机制研究除了预防和监督的技术手段外,网络中的高校舆论还必须建立一个合理的组织结构,以便在发生紧急情况。络突然强烈的舆论,因此大学需要整合各部门的资源,并建立一个专门的网络应急响应小组(见图2)。长直接担任党委小组组长和宣传部门。校办公室,教育部和网络中心是重要成员。
他部门正在密切合作,在网络干预的情况下建立一个有效的应急响应小组。旦发生在线舆论事件,应立即启动应急计划,并应包括信息收集,分析和干预,部门联系和各机构的反馈。询。有部门都在网络应急响应小组的统一领导下。有计划链接可以同时开始。必要建立技术手段和思想训练,防止形势扩大,试图迅速,迅速地解决舆论危机。2网络应急响应小组的组织结构图结论基于Nutch技术和元搜索引擎的大学网络意见监测系统是通过对网络的研究实现的。
学网络的舆情监测系统,解决了收集多个数据和恢复异构信息的困难;引入元搜索引擎技术,以补充与源搜索引擎的连接,允许高回调率,使用关键字,敏感词签名数据库和学习算法自动分析和处理信息收集,提高了系统的准确率终于被允许在网络中快速检测并提醒公立学院和大学,从而克服的监视技术的弱点高校网络意见,通过网络舆情的自动收集,分析和警示取代手工操作,改进工作。速准确地发现抒情信息的效率和能力。前,系统使用关键词匹配来发现舆论信息,
宁波网站优化并使用分类算法对发现的舆情信息进行排名,从而为公众带来更好的结果。知关键字的公众意见信息,但有关未知关键字的信息。前尚无法进行有效监测,今后将进一步加强这一领域的研究。着学术网络舆情监测系统的部署和适应机制的实施,高校可以快速识别,快速响应,控制突发事件,积极引导和调整应对措施。怨网络,促进高校稳定和谐发展。
本文转载自
宁波网站优化www.leseo.net
补充词条:
宁波seo排名
宁波seo推广公司
宁波网站seo优化
宁波谷歌seo
宁波seo优化公司