本文介绍了一个基于Nutch和Solr实现的基础教育垂直搜索引擎,并提供了实现该系统的框架,可以为教师和学生提供专业的资源恢复服务。
小学。
键词:Nutch; Solr的;基础教育;搜索引擎;垂直搜索中图分类号:TP393文献标识码:A文章编号:1009-3044(2012)04-0975-02Mise实施基础教育SolrWANG孝正,侯清垂直搜索引擎(大学数学与信息技术,南京晓庄学院,南京211171,中国)摘要:本文介绍了基于Nutch的和Solr基础教育的垂直搜索引擎的实现,并介绍了架构系统的。

以为中小学师生提供专业的资源搜索服务。键词:Nutch; Solr的;基础教育;搜索引擎;计算机用于垂直搜索和开发网络技术,使信息的传播和共享不受时间,空间限制,也给我们带来了“信息超载”的问题。
对信息的海洋,用户很难通过浏览器尝试发现信息,经常花费大量时间并获得极少的资源。然谷歌,百度和其他综合搜索引擎都很强大,但在使用它们时,他们经常会发现他们所寻找的数据并不令人满意。
究结果面前的许多资源并不是他们所需要的。
于基础教育应用的需求,本文实现了一个垂直搜索引擎,使用Nutch和Solr创建一个专注于基础教育的领域,帮助中小学教师和学生及时掌握基础教育的相关知识。Associated Technologies简介Nutch简介Nutch是一个基于Lucene的开源搜索引擎,是一个集探索,索引和检索于一体的完整应用程序。于商业搜索引擎允许拍卖排名,
宁波seo索引结果与网站内容并不完全相关,而Nutch搜索结果可以给出正确的排序结果,允许Nutch搜索垂直搜索,学术研究和政府网站。是其他领域的不错选择。于Solr Solr现在是一个Lucene子项目。
Solr是一个使用Java实现的开源企业搜索服务器,易于扩展和修改。要功能有:高性能全文搜索,突出显示搜索结果,动态聚类,数据库界面,以及高度可扩展的电子文档处理(Word,PDF等),支持分布式搜索和索引复制。
IKAnalyzer将IKAnalyzer作为基于Java开发的开源轻量级Java分词工具包。基于Luence开源项目作为应用程序的主题,与字典分割和语法分析算法相关联,是中文单词的分词组成部分。用独特的“迭代细分分割算法”来支持精细和全粒度字长的两种分割模式。现在该搜索引擎实现,虽然Nutch的本身具有搜索功能,使用的Solr作为源输入,处理搜索结果可以有效的降低了寻找Nutch的负担,让Nutch的加载他最好的工作:探索分析,检索和分析内容。过使用Solr作为搜索引擎,您可以充分利用Solr Server的搜索功能:拼写检查,搜索调用,数据复制和查询缓存。于Solr本身对中文单词的分割较弱,因此引入了IKAnalyzer来增强其中文分词功能。索引擎框架可以总结如下:Nutch + Solr + IKAnalyzer。
境系统具体实现方法:所需的软件和安装顺序:Ubuntu的10.04:JDK-6u26-Linux的i586.bin,而,Tomcat的6.tar.gz,Nutch的-1.4.tar.gz Apache的Solr的-core-3.5.0。Jar,IKAnalyzer3.2.8.jar。论由于该系统仍处于试验阶段,因此需要对许多地方进行改进。果单台计算机上的扫描操作需要很长时间,则需要创建分布式搜索引擎。Nutch的主要部分现已通过Map Reduce重新实现。Map Reduce是一种分布式处理模型,最初由Google Labs提出。此,构建基于Nutch的分布式搜索引擎并不是一项艰巨的任务。
过基础教育垂直搜索引擎的不断完善,将能够提供强大的专业信息搜索能力,帮助教师和学生掌握基础知识。
育并为他们提供职业指导。
本文转载自
宁波seowww.leseo.net
补充词条:
宁波seo网站优化
宁波谷歌seo
宁波seo哪家好
宁波网站排名优化
宁波seo外包