本文分析了当前通用搜索引擎的原理和体系结构,并探讨了通用搜索引擎在应用于校园网信息搜索和校园网信息特征时的不足。结了校园网搜索引擎的特点和构建。要。键词:搜索引擎内网校园中图分类号:TN915文献标识码:A文章编号:1672-3791(2012)01(b)-0013-02随着学校的不断发展,学校拨款越来越多的关注数字校园的建设已迅速进入信息技术的快速发展阶段。

着学校校园网络的不断完善,这需要一个良好的师生教学,研究和信息管理平台。前,校园网资源日益丰富。何以更加完整和准确的方式获取最新,最有效的信息已成为我们抓住机遇的重要条件,迎接挑战并取得成功。度和谷歌(Google)等一般搜索引擎提供学术搜索服务,以搜索某些大学的校园网络,但也存在一些问题,例如竞标周期。长时间,无法从校园网络访问信息等因此,专业的大学信息资源设计搜索引擎对于共享大学信息资源,提高大学信息资源的使用至关重要。用搜索引擎的架构和现状在互联网发展的早期,网站相对较小,搜索信息相对容易。而,随着互联网的爆炸性发展,普通网络用户希望找到所需的信息,这看起来像大海捞针。经出现了一个满足大众信息研究需求的专业研究网站。索引擎架构是一种由信息检索(IR)技术开发的技术,它是Web上IR技术的扩展。索,表示,存储,组织和查询信息。代意义上的全文搜索引擎指的是利用某些策略从因特网收集信息并在组织和处理信息之后向用户提供恢复服务的系统。有三个主要功能:提前下载信息,提前组织并实时检索。索引擎也是信息搜索学科的典型应用。

索引擎主要由搜索器,索引器,检索器和用户界面组成(参见图1)。前,搜索引擎的发展状况根据收集信息和工作的不同方法分为三类。(1)基于目录的搜索引擎:对主体进行人工汇总和分类,手动创建信息摘要,并将信息分类到预定的分类目录中。多数信息都是关于网站,提供目录导航服务和直接恢复服务。户可以将查询限制在某个目录。于人的智能和导航的质量,这种类型的搜索引擎具有需要手动干预,不完整信息和不合时宜地更新信息的缺点。些搜索引擎的代表是:第一个雅虎,麦哲伦等。(2)机器人搜索引擎:这是一种用于网页的全文搜索服务。

机器称为蜘蛛自动收集在深度优先策略互联网上的信息(或宽度先全部),存储在由索引器,
宁波seo优化这是基于用户数据库和索引所收集的信息,由换热器。询查询索引库并将相应查询的结果返回给用户。种搜索引擎的优点是它不需要人工干预,大量信息和快速更新。点是返回的信息太多,而且有很多不相关的信息。户必须过滤结果。些搜索引擎的代表是谷歌,百度和其他人。(3)元搜索引擎:搜索元搜索引擎不执行网络搜索,也没有自己的数据,但同时将用户的查询提交给多个引擎,然后合并并重复删除每个搜索引擎返回的结果。组和治疗后,返回用户。种搜索引擎的优点是它可以在短时间内提供相对完整和准确的信息。点是所使用的搜索引擎的功能无法充分利用,用户需要做更多。些有线引擎的代表是MetaCrawler,InfoMarket等。
建校园Intranet分析搜索引擎的需求校园网可以被视为内部网学校内部网,与Internet一致。是,由于应用环境,网站建设和链接结构的不同,校园网与搜索引擎的公共互联网存在很多差异。于搜索引擎的校园网络,其目的是要注意校园网络的所有用户,让收集尽可能多的信息的校园网和区分研究的目的上互联网完整的通用搜索引擎。园网的搜索引擎必须“小而完整”才能收集信息。
外,校园网的搜索引擎应易于开发,部署简单,实施成本低。谁希望了解校园信息可以检索通过校园网的WWW服务器信息,所以功能需求,教师和学生等方面就可以迅速获得来自不同部门的各种信息从学校。园网的网络信息特征随着校园网建设的快速发展,信息管理时代的到来和共享信息资源的快速增长,网络信息校园正以惊人的速度增长。目前为止,我们学校网络中心存储的信息量至少为200 G,其中不包括分散在各个学院和大学的信息量。
然校园网络有许多好处,但在线资源分布在整个网络中,用户无法快速准确地找到所需信息,从而将资源与园区网络隔离开来。汇集了老师和学生。互联网上快速查找有价值的信息更加困难。析在校园内创建内部网搜索引擎的必要性。(1)通用搜索引擎包含大量信息。息缓慢更新,采用拍卖排名机制。(2)无法检索校园Intranet上的某些信息。(3)随着学校的不断发展,学校对信息技术的建设越来越感兴趣,发现越来越难以迅速获得有价值的信息。职员工和学生。区网络搜索引擎的功能(1)网站园区网络网站通常集中在一个或多个IP地址段中。站之间的链接很少。于部门由不同的组织和个人管理和管理,因此一些网站很难。据其他网站的链接,网站的重要性与网站的大小不成比例,例如,新闻和论坛网站包含大量页面和链接密集,而教学和管理网站则相反。

(2)信息的模糊性校园网网站上包含的信息基本上是对学校内容的描述:对于某些词,与互联网不同,它有自己的背景,并且看起来并不含糊。(3)异构文本网页比例高互联网上常见的网页通常有静态网页(文件后缀为htm,html,shtml等),动态网页(文件后缀为asp,jsp,php等)和各种文件(文件后缀是doc,pdf,ppt等)。doc,pdf,ppt等文件类型称为异构文本。园网络通常包含各种学术资源,如图书馆和散文,这些资源通常作为异构文本发布,这是校园网络资源的一个重要特征。(4)用户查询习惯因特网上的查询通常没有特定的期望:与同一查询词相关联的返回数十或数百。索引擎可以使用“链接”分析和其他技术将“重要”网页置于首位,并获得满足用户的查询结果。园网用户通常具有明确的查询期望,例如专业的专业介绍,服务细节等。好的搜索结果通常不具有明显的特征,并且通常不是具有许多链接的“重要”页面。此,排序算法需要更多的分析和相关性的比较。

论当前的搜索引擎服务对象通常针对所有的互联网用户。然通用性很好,但检索的信息量很大,没有空间限制这不适合特定的服务区域。果将传统的互联网搜索算法直接应用于校园网,则很难为用户获得满意的搜索性能。此,建议用户提供小型专业搜索引擎,仅限于搜索网络并限于校园网。
本文转载自
宁波seo优化www.leseo.net
补充词条:
宁波seo优化公司
宁波seo哪家好
宁波seo外包
宁波谷歌seo
宁波seo网站优化