宁波网站优化:用于电子商务导航的智能搜索引擎

发布时间：2019-02-18 00:20:37

　　电子商务的成功基于许多要素，包括客户可以快速准确地恢复他们认为合适的产品。此，与目前互联网搜索技术的局限性相比，有必要研究更好的搜索引擎的性能。虎和AltaVista等第一代外国搜索引擎取得了成功，一些新的搜索引擎如askjeevs，Google，Gurunet和高级搜索也已付诸实践。们的特点是使用一系列新技术，包括自然语言处理技术，使搜索更加智能，更快速，更轻松地查找信息，并为用户提供更全面的信息服务。中国，随着中国文化环境中网络用户数量的爆炸式增长，中国互联网信息越来越丰富。此，中国的信息处理将拥有更广阔的市场，必将带来智能中文搜索引擎和信息处理在线实时机器翻译等技术的重大突破。国。是，由于中国信息处理的特殊局限性，需要加强智能技术在中国搜索引擎中的应用。本发展信息有限公司由北京互联网媒体实验室，北京邮电大学研究联合会，宁波网站优化解放军总务部军备项目“智能中文搜索引擎”在该领域开展了有益的探索。国家863智能计算机主题融资问题，旨在探索提高中国搜索引擎智能水平的方法，带来了重大的理论和实践成果，可用于电子商务。目前的状况下，如果中国的在线搜索引擎想要取得重大突破和创新，就必须依靠以下两个具体任务：必须非常清楚地了解当前技术的局限性。文搜索引擎。此基础上，提出了新的设计思想和搜索引擎架构。用先进的搜索方法和人工智能，中文自然语言处理等技术实现设计思路。个过程需要大量扎实的基础工作。前使用的互联网搜索引擎的传统信息检索限制一般采用两种技术来获取信息检索：首先，使用网站分类技术，即分类网站。
　　连接的站点属于每个站点的至少一个类别有简要说明。虎就是这种情况。了准确地对科学进行分类，有必要建立一个由各种工作人员组成的维护团队。二是使用全文搜索技术。象提供带文本的全文搜索技术，可以创建一个倒置的单词索引（单词）来记录大量文档（这里是大量的数据页面），在此基础上，用户在文档（网页）中使用关键字在查询期间，系统将包含关键字的网页返回给用户。般来说，由于使用个人（专家）对网站进行总结和排名，网站分类技术对于浏览网络信息非常方便，并且受到用户的好评。是它的缺点加上成本较高，而且网站的描述也很简洁，其能力无法描述网站内部的深层细节，因此用户无法查询网站中的重要信息，导致信息丢失。图，“阿森纳”（www.business-ls.com/weapon/）是一个充满激情的军事概况，排名搜索引擎，它是“政府和政治>军事>武器和军备”，他说。述是“各种武器，火炮，坦克，导弹和军用飞机的介绍”。户可以使用关键字“武器”，“火炮”，“坦克”和“军用飞机”访问该站点。而，该网站已经推出了各种反坦克导弹，因此在网站类别中使用“反坦克导弹”的关键字查询无法找到该网站因为其简要说明不是反导弹-chars。串字。

宁波网站优化:用于电子商务导航的智能搜索引擎技术_no.130

　　样，该网站已经推出了几种类型的“化学防护设备”，但使用“防化设备”这个词作为审讯的关键词没有找到该网站。文搜索是一种非常成熟的技术，可以解决搜索网页细节的问题。论上，只要某个关键字出现在网页上，全文搜索就可以用来搜索网页上的关键字匹配，但这会导致其缺陷：太多信息被退回。如，查询“构建”搜索引擎中的单词“链接页面”返回147，950页，假设一个人在三秒钟内检查显示一个网页，并没有丢失任何需要想象12小时会发生什么。就是所谓的“文海针”。外，除了完整的搜索引擎站点现象之外，大型站点现在返回大量网页以在其自己的站点中检索信息。统的文本信息检索通常使用召回和精确度来定量评估检索效果，但在通过因特网大量检索信息的情况下，使用召回和精确度来确定是否影响恢复是合适的。？有时，数千页结果的高召回率严重影响用户：在当前网页的爆炸性增长中，没有用户有时间和精力去浏览搜索引擎。个页面“返回太多页面”只是给搜索全文直观感受问题，此外，它还有两个不太直观的深层问题，还有很多难以检索的信息。两个问题与词汇密切相关：一个是“忠实表达”的问题。许多情况下，用户难以简单地使用关键字或关键字字符串来准确地表达他们确实需要检索的内容，并且搜索难度导致搜索困难。一个是“差异”。人类自然语言中，随着时间，地区或领域的变化，相同的概念可以以不同的方式表达。此，对于相同的恢复概念，不同的用户可以使用不同的关键词，例如“计算机”和“计算机”，“航天飞机”和“航天飞机”。雅虎上使用“航天飞机”并没有找到包含“航天飞机”的页面，尽管它们指的是相同的东西。前，由于各种电子商务网站的产品信息以传统的关系数据库的形式组织和存储，所以使用的搜索引擎也是基于的搜索引擎。系数据库。类恢复的基本原则是使用用户提供的恢复密钥字符作为恢复输入，在关系数据库中执行机械或模糊匹配，然后返回信息。果对应用户。种传统的关系数据库系统对结构化数据处理非常有效，经过长期的发展，其功能得到了极大的改善。是，它处理非结构化数据的能力很弱：它无法处理用户常见的常识知识，或者因用户和区域而异的个性化知识。域知识和专业知识因领域而异。索上述所有信息有困难的原因是什么？通过对现象的本质研究，我们认为困难的本质在于缺乏知识处理能力和搜索引擎理解，只有关键词的机械目标才能用于恢复要恢复的信息。果搜索引擎“知道”“航天飞机”是“航天飞机”，用户购买“摄像机”并且他可能会购买“电影”，情况就会大不相同。
　　于知识（或概念）级别关键词改进当前级别信息的检索是解决问题的基础和关键。此，我们提供新的搜索引擎设计思路。“网络到网络” - 智能恢复的解决方案为了解决上述问题，我们提出了“网络到网络”的思想，以提高搜索引擎的智能水平。里的第一个网络是人类认知网络，它实际上是一个知识库或一个巨大的概念图，它存储人类知识，包括概念和概念之间的关系。在计算机上实现时，该网络的知识表示是语义网络。们也称内联网，它对应于互联网，是一个“内部”网络：首先是因为它反映了人类知识的概念而且是内在的东西，第二个是实现物理上的计算机它存在于搜索引擎的服务器端，构成我们可以建立和维护的内部网络，它对应于外部Internet。二个网络是Internet，其信息是搜索引擎想要检索和查询的对象。本质上讲，两个网络都代表着人类的知识：互联网是一个巨大的非结构化和不断变化的知识空间，而Innernet则是一种组织和构建互联网信息的努力。Innernet对Innernet组成的知识是一个庞大的知识库，知识大致可分为三个层次：语言层面：语言反映表面现象的知识，多种语言（中文，英文）作为形式这个词，它的同义词，反义词，一些成语，单词的等级关系等。体层面：概念本体的定义和解释，概念之间复杂的语义关系。识：如服饰和领带，相机和电影等，有一个常识。实上，上述三个层面的知识很难分开，为方便起见，我们之间存在分歧。计算机处理期间，我们使用语义网络来表示这种知识。
　　言是整个系统处理的核心，因为语言是知识的载体，人们的理解和常识必须用语言来表达。检索信息时，用户的查询和系统查询的结果都以语言表示。此，我们特别重视自然语言处理技术在搜索引擎中的应用。用Innernet Innernet的互联网信息研究来获取互联网上的信息检索，与搜索引擎相比，允许搜索引擎从关键词搜索增加到基于知识的研究。过传统关键词恢复的手段，它具有显着的优势。者都是示意性的：图1是上图中的信息搜索关键字方案，以常规方式搜索关键字信息以匹配从互联网检索信息的字符串复杂，不可避免地导致基于信息寻求的困难。2上恢复基于Innernet信息的示意图内网信息后，首先检索用户是否匹配内网，关联和访问Innernet的相关知识，再次上网用于信息搜索。是一种基于知识的信息检索过程，允许用户更快地定位项目，了解更多信息并了解更多信息。际上，所谓的“网络到网络”的本质是有序的知识库（Innernet）与无序的知识库（Internet）。以看出，基于Innernet信息搜索与传统搜索引擎相比，具有以下特点：*全信息服务：由于知识库导航，搜索引擎将一个全新的面貌，为用户提供更全面和综合的方法信息服务，这里搜索信息只是信息服务的一部分。*智能信息服务：智能来自知识，以全面的知识库为基础，搜索和导航服务将更加智能。别知识内联网帮助解决语言中提到的“差异表达式”前面的问题，例如，只要定义“计算机”，“计算机”，“计算机”之间的同义关系就可以消除因为使用不同的词来表达同样的概念所引起的研究难度。一方面，基于Innernet的本体知识和常识，用户的查询是相关的，并提供指导用户下一个查询的线索。户交互过程中的这一步骤鼓励他“表达”他真正想要的智能查询导航。种逐步细化的策略解决了搜索信息中“忠实表达”的问题。于恢复多语言信息的问题，它也可以在语言上解决。*信息服务的定制：内联网知识库可以存储与特定用户相关的知识（用户的专业兴趣，购买力等），搜索引擎将使用这些知识来为用户提供个性化的信息服务。
　　*支持代理的能力：由于Web服务器具有完整的知识库，因此它是智能代理活动的基础。如，客户端代理可以主动观察用户的网页，分析内容，并推荐具有类似内容的其他网页以供用户参考，这取决于用户的数据库。务器知识。*能够灵活地与电子商务相结合，以导航电子商务。于内联网的信息搜索的可行性内联网上的互联网映射，包括概念映射和概念 - 关系映射，是一种知识获取过程。是，建立一个理论上完整的内网是不现实的。际上，人类知识，特别是常识知识，具有大量的“数量”，并且“质量”存在高度的不确定性和模糊性。难建立这样的知识网络。是，这不会影响基于Innernet的信息检索模型的可行性和可操作性。际上，虽然理论上完整的Intrernet很难实现，但我们可以通过减少解决方案的目标，为搜索引擎的特定需求建立相应的知识库（或概念图）。似，部分实现。所有领域甚至网站的所有页面中反映的知识建立一个小的本地知识库相对容易。在数量和质量上的知识无法与理想的内部网相比，但它对于特定的研究任务是实用的。重要的是，知识库的知识可以在使用中不断改进，数量在增加，质量也在不断提高。是一个获取知识的过程，可以由人或机器学习完成。们的电子政务和电子商务研究小组建立的知识库在实践中表现良好，并证明了基于内联网的信息搜索方法的可行性。过Innernet获取知识获取知识是人工智能的经典主题。Innernet的互联网数据采集将使用一系列新技术，例如Web数据仓库，Web挖掘Web挖掘和Web数据源集成技术。此，您需要为Web创建适当的数据模型，并使用它来有效地从Web捕获信息。了在Web上处理中文数据，还必须使用一系列中文自然语言处理技术。本技术包括自动分词，机构名称的自动识别，自动索引等。他技术包括信息提取，自动合成，自动文档分类，中文概念词的自动发现以及概念词之间的语义关系的确定。切都很重要。
　　们的实现需要自然语言处理的坚实积累和技能。一个字母搜索引擎是我们的想法的实践。们在北京网络多媒体实验室设计了“第一个字母搜索引擎”，为不同的研究对象提供了两个特定的实验系统。中一个是关于电子政务。是北京政府的网站，名为“首都之窗”。过语料库的语言处理，他发现了与网站相关的概念以及这些概念之间的关系，同时构成了知识库。前知识库中有超过340个独立概念，形成网络中资本窗口的知识，使查询非常方便。一个是电子商务。们使用电子产品和计算机产品作为研究对象。题专家在该领域建立知识库并将其用于智能导航。前，知识库有大约600个独立概念，概念之间有十多种类型的语义关系，涉及常识，产品，制造商和计算机技能。过进一步改进，该系统将与电子商务相结合，为电子商务产品和计算机通信产品提供智能导航。
　　本文转载自
　　宁波网站优化www.leseo.net
　　补充词条：宁波网站优化推广宁波seo哪家好宁波seo推广公司宁波网络seo公司宁波seo排名

乐华观点

上一篇：宁波seo:论现代技术在中职电子商务网络教学中的

下一篇：宁波网站优化:搜索引擎客户端的智能和个性化设