宁波seo优化专栏

宁波seo优化:应把上一行不满足栏内容复制到当前

发布时间:2018-09-22 18:49:49

  从表4.1可以看出,地址栏确定了每个检索词在表中的位置,条件满足指向栏和条件不满足指向栏分别确定当该词满足和不满足检索条件后应做什么处理,级位栏是根据检索词的运算符等给出的处理优先级,比较条件栏是指明该检索词采取什么方式进行匹配(如前方一致、模糊匹配以及”非“运算等),检索标识栏用于注明检索字段等。
  展开表生成
  把逻辑提问式生成展开表是一个复杂的过程,需要考虑到检索词、检索运算符、改变运算次序的括号等,并生成可供检索匹配的表格形式。整个生成过程分为两部分:前处理和后处理。
  前处理
  前处理的任务是:逐个检查逻辑提问式中的字符,并从上至下填写表格。在填写表格的过程中,对不同类型的对象(如检索词、运算符、括号等)做不同的处理。
  ①对于检索词,则将该词存人展开表内的检索词栏中,并记下该词在表中的地址。
  ②对于运算符,要分别进行处理。对于运算符”+“,表明是两词进行”+“运算,在前一词不满足检索条件的情况下,还可査看后一词。所以,遇上”+“号时应在前一词的”条件不满足指向“栏中填人指向后一词的地址;对于运算符”*“,表明是两词进行”*“运算,在检索过程中必须均满足条件才能认为符合检索要求。所以,遇上”*“号时,必须在左边检索词所在行的”条件满足指向“栏中填人指向后一词的地址。
  ③对于括号,要进行”级位“处理。当出现左括号”(“时,则将”(“后的检索词所在行的”级位“栏值加1,同时有多层左括号时,级位值连续多次加b当出现右括号”)“时,则将”)“的前一个检索词所在行的”级位“栏值减1,同时有多层右括号时,级位连续多次减1。
  第一个检索词的级位初值为零,以后每一个检索词的级位由上一检索词复制得到,然后再根据条件加减。若检索式的第一个字符是左括号,则将第一个检索词做加级运算。
  ④遇到结束符。则在最后一个检索词所在行的”条件满足指向“栏放人”命中“,”条件不满足指向“栏放人”不命中至此,前处理工作结束。展开表中除第二、三栏中有空白外,其余各栏均已填好,这些空白处有待于后处理来完成。
  后处理
  后处理的主要任务就是填满整个表的空白单元,填表的依据是表中“级位”栏的前后级位值,填表的顺序是从下向上,直至表的顶部,从而得到一个完整的提问展开表。为方便讨论,我们称表中指针所指行为“当前行”,指针移动到“当前行”之前所指向的行为上一行。
  ①若当前行的级位值大于上一行的级位值,表示上一行的檢索词后有一个右括号,如(A+B+C),对应的检索词级位分别为1、1、0,因此,针对不同的^况应做不同处理。
  若当前行的“条件不满足指向”栏为空,则表示当前行和上一行的检索词之间为“”
  运算,应把上一行不满足栏内容复制到当前行的不满足栏。
  若当前行的“条件满足指向”栏为空,则表示当前行和上一行的检索词之间为“+”运算,需把上一行满足栏内容复制到当前行的满足栏。
  ②若当前行的级位值等于上一行的级位值,则做如下处理。
  若当前行的“条件不满足指向”栏为空,则表示当前行和上一行的检索词之间为“”
  运算,应把上一行不满足栏内容复制到当前行的不满足栏。

应把上一行不满足栏内容复制到当前行的不满足栏的图片262

  若当前行的“条件满足指向”栏为空,则表示当前行和上一行的检索词之间为“+”运算,唯有遇到右括号或结朿时,才能得知满足后的处理,所以应当把当前行检索词后的第一个右括号或提问式结束号前的检索词所在行的满足栏内容复制到当前行的满足栏。
  ③若当前行的级位值小于上一行的级位值,表示当前行的检索词前有一个左括号,此时应将该“(”至与其配对的“)”后出现的第一个“+”号或结束号之间的内容作为一个复合检査项,并依据具体情况做如下处理。
  若当前行的“条件不满足指向”栏为空,则把表中前面处理过的第一个与当前行级位值相等或小的那一行的不满足栏内容,复制到当前行的不满足栏。
  若当前行的“条件满足指向’栏为空,则需要把展开表中当前行之后一个复合检索项中最后一个检索词所在行的”条件满足“栏内審,复制到当前行的”条件满足“栏。
  经过上述处理过程,就可以得到一张完整的提问式展开表。将若干提问式的展开表汇集起来,构成用户提问档集合,依据用户提问档就可以方便地进行顺排文档的检索。
  展开表生成示例
  为帮助对展开表前后两个处理过程的理解,给出逻辑提问式A*(B+C)+(D*(E+F*G))的展开表生成过程,如表4.2所示。
  A*(B+C)+(X>*(E+F*G)>W展开表地址检索词条件满足指向条件不满足指向级位比较条件检索标识1A240
  B命中31
  C命中40
  D5落选1
  E命中62
  F7落选2
  G命中落选0
  读者可以根据前处理和后处理规则来填满表格,需要注意的是,前处理主要是解决表中的地址、检索词和条件满足指向等项目,后处理主要解决其余的项目。
  表展开法的检索
  表展开法通常用于批处理检索系统中,生成的展开表为若干逻辑提问式的集合,这个集合形成了展开表提问档,并作为检索的提问库,专用于以后的批量检索和定题服务检索。检索时,靖将所有提问展开表输人内存以提高查比速度。査比时,每从数据库中读取一条记录,就为该记录生成一个检索标识表,检索标识表由该记录的可检索项组成,然后将检索标识表中的每一检索项去查对展开表,并对命中的检索词作上标记。当该记录标识表中的所有检索项査询完毕后,再根据每一展开表的查询情况,分析提问是否命中。对于命中者,就在相应的提问号下记下记录号及相关信息,然后再取下一条记录进行对比。全部査比完毕后,才能得到本次检索的最终结果,最后通过提问号调出检索结果中各自命中结果的记录,打印输出,分发给用户。
  逻辑树展开法

应把上一行不满足栏内容复制到当前行的不满足栏的图片271

  逻辑树展开法是将逻辑提问式展开成树型结构(下称主树),运算符构成树的节点,检索词被视为树叶,所有检索词也按照有限自动机原理构造成字符树(下称辅树),主树与辅树间的相关元素用指针连接。检索时,采取爬树原则,先用文档中的索引词逐字符地对比爬行辅树,走到树的一个端头(树叶),然后依照指针登记主树,并根据倒爬树方式分析提问是否命中。逻辑树展开法包括3个部分:逻辑提问式的分解、字符树的生成、检索实现。
  逻辑提问式分解
  逻辑提问式分解的分解目标为:提供可直接用于检索实现的主逻辑树表、检索词地址表以及检索词在检索式中的位置表。这些表在检索实践中分别发挥着应有做作用。
  主選辑树表
  主逻辑树表是逻辑提问式的一种树形表达形式,它用层次型的树形结构把运算符、运算项关联起来,其主要内容包括运算种类、子项个数、父项地址以及检索处理登记栏(见表4.3)。
  主逻辑树表结构
  运算种类子项个数父项地址处理标志检索处理
  具体说明如下。

应把上一行不满足栏内容复制到当前行的不满足栏的图片268

  运算种类。用来表示逻辑提问式中的运算符类型,如”+“、”*“、”一“等。每个运算符必须有一个或多个子项,只能有一个父项,没有父项的节点是根节点。
  子项个数。指该运算符直接下属项的个数,下属项可以是检索词,但可以是运算符。例如A+B+C,该运算符”+“下就有3个子项,分别为1”、“3”、“(:”:再如D+E*F,这时的“+”下的子项为两个,分别为“D”和“E*F”。检索词项没有子项,通常被视之为“树”的叶子。
  父项地址。指本项的直接上属项(父项)在本表中的地址。如上例中的“a”、“b”、“C”都指向同一个父项“+”,“D”和“*”也指向同一个父项“+”。

应把上一行不满足栏内容复制到当前行的不满足栏的图片274

  处理标志。在检索过程中填写,主要用于记录该检索项或逻辑组合项是否被“满足”。一般情况下,处理标志在检索前均为“0”,当在检索过程中被“命中”后,记为“1”,表示该项的检索过程已经完成。对于“一”运算,则处理标志栏置为1,该词被命中后被置为“0”。
  检索处理。记录该项在检索过程中的变化情况。即当该项的子项命中后,对该项进行累计处理,当该项的检索要求被满足后,就在处理标志栏置1。例如,对于“*”运算,当其直接下属子项初次满足检索要求时,就在该栏加1,直到该栏的数字与它的子项个数相等时,将处理标志置为b若为“+”运算,则当其任意一个直接下属子项初次满足检索要求时,处理标志置为1;对于运算,则在分解提问式时,就将该栏置为1,当在以后的记录中检索到该检索词或该项的组合条件满足时,再反将其置0,表示该项“非”运算满足。
  在检索过程中,当某一行的处理标志为1时,就根据该行的“父项地址”值爬升到其“父项地址”行,进行检索处理,这样反复循环,当树根处(提问式的逻辑树顶端)的处理标志为1时,宁波seo优化说明该检索提问被命中。
  检索词地址表
  检索词地址表是主逻辑树表与辅表的联系纽带,在检索中,当一个检索词命中以后,通过辅表找到其在检索词地址表的位置,再根据该表中记录的主表位置进行检索处理(在检索处理栏加1等操作)。该表由两个字段组成:检索状况登录区、检索词在主表中位置,其结构参见表4.4。

应把上一行不满足栏内容复制到当前行的不满足栏的图片265

  检索词地址表结构
  检索登录主表位置
  具体说明如下。
  检索登录。该栏的作用为进行检索词命中与否的登记栏,该栏的初始值为0,首次命中后记为1,同时根据其在主表中的位置定位到主表,并进行检索处理。
  主表位置。该词在主逻辑树表中的位置,此位置建立了主逻辑树表和辅表的连接,当辅表中的检索词命中后,可以通过辅表的指针在该表中找到主表中的相关位置。
  检索词位置表
  检索词位置表是在逻辑提问式转换成逻辑树表的过程中,临时生成的一个中间处理过程表,该表还将作为从逻辑提问式到词逻辑树(辅表)的桥梁,一旦辅表生成完毕,该表将被清除。检索词位置如表4.5所示,表4.S检索词位置表结构
  检索词种类起始位置终止位置
  具体说明如下。
  检索词种类。用于区别检索词的类别(如作者、关键词、标题、代号等)。设此项的目的在于区别捡索对象,提髙检索效率。通过种类标识分别构进检索词逻辑树表,使得在检索时,可以针对不同类别的检索词去匹配不同的词逻辑树。
  起始位置。主要指本行检索词在整个逻辑提问式中的起始位置,以便在构造辅表时,快速准确地在逻辑提问式中取词。
  终止位置。指本行检索词在整个逻辑提问式中的结束位置,目的也是为了准确取词。
  中间工作表
  由于在进行逻辑提问式到逻辑树表的转换过程中,涉及一些中间数据,这些数据在生成逻辑树时需多次使用,因此需要建立一个中间过程工作区(中间工作表)来记录这些数据,一旦主逻辑树生成完毕,该表即可以清除。中间工作表结构如表4.6所示。
  中间工作表结构

应把上一行不满足栏内容复制到当前行的不满足栏的图片266

  起始位置终止位置父项地址辅助信息
  具体说明如下。
  起始位置。由于逻辑提问式的分解是逐层进行,每一层可能有若干子项,这个起始位置就是表示子项在逻辑提问式中的起始位置。

应把上一行不满足栏内容复制到当前行的不满足栏的图片272

  终止位置。记录子项在逻辑提问式中的截止位置。
  父项地址。本项的父项在逻辑提问式中的地址。
  辅助信息。为分解该子项时提供辅助信息。如本项的父项为何种运算,本项是否为括号项等。本算法规定:“0”表示该子项的前后端分别为左右括号,“1”表示父项为“+”,“2”表示父项为“*”,“3”表示父项为主逻辑树表的生成
  主逻辑树表的生成算法思想为:采用多次扫描的分层分解构造法。首先分解出逻辑式中最外层“+”号下的子项,括号内的项暂时不分解;其次扫描已分解出的子项(在最外层没有“+”项的情况下对整个逻辑式进行)中的“*”号的运算子项,若该子项为括号括起项,则仍分解“+”号子项;最后分解“一”号子项。
  为了加深对该算法的理解,给出下面逻辑提问式的分解过程,每一过程在表中给出序号,其中第一步是放置提问号。

应把上一行不满足栏内容复制到当前行的不满足栏的图片263

  L=(Information+document+book)*retrieval*-manual+automation*search具体过程如表4.表4.10所不。
  主逻辑树表生成实例
  运算种类子项个数父项地址处理标志检索处理

应把上一行不满足栏内容复制到当前行的不满足栏的图片269

  ->+2提问号
  ->*31
  —*21
  -*+32
  h02
  ->-121
  ->03
  卜03

应把上一行不满足栏内容复制到当前行的不满足栏的图片273

  续表
  运算种类子项个数父项地址处理标志检索处理
  -*04
  ->04
  ->04

应把上一行不满足栏内容复制到当前行的不满足栏的图片264

  -*06
  检索词地址表实例
  检索登录主表位置

应把上一行不满足栏内容复制到当前行的不满足栏的图片270

  —5
  ->7
  ->8
  ->9
  -*10
  —11
  -*12
  检索词位置表实例

应把上一行不满足栏内容复制到当前行的不满足栏的图片267

  检索词种类起始位置终止位置
  —2937

应把上一行不满足栏内容复制到当前行的不满足栏的图片275

  -*4756
  -^5863
  —212
  -*1421
  ->2326
  〉+4045
  中间表工作实例
  起始位置终止位置父项地址辅助信息
  -*14511
  —。476311
  -120
  本文转载自
  宁波seo优化www.leseo.net
  补充词条:宁波seo优化公司  宁波网站seo优化  宁波网站排名优化  宁波网站优化推广  宁波seo网站优化