为了解决专业元搜索引擎的精确度的问题,专业的专业元搜索引擎的相关性返回的网页进行了研究。
独立的网络搜索引擎的性能定义,搜索比独立搜索引擎页面的位置等信息的深度休息,设计基于遗传算法的专业网页模型的相关性,并探讨实施模型的原则和实施过程。键词:搜索引擎,元搜索引擎的专业,遗传算法,模型中图分类号:TP301文献标识码:A文章编号:16727800(2014)007002103简介今天,信息互联网爆炸,人们对覆盖和信息搜索引擎的精确度要求越来越多。于元搜索引擎,为特定领域的信息检索的元搜索引擎的精确度进行深入研究的掩护下,使用基于改进遗传算法的网页排名的模型建立专业相关模型,选择实现高度专业的网络相关。
搜索引擎专业专业搜索引擎是搜索引擎的一个特定区域,它可以搜索一些网络信息,并返回关于某个专业领域的信息。搜索引擎[1]各自独立指望几个独立的搜索引擎,在所有搜索引擎的元搜索引擎结果的信息,没有庞大的数据库维护,重达权重值在处理后对结果进行排序,并将最终排名结果返回给用户。进的轮盘赌遗传算法的改进选择算算法的选择是最常用的方法,但存在以下缺陷:在进化过程中,适应度高的人是重复的几代人,而那些低健身的个人将面临死亡的消除,该集团是独一无二的,没有差异:一旦该集团已在进化过程中被证明单,这是完全使得有可能陷入最佳和令人尴尬的当地局面。

了解决上述问题,运营商的选择,改进,优化,以获得新的选择操作,具体如下:使用的生存战略,生存选择个人的概率个体的群体,以用的问题在一定程度上解析单元的基团,生存概率的基础上,最佳的个体被选择进入下一代,这增加了算法的收敛速度和收敛在整体范围内。
过上述方法,该种群的多样性和解决方案的全球最优的保证。
叉算子提高交叉的遗传操作允许父基因的优异的转印到下一代,下一代的新的个体很多,所以该操作是一个交叉遗传操纵基部。传算法的收敛速度直接受交叉算子的影响。

简单的遗传算法中,交叉操作通常是随机进行的。加固定交叉率的缺点是比母体的基因不能很好地传递到下一代,这将会对算法的收敛速度有负面影响更高。本文中,交叉点的以下适应:PC = PC1-(PC1-PC2)* DD(1)其中:PC1 = 0.9; PC2 = 0.4;电流频率的演变; D代表进化的总数。异操作,以提高整体最佳的解决方案,在此,自适应变异率如下:PM = Pm1-(PM1-PM2)+的dD Pm2的* d(Fmax的-Favg)(2)其中:PM1 = 0.1; Pm2 = 0.001; d代表当前的演变次数; D代表演变的总数; fmax为人口的最大的健身价值,Favg代表每一代的平均适应值。小二乘多元线性回归方程寻找现有文献没有给出多元线性回归方程的最小二乘解,给出了一个简单的解决方案,最小二乘多元线性回归方程纸下面的讨论:最小二乘多元线性回归溶液的数据点(X11,X21,X31,...,XN1,Y1),(X12,X22,X32,...,XN2,Y2),...,(X1N, X 2 N,...,XNN,YN)回归函数y = B0 + b1x1 +限定+ b2x2 + b3x3 + ... bnxn,最小二乘多元线性回归作为条件的问题:Q(B0,B1 ,...,BN)=ΣNj= 1 [YJ - (B0 + b1x1j b2x2j + + + ... + b3x3j bnxnj)] 2达到最小。过多变量函数已知极值获取必要条件:Qbk-2ΣNj= = 1 [YJ-(B0 + b1x1j b2x2j + + ... + bnxnj)] XKJ = 0,其中k = 0,1,..,N,x0j = 1(3)评分=1NΣNj= 1yj,X1 =1NΣNj= 1Xij,I = 1,...,n中的式(3)是通过k取获得= 0 B0 = -b1x1 -...由式-bnxn(3)=> =ΣNj1Xkjyj-b0ΣNj= 1Xkj-b1ΣNj= 1X1jxkj -...-bnΣNj= 1Xnjxkj = 0(K = 1,2,...,N )(4)=≥ΣNj1Xkjyj - ( - b1x1 -...- bnxn)ΣNj= 1Xkj-b1ΣNj= 1X1jxkj -...-bnΣNj= 1Xnjxkj =0≥b1ΣNj= 1(x1j-X1)+ XKJb2ΣNj= 1 (X2j-X2)+ ... + XKJbnΣNj= 1(XNJ-XN)= XKJΣNj= 1(YJ-)xkjk = 1,2,...,N(5)速率SKJ =ΣNJ = 1( xij-X1)= XKJΣNJ = 1(XKJ-XK)(xij-X1)I = 1,2,...,nSky =ΣNJ = 1Xkjyj-ΣNJ = 1Xkj =ΣNJ = 1 ...≥ b 0,= -b1x1- -bnxnS11b1 S12b2 + + + ... = S1nbn S1y ...... Sn1b1 + Sn2b2(XKJ-XK)(YJ-)+ ... + = Snnbn SNY(6)分辨率算法公式(6)的正规方程是对称方程之一正定TRIC通过乔列斯基方法解决的:第一个步骤:系数矩阵A = LLT第二步骤的分解:求解LLTB = Ylij = SIJ-Σj-1K = 1likljk LII(J = 1,2,... ..,I-1)= SIJ二-J-1K = 1likdk lillii =(SII-Σj-1K = 1lik)2BI = 1(二 - Σnk= I + 1lkjbk)LII N-1,...,1 )= B0 ... -b1x1- -bnxn(i = N时,(7)页的相关性模型和人口的初始化代码是编码的遗传算法的解决实际问题的第一步。于在遗传算法时,遗传算法是通过遗传算法随机产生的初始群体的各个可由于人口使用二进制编码编码的个体获得的生词这里,它是只需要确定代码的长度,即获得专业词汇的长度。先,从独立搜索引擎页面培训专业词汇一起获得的,其次,对一套的中国话表达专业的网页,终于网页,词汇后筛选算法。许多方法来选择人口规模,而且大多数研究表明,人口是人(20和100)优选20〜100。文档的初始人口规模为100格式化函数使用格式化功能[3],以评估人的适应能力,并发挥在建立了重要的作用网页的相关性模型。
式化功能的在线培训集之前必须构造模型的确定,如图1所示。

1用于获取训练集合页分析的训练集合页的方法加工,
宁波seo先前获得的上述应用词汇游戏分析处理页面的方法:提取网页中的文本信息,中国字文获得的关键字的内容;将关键字与关键字摘要表中的单词进行比较;如果关键字出现在关键字汇总表中,则相应矢量的位置增加1。页的分析,每一页将是提供一种用于表和对应于词汇的顺序字的字频的关键向量的训练,字频矢量元素的数量表示中的每个关键字在Web页中的词汇表,结果字的频率向量的组合物包含基质形成的样品,表示为x,x表示在一个频率上形成字向量网页中的每个行,每一列代表每页中出现的词汇表中的关键字数量。个游戏页面培训页面有一个值,该值是当前网页的各个搜索引擎的位置的总和,反映了其独立搜索引擎连接到网页重要程度。文和下面的数学处理位置变换值被视为设定的转换如下专业培训的相关网页评价值:。
Y =值(sumPage,f_position,s_position)=(sumPage-(f_position s_position +))sumPage * 1000(8),其特征在于,sumPage表示在两个单独的搜索引擎已被返回的记录数;表示发动机第一页位置的表链组件;第二页的代表位置设定值指令发动机中的位置;值表示此记录的位置以及总记录中的位置比率。的值越高,这个记录的专业相关,Value的值越高,这个记录的更专业的相关性较低。那里,你可以得到另一个矩阵形成元素,Y表示,其中每个元素代表的网页的专业相关的评估价值。身的个别计算在图2 2中示出通过使用改进遗传算法的相关性模型来建立健身的特定的计算方法,所讨论的关键字的网页排名至更大的影响从关键字表中的井,和以获得专门的页面相关的基于多重线性回归方程的模型[4]:Y = + -0.19625x7 0.1354x13-0.234x18-0.32355x23 + 0.52864x27-0.11146x35-0.11146x36-0.59543x38 0.34814x48 + + + 0.12876x56 0.65041x58 0.014542x60 + + + 0.31375x65-0.04691667 0,44378x77-0,10411x83-0,8313x87-0.010075x89 0.16178x108-0.25876xx在模型中,xi代表与第i字的专业专业词汇和y字的频率是网页的记录的专业相关的评价。旦网页的登记保存在本地,中国的分词是在网页上执行的提取专业词汇。
于使用专业词汇,你可以得到的话矢量变频器在页面上,在该模型的预测值以上,就可以得到专业的网页相关度,该预测值可以作为一个排名网页的重要依据。传算法图案检测的改进的实验模型中,设置作为训练样本数据的建模的页面的80%,20%作为测试数据,测试数据可以预测由模型获得,链路测试数据的实际值,可以得到模型试验面板(参见图3)。3的测试图案显示该错误在小范围内控制的,证明了模型的可靠性。

此,输入关键字“Java”的分析,搜索引擎和独立的搜索引擎被用于研究和第100条记录每个搜索引擎返回的比较。
果示于表1中。1的结果比较百度天气系统googleyahoosogou /s0.070 0.041 0.080 0.0010.029结合率/(%)648 692可以看出,在当前系统中,在搜索结果页面获得专业相关性,以更好地响应研究专业领域所需的信息。论:专业搜索引擎是基于元搜索引擎,它深入探讨了元搜索引擎的精确度搜索在专业领域的信息。

传算法用于建立专业的相关性模型的网页的计算,过滤器和过滤网页,以获取具有较高专业相关的网页。
本文转载自
宁波seowww.leseo.net
补充词条:
宁波seo推广公司
宁波seo优化公司
宁波网站排名优化
宁波seo哪家好
宁波网站seo优化