宁波seo优化专栏

宁波网站优化:基于时间的搜索引擎排名算法

发布时间:2019-02-23 00:20:38

  简介:本文提出了一种新的时间排名算法,该算法基于用户浏览网页的时间。算法基于用户浏览时间信息更准确地计算网页的排名得分,并提高搜索引擎排名的准确性。
  算法根据任意两个网页之间的时间差计算网页上的浏览时间,并且可以更准确地模拟用户浏览网页的时间长度。于浏览时间不同,用户对网页的偏好不同,这直接反映了页面对不同用户的重要性。键词:时间分类; PageRank排名;结果,搜索引擎;排序中图分类号:TP391文献标识码:A文章编号:1671-7597(2012)1110013-02简介由于互联网的兴起和快速发展,研究和恢复环境已经发生重大变化。联网搜索引擎的排名算法与用户获取相关信息的准确性直接相关。Web链接结构构成了搜索引擎排名算法的基础。种算法很受欢迎:PageRank算法[4]和命中算法[3],已被国内外许多学者和研究机构研究过。是,在传统的PageRank算法中,PageRank分数表示用户浏览网页的概率。而,计算该分数的过程基于一个前提:网页上的用户浏览过程是绝对随机和盲目的。果,相同的权重被分配给所有字符串,并且链接到它的每个页面都接收到这个权重,这不考虑用户在两个页面上的注意力,这显然是不合理的。户点击下一页不是盲目的,他根据他感兴趣的内容点击页面。

宁波网站优化:基于时间的搜索引擎排名算法_no.141

  PageRank和HITS算法没有将它们考虑在内,因此无法反映页面对用户的重要性,timeRank算法解决了这个问题。PageRank算法PageRank [4]由斯坦福大学的Larry Page和Sergey Brin于1996年提出。本概念是每个网站都有外部和内部链接,包括数量和质量。接到网站的价值。果网页包含要链接的其他网页,则意味着网页对其他网页更重要,这相当于每个网页。第v页上投票一次。接数越高,其他页面投票的数量越多,并且每个页面都有一个重要性得分值,假设页面A具有以下重要性:PageRank PR值(A)和链A(链A)链接)数C(A)的比例,具体式为PR(A)/ C(A)。设存在指向A的网页T1 ... Tn,并且参数d是阻尼系数,其对应于0和1之间的值,通常假设为0.85。C(A)是从网页A链接的网页数.A的PageRank值使用以下公式计算:假设用户当前正在浏览某个网页Ti和下一步是以概率1到d浏览Web的任何页面。Web上的大量独立网页,由公式(1)计算的PageRank值为0.15,这太高了。此Google给出了以下公式:time-Rank算法网页的重要性对于用户来说是不同的,即使链接结构相同,那么如何将页面内容链接到链接结构?如果用户对该网页感兴趣,他或她浏览的时间比他不感兴趣的网页更长,这意味着如果我们用户更有可能搜索该网页的内容让我们将导航时间添加到排序算法中。

宁波网站优化:基于时间的搜索引擎排名算法_no.162

  们可以更准确地计算页面的排序分数。此,当前算法的关键是估计导航Web所需的时间。了估计用户浏览网页所需的时间,我们假设用户点击的网页是搜索分析网页的网页集合。意味着用户在搜索引擎中输入关键字并获取相应的网页。合使用,宁波网站优化假设用户一次只点击一个页面,然后在浏览网页后点击另一个网页。句话说,每次用户点击最多两个网页,直到他浏览了一个网页,然后另一个网页,如果用户在网页上浏览这个方式,它有一个导航序列。设P是一个序列,向量P = {p1,p2 ....,pn},其中n表示用户输入的关键字和分析返回的页数,我们可以计算何时查看网页。
  Pj,Tj + 1的时间表示用户点击Pj + 1网页的时间。此,用户在网页Pj上导航的时间是Tj + 1-Tj ,以及用户浏览网页的时间是:TM = {t1,t2 ....,tn}。们将时间因素添加到算法中,因为如果用户对页面感兴趣,它可以链接到用户搜索的主题,以便用户浏览更长时间,否则用户快速离开页面并快速导航。算过程如下:根据超链接的排名,每个网页有n个时间分数,n代表主题数。先,使用Web Graph算法并计算每个离线页面的级别,此计算过程基于[1]。次,为了计算关键词和超链接之间的相似性,在用户将关键词提交给搜索引擎后,搜索引擎必须确保关键词和超链接匹配,根据贝叶斯理论[2],句法分析q和超文本链接j之间。系可以是:H(j)表示j的每个页面的超链接,PR(H(j))表示相关页面中的比例,PR(q | H(j))表示超链接。j包含q的比例,计算这个的目的是如何为超链接添加时间。
  后,通过添加时间,每个网页具有初始导航时间向量TS = {t(1),t(2),...... t(n)}并且t(j)表示总数连接到j的用户页面。航时间,避免发生0,初始t(j)= 1,这样在搜索引擎运行几次后,我们就可以计算出浏览每个网页的时间向量,此向量是从导航时间序列TM导出的,页面排名如下:算法描述为了给排名算法增加时间,我们首先建立一个“导航模式”基于时间“,我们可以衡量每个网页的浏览时间。执行原始算法和网页的改进算法之后,用户意识到附加到不同网页的重要性,其使用时间因素来提高网页排名的准确性。
  该算法中,这意味着网页浏览时间更长并且将获得更高的分数,两个网页的链接结构相同或不同。计算页面排名分数的时间增加后,我们不仅可以获得更准确的网页排名分数,还可以避免垃圾页面的高分,这是本文的贡献。

宁波网站优化:基于时间的搜索引擎排名算法_no.116

  了获得用户从服务器日志浏览网页的时间,我们必须首先处理服务器日志,查询字,IP地址和浏览时间全部保存在服务器上。据Internet协议地址安排事件。果源IP地址在一小时内相同,我们可以使用Web代理,如果两个相邻点击事件之间的间隔大于一小时,我们认为这是一系列用户点击。们将驳回最后一次点击。据此规则,我们可以获得对网页的访问时间并使用公式(4)计算时间。束语本文提出了一种基于时间的基于时间的搜索排序算法,并给出了完整而详细的数学表示。过对算法的完整表达和应用,取决于网页信息的重要性对于用户,可以获得更准确的分类结果。服一些算法,如PageRank和查询单词无关的故障,以便排序算法更准确地模拟用户导航页面的习惯。前,所有搜索引擎排名算法都存在许多缺陷:无法确定网页的超链接是否与网页相关联,因此很容易出现主题漂移的问题,这是也就是说,与主题无关。面排名很高。是,一个好的搜索引擎应该能够跟踪用户的兴趣,关注他们的兴趣或对相关信息的期望。文开始利用用户的兴趣。
  些问题需要额外的努力和改进。
  本文转载自
  宁波网站优化www.leseo.net
  补充词条:宁波网站seo  宁波网站排名优化  宁波seo推广公司  宁波seo外包  宁波seo哪家好