2016年5月,魏則西事情将百度的网页竞价排序形式推向了风口浪尖。扫除网页排序背面的商业要素,查找引擎是怎样在纷繁复杂的信息中快速搜得所需的呢?
从现实生活到虚拟网络
去图书馆查找书籍时,
宁波seo优化书是按文学、数学、核算机等科目分类放置的;去超市购物时,物品也是按生鲜、日用品、糕点等类别分区放置的。这样的安排“入情入理”,能够帮助我们迅速找到自己所需的书或物品。
从真实世界到虚拟世界,互联网犹如一张巨大的虚拟网,汇聚各类网页。互联网中的网页就好比是图书馆里的书或超市中的物品,如果不对其进行排序,要想从数量惊人的网页中“海选”出所需的信息,那就好像天方夜谭。在这样的背景下,查找引擎应运而生。
查找引擎的“工作”是将用户需求的网页“查找”出来,并展示给用户。例如在百度查找框中输入“科学不倒问”后,可能会得到如右下图所示的查找成果(查找成果一般会随着时间而改变)。调查查找引擎给出的查找成果,确实与“科学不倒问”这个“主题”相关,并且相关性越高,它就会被排在越靠前的位置。
排序的奥秘
要探究查找引擎背面的奥秘,那就需求了解查找成果的网页排序方法。调查“科学不倒问”的查找成果,直观上说,将“《中学科技》杂志科学不倒问栏目”排在第一的排序应是合理的,因为相比于其他网页,此网页与“科学不倒问”这个主题的相关程度更高,而网页的排序也在一定程度上反映出在此关键词下此网页的“受欢迎程度”。
网页的“受欢迎程度”一般能够用网页的访问量来衡量,它和网页的访问量成正比。但根据访问量对网页进行排序也会存在一些现实的问题。访问量虽能体现网页的“受欢迎程度”,但却并不能体现网页的“权威性”,例如许多低俗网页便有较高的访问量。此外,根据访问量排序还易遭到“刷流量”的歹意误导。更为重要的是,网页的访问量是动态改变的,如要及时更新排序,代价也十分巨大。因而,要处理网页排序中所遇到的问题就要充分发掘网页的特征,断定点评网页“权威性”和“受欢迎程度”的归纳目标。
网页特征包括网页的内容(图片及文字等)以及其中指向其他网页地址的超链接。一个网页越“重要”,理论上就应该会有越多的用户阅读。网页间的超链接结构能够影响用户的阅读行为,因而,能够根据各网页之间的超链接联系来断定各网页的归纳阅读量,并由此对网页进行排序。
奇妙的循环分配
如右上图,假定一个用户U正在阅读网页A,A含有两个超链接(蓝色横线表明),分别指向网页B和C,那么U在阅读完A后,可能会沿着超链接持续阅读B或C,由此B或C的“重要性”便能够由A的“重要性”来体现。根据相同的原理,B的“重要性”便可由指向B的一切网页的“重要性”之和来表明。
与此同时,处于整个网络之中的B对其他网页也是有影响的,例如网页B中包括指向网页C的链接,即C也影响指向B的网页A的“重要性”,由此便会堕入一个两难的地步:要想知道网页B的“重要性”,就必须知道指向它的一切的网页(A和C)的“重要性”之和;而要想知道一切这些网页的“重要性”之和,又需求先知道对其有影响的网页B的“重要性”。这便让人困惑了,犹如堕入了“先有鸡还是先有蛋”的怪圈。
为了打破这个循环,谷歌的创始人佩奇和布林提出了PageRank算法来衡量网页的重要性程度。他们首先给一切的网页设置了相同的“初始得分”,然后根据网页间的超链接结构不断运行,经过一系列的迭代核算之后,得到停止状态下的“网页得分”,由此便可根据“得分”断定网页的摆放顺序。得益于在网页排序算法上的创新,谷歌在短短数年间横扫整个互联网,成为查找引擎业的一代霸主。
根据网页排序算法,我们能够断定网页A和C的得分较B高。仔细分析三者的联系,这样的成果确实也是合理的。网页A和B中都包括指向网页C的超链接,这说明网页C的“重要性”较高;与此同时,网页C中也包括指向网页A的超链接,网页C从旁边面反映了网页A的“重要性”,因而网页A的得分也较高。
谷歌的网页排序算法对网页排序的过程仅仅是对简略思维的奇妙运用,它将网页排序变成了一个简略的数学问题,也使互联网摆脱了根据网页访问量进行排序的种种坏处。
本文转载自
宁波seo优化www.leseo.net
补充词条:
宁波网络seo
宁波seo排名
宁波网站优化推广
宁波seo哪家好
宁波seo外包