宁波seo优化专栏

搜索引擎的动力引擎

发布时间:2018-12-15 23:19:40
  互联网行业竞争剧烈,能否得到更多用户的认但是企业生存的底子,而认可的要害就在于效劳是否及时、优质、精确。搜狗是搜狐于2005年推出的全球首个第三代互动式中文查找引擎,在搜狐的整体发展战略中占有十分重要的地位。搜狗的产品线包含了网页运用和桌面运用两大部分。如安在强手如林的查找引擎商场占有有利地形,是一个必须答复的重要“命题”。
  海量数据检索带来的挑战
  查找引擎的最大难题是正确理解和满意用户的需求,而这一切,都必须依据一个强大的数据中心来完成。提高数据中心的效能,是提高用户满意度的要害要素。依据这种考虑,搜狐特别启动了搜狗新一代数据中心项意图建造,希望经过技能立异,提高搜狗的效劳品质,然后赢得用户的喜爱。
  “搜狐寻求新技能运用是有传统的,搜狗引擎就是搜狐在查找技能领域寻求立异的一个成果。咱们希望能利用各种领先的技能与设备,让咱们的产品与效劳为用户带来更好的感受。特别对于搜狗数据中心,咱们更希望躲避传统数据中心的‘短板’,进一步提高数据中心网络的功能、功率与牢靠性,让用户访问起来感觉更加杰出。”搜狐网络运维部某负责人解说了选用新一代数据中心处理方案的初衷。
  此外,搜狐在数据中心网络建造上不断“求新”是局势使然,从2007年搜狐正式推出搜狗网页查找3.0版别之后,宁波seo优化搜狗查找引擎的中文网页收录量已超过100亿,每天的网页更新量则有5亿之多,激增的海量数据对搜狗数据中心带来了前所未有的压力。新的搜狗事务运用要求数据中心网络平台能支撑百亿海量网页收录、及时更新网页和网页评级体系,满意高密度效劳器集群的高功能并行抓取作业,一起网络体系要具有后期灵敏的扩展才能。面临超高的网络流量与数量巨大的效劳器集群,原有的搜狗数据中心网络架构与设备功能已无法满意这一要求,选用新一代数据中心架构来建造搜狗IDC新机房成为必然的挑选。
  依据这一需求,2009年初,搜狐公司征集了业界多家厂商的设备,进行了全方位考察和比较。终究,H3C公司集S12508数据中心级中心交流机、S75E高端多事务路由交流机、S5800万兆交流机、iMC智能办理中心等软硬件设备为一体的一致交流架构数据中心处理方案获得了该项意图悉数比例,搜狗新一代数据中心网络建造的大幕也由此摆开。
  让大流量不再是问题
  据记者了解,在搜狗数据中心网络体系中,部署了两台H3CS12500交流机作为整个网络的中心,一起,两台
  S75E高端多事务路由交流机承当起数据传输网的重担,而数十台S5800交流机则作为接入交流机,将2000多台效劳器连成了一个大的网络。
  据H3C网络产品线副总裁孙德和介绍,S12500的规划瞄准的就是数据中心高密度、大流量和大缓存的特色,其单台设备容量已达到5.76T,并且能支撑多达576个万兆端口,能够充分满意搜狗数据中心高密度万兆运用的需求,这也是传统的万兆交流机很难做到的一点。
  众所周知,网页查找最重要的就是查找速度与成果精确性,这也是搜狗引擎持续不断优化改进的方针,它依托的是体系在瞬间对海量网页数据进行挖掘、分析、显示的成果。在这一过程中,数据中心网络承当的带宽压力非常大。为了确保用户能够得到及时、精确的查找成果,当搜狗引擎接收到一个网页查找恳求时,往往会向高密度效劳器群一起建议检索需求,并在非常短的时刻内接收几百台效劳器简直一起发回的查找成果,巨大的数据流量假如不能及时吸收,那么很简略呈现网络拥塞的现象。
  而S12500的大缓存才能很好地处理了这个问题,不只每个端口拥有256M的大缓存才能,更重要的是它支撑分布式缓存机制,当查找数据浪涌到来时,一部分报文被缓存在接入交流机S5800的8M缓存中,另一些则缓存在S12500的更大缓存中,有效地利用了各级设备的端口缓存才能,最大极限地吸收突发流量,这样,就减少了丢包的可能性,尽可能地减少了对事务的影响。先期展开的实地测验成果表明,每次浪涌的收敛时刻都控制在几十毫秒之内。
  搜狐网络运维部负责人表明,经过建造新一代数据中心网络,处理了查找引擎事务遍及感到头疼的浪涌问题,对普通用户来说,意味着查找成果中的死链接会更少。能够说,H3CS12500中心交流机起到了非常要害的作用。
  立异架构带来新价值
  在搜狗数据中心的网络架构中,数十台作为接入交流机的S5800并非是简略的并排关系,而是每四台虚拟成一台虚拟交流机,然后并排着接入中心交流机S125000。对此,该负责人解说道,这里选用的是H3C推出的IRF2(第二代智能弹性架构,IntelligentResilientFramework2)技能,这也正是搜狐终究挑选H3C新一代数据中心处理方案来构建搜狗网络的另一个重要因素。
  智能弹性架构技能简略的说,是把多台物理设备互相连接起来,使其成为一台一致的逻辑设备。也就是说,用户能够将多台设备真正当作一台设备进行办理和运用,然后为用户带来简化办理、简化网络事务、弹性扩展、1∶N牢靠、功能加倍提高和增值事务扩展等多方面的网络运用新体验。目前,H3C的很多网络设备都支撑这一技能。
  在H3C提出的搜狗数据中心网络处理方案中,这一立异技能也在多处得以体现。上面说到的S5800堆叠就是其中之一。在实践运用中,四台S5800经过IRF2实现40G互联,然后10组S5800堆叠接入双机互备的S12500,也就是说,S12500只需要10个端口,就可实现40个万兆互联。这使得搜狗数据中心网络具有了杰出的可扩展性,日后网络扩容时,可直接利用其他剩余端口,而无须额外投资。
  两台中心交流机S12500双机互联相同选用了IRF2架构,它所带来的价值相同十分明显。以往搜狗数据中心网络选用的是传统的环路规划,这样有一半的网络带宽必须让道给环路,带宽利用率低,并且简略呈现环路阻塞链路,在维护上也简略呈现问题。选用IRF2技能则能够有效防止这些问题。现在的搜狗数据中心网络选用MSTP+VRRP+BFD的方法构建,去掉了令人烦恼的环路。这不只意味着网络运维更为简略,不会呈现环路毛病,并且,也意味着整个网络在不增加投资的情况下,可利用的带宽比较曾经增加了一倍。
  在搜狐对IRF2功能实践测验中,搜狐数据中心网络的稳定性体现得十分突出,无论是S12500内部双引擎的主备倒换,仍是链路级的倒换,体系的恢复时刻都小于30毫秒。也就是说,即使对网络接连性要求高达50毫秒的延迟敏感型运用,网络的稳定性也不会对事务形成不良影响,也有利于搜狗事务的进一步发展。
  “正是因为IRF2技能能够让整个网络的扩展性更好,并且ROI投资回报率更高,为搜狗事务的未来供给了坚实的根底,所以咱们对H3C提出的处理方案更为满意。”该负责人表明。
  在数据中心运用领域,互联网企业因为其事务特色,一向走在运用的前列,他们的挑选往往代表着商场的风向标。从实践效果来看,H3C新一代数据中心处理方案,不只保障了搜狐现有事务的接连性,可满意搜狐不断增加的事务带宽需求,一起面向未来能够承载更多不断涌现的新事务。
  本文转载自
  宁波seo优化www.leseo.net
  补充词条:宁波网站排名优化  宁波网站seo  宁波网络seo公司  宁波网站优化推广  宁波谷歌seo