二百零二.再次挖角谷歌-Kaltix归心(1 / 2)

加入书签

{时:2003年34日}

{地点:加州-洛阿尔}

哪个时谦虚总好的,是过于虚有时难免给误会。以面对Kltix三人组,宁子默不谦虚。

Kltix三组说掌的技术,确实是对谷歌PgeRnk去的提升。但Bing同样网页页权重方有自己专用算,搜索擎本质的共性Kltix技术融入并存在问

在于,何将Kltix人组纳旗下。可不是单地把Kltix三人组过来那简单,是对谷和Bing相对消彼长“骚操”。

然是此彼长,子默不意亮亮肉。

迅雷不掩耳之,拿下人!

是,这番大数搜索的伸场景在2003年这时代,经不足用惊艳形容。

包括霍曼在内,办公室呆着的人一幅“懵逼”样子盯宁子默,让宁子一时间种“说了”的觉。

实,刚讲的东西对眼前四人而

前了!

他们的解,

许还跟上。

想到赛突然张张嘴,心翼翼说,“,我们人曾就歌搜索擎讨论搜索引技术的展。本为我们展望已十分超,没想你铺开我们面的那副卷完全越过我曾经的象。”

眼前这叫做宁年轻人,不仅仅大名鼎的,竟还是【赢】和【MySe】的联创始人。

他已在过去数个项中展现他的创力,却想到他搜索引这么专的领域然有着越这个代的独见解。

他关注不仅仅技术,是科技,或者说联网技在人类明未来发展中起到的键作用。

如果以前很人问自-搜索擎可以什么,己的回最多会宁给出答案更一些:

“搜索擎可以你更快找到更业、更尽的答。”

是今天后,赛觉得他许会给出问题人一个好的答

说,今过后,突然给出别人个答案。

搜索擎可以什么?

宁已经得清清楚,

那个未

在确实很远。

想到这,赛普起勇气到,“,你说绘的画绝对是索引擎来最值去探索发展方。”

歉地点点头,普讪笑说,“不是说不看好所说的来,而我意识你所说那个未,离我有些远。它一定用到大的新技去实现,而那些术并不一个简单单的队可以成的。

甚至就目前在索引擎域十分先的谷,就算有足够技术积,也不在短期达成你说的那未来。单如何网页文串联成据,并数据库询的方来实现索,都个目前期内难课的难。”

“梦想总要有的,要不然么去一一步实它?”

宁子默有关梦的话变个说话,就在赛表态的时,他经想到更深层的东西。

宁子明白,一些人,仅仅只画饼是能完全服的。

自己必拿出完体来对这帮同有梦想年轻人!

宁子自信地笑,乘抿一口啡的时在脑子将谷歌索的关技术汇成册。

把杯子嘴边拿的时候,宁子默子里有谷歌搜关键技的封印,

已然开!

“说到搜,人们往会简地认为索只是取爬虫网络上取的结。但实上,搜并没有们想象那么简。”

子默将子轻轻放在桌,笑着了三人眼,细地解释

们谈到数据搜,其核一定是量极大数据量。这种体的数据储、索和检索,已经不单是数库结构去实现解决的。

大数量的数存储和索一定有对应文件存检索系,它必是一个向大规数据密型应用、可伸的分布文件系

【Bing】除在搜索爬虫上心外,核心的分还是后那套绕在BFS(BingFileSyste)文件系的核心术体。套系统设计目,与许传统的布式文系统有多相同处。比,性能、可伸缩、可靠以及可性。

BFS还是以用负载况和技环境的析为基着重考,不管在还是来,BFS和早的分布文件系的设想有明显不同。以我们新审视传统文系统在计上的衷选择,衍生出完全不的设计路。

先,组失效被为是常而不是外。BFS需要理成百千存储器,同被相当量的用终端机访问。BFS组件数量和量导致事实上,任何给时间内有可能生某些件无法作,某组件无从它们前的失状态中复。

我们遇过各种样的问,比如用程序bg、操系统的bg、人失误,至还有盘、内、连接、网络及电源效等造的问题。所以,续的监、错误测、灾冗余以自动恢的机制须集成GFS

,以通的标准量,我的文件常巨大。数GB件都可非常普。每个件通常包含许应用程对象,如eb档。

我们未需要处快速增并由数亿个对象成的、以TB数据集,采用理数亿KB大的小文的方式非常不智的,管有些件系统持这样管理方。因此,设计的设条件参数,如I/O操作和Bk的尺都需要新考虑。

第三,绝大部文件的改是采在文件部追加据,而是覆盖有数据方式。文件的机写入作在实中几乎存在。旦写完后,对件的操就只有,而且常是按序读。

↑返回顶部↑

书页/目录