Google在2004年4月发布的IPO S-1表单后,大财政公司的英特网开发单位副总裁Tristan Louis估计了现在的服务器场包含下列各项[1]: 


719个服务器架  

63,272台机器  

126,544个处理器  

253,088 GHz的处理能力  

126,544 GB内存  

5,062 TB的硬盘空间  

依照这一估计,Google服务器场组成了全球最强大的超级计算机,每秒运行速度至少三倍于地球模拟器。 

  估算一下,很不严密,权当游戏: 

   

  网页存储成本 

   

  根据论文[1]中的数据,当时的Google存储了23,000,000张网页,大约消耗存储147.8G,在Google文件系统[2]中压缩为53.5G。 

    

  现估算Google存储8,000,000,000张网页,按线性估算消耗存储51,408.7G(51T),在GFS中压缩为17,136.2G(17T)。 

   

  目前已知普通的IDE硬盘100G的价格大概在1200元人民币(Google会用IDE吗:〉),折合12RMB/G。 

   

  Google 网页存储成本为17*1000*12 = 204,000RMB,考虑到双备份系统20w * 2 = 40w RMB = 5w $,即Google网页存储成本为5万美元左右,之后有兴趣可以计算合计入存储维护成本,考虑折旧什么的来算年平均存储成本(蚂蚁不懂经济和统计,这里是瞎说的,哈哈)。 

   

  Gmail游戏 

   

  目前大部分Gmail用户的空间由1G增长到2G,并且在不断增长。 

   

  假设Google投入1000万美元来作为Gmail存储预算,那么可以购买17T*200 = 4,300,000G的空间,足够支撑 2,150,000个用户。 

   

  每个用户的成本为24美元。Gmail利用AdWords来收回成本,制造盈余。之后又可以利用收益来选择扩大用户利益:当没有用户增长时要增加已有用户的存储空间,当用户增长过快后控制邀请数量。 

   

  蚂蚁猜,Google在这里自己打造了一个经济生态系统,并根据Gmail产生的利润保持着一个数学模型来分配存储空间和邀请数目。 

   

  Google文件系统的极限 

   

  根据论文[2]估算单个GFS的存储上限为64M * 2**64 = 2**70 = 1,180,591,620,717,411,303,424M = 1,180,591,620,717,411T。 

   

  假设存储年增长量为1,000,000,000,000T(这个数量很变态),那么一千年以后,Google的存储成本为 

   

  347,000,000,000,000w $ = 34,700,000,000亿美元(不知道那个时候Google的市值能不能到这个线,或者说……人类还存在不?),并且GFS达到了它的上限。

  google中国的李开复曾经说过,google的核心技术并不是所谓的搜索,而是网络存贮技术,google利用最常见的硬件设备,普通的服务器、普通的内存,通过Google的软件,把google打造成世界上最廉价的存储基地。这是google真正动力,Gmail、google搜索等等,都是基于这种强大的分布式存储而成功的。