Google在2004年4月发布的IPO S-1表单后,大财政公司的英特网开发单位副总裁Tristan Louis估计了现在的服务器场包含下列各项[1]: 719个服务器架 63,272台机器 126,544个处理器 253,088 GHz的处理能力 126,544 GB内存 5,062 TB的硬盘空间 依照这一估计,Google服务器场组成了全球最强大的超级计算机,每秒运行速度至少三倍于地球模拟器。 |
估算一下,很不严密,权当游戏:
网页存储成本
根据论文[1]中的数据,当时的Google存储了23,000,000张网页,大约消耗存储147.8G,在Google文件系统[2]中压缩为53.5G。
现估算Google存储8,000,000,000张网页,按线性估算消耗存储51,408.7G(51T),在GFS中压缩为17,136.2G(17T)。
目前已知普通的IDE硬盘100G的价格大概在1200元人民币(Google会用IDE吗:〉),折合12RMB/G。
Google 网页存储成本为17*1000*12 = 204,000RMB,考虑到双备份系统20w * 2 = 40w RMB = 5w $,即Google网页存储成本为5万美元左右,之后有兴趣可以计算合计入存储维护成本,考虑折旧什么的来算年平均存储成本(蚂蚁不懂经济和统计,这里是瞎说的,哈哈)。
Gmail游戏
目前大部分Gmail用户的空间由1G增长到2G,并且在不断增长。
假设Google投入1000万美元来作为Gmail存储预算,那么可以购买17T*200 = 4,300,000G的空间,足够支撑 2,150,000个用户。
每个用户的成本为24美元。Gmail利用AdWords来收回成本,制造盈余。之后又可以利用收益来选择扩大用户利益:当没有用户增长时要增加已有用户的存储空间,当用户增长过快后控制邀请数量。
蚂蚁猜,Google在这里自己打造了一个经济生态系统,并根据Gmail产生的利润保持着一个数学模型来分配存储空间和邀请数目。
Google文件系统的极限
根据论文[2]估算单个GFS的存储上限为64M * 2**64 = 2**70 = 1,180,591,620,717,411,303,424M = 1,180,591,620,717,411T。
假设存储年增长量为1,000,000,000,000T(这个数量很变态),那么一千年以后,Google的存储成本为
347,000,000,000,000w $ = 34,700,000,000亿美元(不知道那个时候Google的市值能不能到这个线,或者说……人类还存在不?),并且GFS达到了它的上限。
google中国的李开复曾经说过,google的核心技术并不是所谓的搜索,而是网络存贮技术,google利用最常见的硬件设备,普通的服务器、普通的内存,通过Google的软件,把google打造成世界上最廉价的存储基地。这是google真正动力,Gmail、google搜索等等,都是基于这种强大的分布式存储而成功的。