前一阵那篇有关云计算的文章发出来以后,有朋友在MSN上和我开玩笑,是不是,可以把人肉搜索,也看成是一种云计算?
当然可以,我说,而且事实上是有人这么做的。
实际上认真的说,人肉搜索跟云计算还是有所区别的,云计算是把作业分成若干个包来解决,人肉搜索的机制倒不是完全一样——没有说有人调查姓名有人调查住址什么的。
不过我说的类似的应用确有其事。
举两个例子。
其一,美国有个公司(这公司去年或者前年还在国内炒做了一把),业务基本是做软件外包的,不过他们的业务模式和别人不大一样,他们接到外包订单之后,把业务分解为比较小的子任务,在自己公司的一个社区上公布,然后来自世界各地的社区成员们——都是程序员——挑选自己干兴趣的子任务,进行开发,然后提交到社区里,该公司对收到的半成品进行评估,挑选出质量最高的,给开发者付酬,购买代码的所有权,再由公司进行组合,交付给客户。
显然这样的业务模式可以节约很多成本,可以在众多半成品中优选,并且只给质量最好的支付报酬,还不必承担雇佣一个正式员工的诸多成本,并且,这样把任务分解后交给很多大脑组成的计算云的编写代码,也确实很有点云计算的精髓。自然,这也需要控制全局的很好的能力。
其二,这个是我在杂志上读到的介绍——关于卡内基梅隆我们应该都非常熟悉,这里有与MIT并列的全美第一的计算机科学学院以及更加大名鼎鼎的SEI,以及SEI的孩子CMM和CMMI——不过CMU的贡献还有别的,例如这些年来越来越多的页面需要输入验证码,以控制自动注册或者类似穷举破解一类的恶性行为,这个玩意儿叫CAPTCHA,就源于CMU——当然CAPTCHA不是云计算,我要介绍的是CMU的一个升级产品,reCAPTCHA。
有一家非盈利组织要将古籍转化为电子文档,手段当然是OCR,而显然对于古籍这类对象而言,OCR的效果肯定是会比较差的,但是如果组织人校对,那么这个非盈利组织估计拿了盖茨基金会的钱也会亏到姥姥家去。reCAPTCHA的作用,就是把OCR的结果分解为片断,然后作为CAPTCHA的内容发布到有关的合作伙伴的相应位置,自然就是由用户们的眼睛和大脑来识别和校对,用户输入的验证码,就是校对的结果,并且CMU的研究小组也不是只对一个对象进行一次校对。同一个片断可能会被验证多次,以获得最优的结果——这个应用就是非常典型的云计算了。如果是例如FACEBOOK这样网站的用户,那么无疑就是在为这个计划做贡献。依靠海量的用户,目前每天可以处理接近100万个单词——照这个速度,要处理完那些古籍,需要大约400年。
其实,眼下在云计算方面经常被拉出来当标杆的亚马逊,在05年的所谓“土耳其机器人”计划中,就有类似的应用了。
今天的这一篇比较接近扯淡,也确实没有什么实际意义,不过有的东西,换一个角度看,还是挺有趣的……