巴比伦塔的失败说明了语言不通导致的沟通不畅会严重影响生产力,

然而我们又无法统一语言,所以机器翻译是一个重要的研究领域。

人类的语言是如此繁杂不规范,尽管有语法,但是几乎处处有例外。

我们在书面和口头交流的时候很难把全部的语义用语言表达出来,语言只是表达了一小部分,而且这部分还可能会有歧义甚至残缺不全,剩下的部分我们需要通过情景经验常识来识别。

接收到信息之后,我们根据接收到的信息结合自己的理解生成一个假说,然后跟对方互动,利用对方的反馈来验证假说是否成立,这种生成假说验证假说的原理就是IBM WATSON的核心思想:https://github.com/ysc/QuestionAnsweringSystem。

下面,我以一个翻译的例子来演示机器翻译和人翻译的区别,附图是谷歌机器翻译的结果,下面是我自己翻译的结果,你也可以想想如果是你你会怎么翻译,翻译不对之处还请不吝赐教:


尚川译:"阿宝"还在继续他那真真是极好的传奇大冒险,这次他必须要面对两种惊天大威胁:一种和超自然现象有关,另外一种跟他的家人稍微有点关系......

不同机器翻译的不同 机器翻译的优劣_机器翻译

不同机器翻译的不同 机器翻译的优劣_python_02