凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

关于下方文字内容,作者:黄祺林,华南师范大学经济与管理学院,通信邮箱:huangqillin@gmail.com

Ginsburgh, Victor, and Shlomo Weber. 2020. "The Economics of Language." Journal of Economic Literature, 58 (2): 348-404. Abstract:This paper brings together methodological, theoretical, and empirical analysis into the framework of linguistic diversity. It reflects both historical and contemporary research by economists and other social scientists on the impact of language on economic outcomes and public policies. We examine whether and how language influences human thinking (including emotions) and behavior, and analyze the effects of linguistic distances on trade, migrations, financial markets, language learning, and its returns. The quantitative foundations of linguistic diversity, which rely on group identification, linguistic distances as well as fractionalization, polarization, and disenfranchisement indices are discussed in terms of their empirical challenges and uses. We conclude with an analysis of linguistic policies and examine the trade-offs between the development of labor markets and the social costs that they generate in various countries. 摘要:本文将方法论、理论和实证分析结合在语言多样性的框架中,包含了经济学家和其他社会科学家在历史和当代关于语言对经济结果和公共政策影响的研究。我们考察了语言是否以及如何影响人类的思维(包括情感)和行为,并分析了语言距离对贸易、移民、金融市场、语言学习及其回报的影响。语言多样性的定量基础依赖于群体的识别、语言距离以及分化、极化和剥夺公民选举权指数,本文将从实证角度讨论了它们的挑战和用途。最后,我们分析了语言政策,并考察了不同国家的劳动力市场发展与社会成本之间的权衡。 1. 引言 语言在人类发展中的地位不容忽视。语言操控着信息的运转,甚至可以说,语言定义了人类物种,影响着文化认同、商业和国际贸易中的有效沟通、就业机会,甚至影响经济和社会行为。 语言经济学开始作为一门独立学科要归功于Marschak(1965),他明确地将成本和收益等经济学概念引入语言分析。关于多样性的研究可以追溯到哲学家和语言学家Von Humboldt (1988 [1836])。不久后,John Mills和Karl Marx指出,文化和文化多样性是经济互动的核心。语言学家Joseph Greenberg是首个提出构建带有语言距离和不带语言距离的多样性指数的人,这些距离可能与政治、经济、地理、历史和其他非语言因素相关。数年后,Mauro(1995)、Easterly和Levine(1997)、Alesina、Baqir和Easterly(1999)等人再次提出此想法。大量的文章紧随其后,将语言、经济和商业联系起来,涉及的话题包括贸易、移民、消费者选择、收入、语言习得、跨国公司在不同语言环境中的选择,以及对增长、制度质量、再分配、区域和国家发展的潜在影响。 这篇文章对语言多样性提供了全面的概述。它识别了语言的共同特征,并利用经济学工具探讨了多样性的具体特征及其后果。 在第二节中,作者首先简要描述从单语言到多语言世界的转变历程及其如今现存的7000种口语。在2.1节中介绍了经济学与语言学习。在历史上,学习外语的主要动机是贸易。交通运输都需要穿越不同的城市和港口,在没有掌握当地语言的情况下,交流和谈判肯定会遇到问题,且效率低,成本高。另外的动机是移民和战争。有些人被迫离开他们的国家,不得不学习当地语言。在2.2节中,作者主要介绍了萨皮尔-沃尔夫假说:语言和文化是相互依存的,语言影响行为和决策。这一假说受到了Chomsky (1975)的质疑,他认为每个人大脑中都有相同的语法,语言并不能以不同的方式影响行为,由此引发了语言学家之间的大争论。作者花了一些篇幅来探讨这个问题,试图弄清语言是否以及如何影响人类行为。尽管这看起来与经济问题相去甚远,但经济学家们最近发现,分析语法是否对经济行为有影响非常有趣。他们和心理语言学家一样也开始做实验。在第二节的最后,作者讨论了语言情感,当个体发现自己身处一个不同于他们所习惯的语言环境时,语言情感就会出现。这可能通过两种方式发生,其一是移民,另一是由于政策导致的语言环境的变化,这些措施包括改变官方语言或学校教学语言。 第三节介绍了多语言世界,作者首先讨论在将一个社会划分为不同的语言群体时所遇到的困难,进而引入接近性或距离的概念。作者描述了各种各样的距离,包括词汇静态距离、编辑距离、进化枝的距离、语音距离等。在3.4节中,作者介绍三种语言指数:分化、极化和剥夺公民选举权指数。作者还讨论语言距离和指数的大量实证研究,包括国际贸易、语言学习、移民或翻译,以及经济增长、区域发展、制度质量、再分配和冲突。 第四节作者分析了在多语言环境下一些典型的语言政策,以及在一个特定的社会中使用多种语言可能导致的效率低下问题。标准化是解决效率低下最常用的方法之一,但带来不可避免的结果是剥夺权利和威胁到群体的语言身份。针对这一问题,作者简要报告和分析了不同国家的一些语言教育政策的急剧转变。这些变化是由于政治变化、公众需求和政府政策的变化引起的。将教学语言转换为母语是独立和国家主权的重要标志,但劳动力市场的反应可能会产生巨大的社会成本。为了了解平衡效率和语言剥夺的社会成本的具体影响,作者还报告了在印度、尼日利亚、苏联和哈萨克斯坦试行的三语政策。这相当于要求所有人不仅要学习自己的母语,还要学习另一个地区的语言,以及一种世界语言。改革在印度和尼日利亚失败了,但在哈萨克斯坦有成功的机会。 第五节作者通过回顾第2.2节、第3.3节和第3.4节所述的实证工作中所遇到的与群体识别,计量经济学有关的问题来总结本文,并提出了进一步研究的可能性。 2.语言与经济主体行为 我们通常都出生于一种语言中,但也面临激励去学习其他语言,以在全球化的世界中生存并取得成功(第2.1节)。同时,我们的母语可能也影响了我们后来的行为(第2.2节)。当母语受到不公平对待时,我们会变得情绪激动(第2.3节)。这三句话大致概括了本节的主要内容,即语言学习,语言与行为,语言情感。 2.1 经济学与语言学习 学习外语是经济刺激的结果。主要原因显然是贸易。在我们熟知的古代世界,人们就由于贸易的原因而被迫交流。事实上,从伊朗边境经美索不达米亚到土耳其可能要花上几周时间,需要在船只和驴子间转运货物,在沙漠中长途跋涉,需要与各种各样的且往往是敌对的部落交谈,这就需要口译员或者用通用语言交流的能力。 另一个原因是移民和战争。自愿移民或因政治、种族或经济原因被迫流亡的人必须学习他们新国家的语言。据荷马史诗记载,尤利西斯花了好几年时间游历,参观了一个又一个岛屿,在那里他甚至不得不说美人鱼的语言;马其顿国王亚历山大大帝向东方发动了战争;希腊人迁移到罗马帝国;罗马人占领了巴勒斯坦和君士坦丁堡;基督教十字军为从穆斯林手中拯救耶路撒冷而远行;犹太人从巴勒斯坦迁移到整个中东,以及西班牙和葡萄牙,他们在15世纪末被驱逐,不得不定居在地中海国家、中东和西欧;阿拉伯人在七世纪入侵北非,并在八世纪初从那里来到西班牙。所有这些都迫使入侵者、当地人和移民学习语言。 语言之间的解释总是需要的,于是人们开始着手翻译。公元前三世纪,《犹太圣经》由亚历山大托勒密图书馆的七十二名犹太学者从亚拉姆语翻译成希腊语,这一译文成为《旧约》转译成其他语言的最重要文本。 另一方面,也需要使用通用语。拉丁语是中世纪黑暗时期和文艺复兴时期学者们的通用语,许多科学作品是用拉丁文撰写,这加强科学家之间的交流,推动科学研究向前迈进。 2.2 语言、文化、行为和对萨丕尔·沃尔夫假说的当代解释 Wilhelm von Humboldt (1988, [1836]) 可能是第一个强调语言不仅仅是一种交流手段的人。他认为语言也可以表达说话者的内心生活。一个世纪后,Mandelbaum (1949)和Whorf (1956)受Von Humboldt和人类学家Franz Boas (1940)提出的文化相对主义的影响,进一步假设语言和文化是相互依存的,我们使用的语言结构会影响我们的思维方式、观察方式、行为方式,并最终影响我们的决策方式。Sapir在1929年的一次演讲中提到的:“事实是,“现实世界”在很大程度上是无意识地建立在群体的语言习惯之上的。”Whorf (1956, p. 221)提出,“语法差异显著的使用者,被他们的语法指向不同类型的观察,以及对外部相似的观察行为的不同评价,因此他们不是相同意义上的观察者,相反他们必然会得出不同的世界观。” 这就是著名的萨丕尔-沃尔夫假说(Sapir–Whorf hypothesis,后文简称SW假说),萨丕尔-沃尔夫假说有两种形式。强假说假定我们的母语决定了我们的思维和对世界的看法:我们是“语言的囚徒”(Kramsch 1998,第13页)。弱假说只认为语言可能影响我们的思维,但也可能限制它。 在20世纪50年代早期,Chomsky(1975)质疑了萨丕尔-沃尔夫假说,他认为语法大多是天生的,而不是后天习得的。这个观点很快被许多语言学家所认同。他提出的普遍语法暗示所有的语言都有相同的底层结构,这可能解释一个令一代学者非常费解的问题:世界各地儿童语言学习具有惊人的相似性(Li and Gleitman 2002, p. 266)。Chomsky的一位著名追随者,Pinker (1994, p.232)声称,“根据Chomsky的说法,到访的火星科学家肯定会得出结论,地球人只说一种语言。”如果这是真的,“语言之间的巨大差异就会更小”(Swoyer, Baghramian, and Carter 2014, p. 7) Chomsky的通用语法是一套所有语言都共有的原则,尽管可能有参数变化。例如,定冠词在法语和英语中出现在名词前;在瑞典语中,它附着在名词的末尾,而在俄语中不存在。从某种意义上说,这与每只蜘蛛织网的原理相似。蜘蛛不需要学习如何编织,它们使用本能或编织的语法,尽管不同种类蜘蛛在编织方面有一些差异。孩子们需要听到他们的父母或其他人说话,否则他们不会说话,尽管他们的大脑中可能已经存在语法。小蜘蛛不需要学习其他蜘蛛,但对于一些哺乳动物来说却不一定如此,它们通过观察同类来获得非基因传播的行为。 如今,语言学家支持弱SW假说。Dediu and Ladd (2007)承认语言与基因有关,但基因不是唯一决定因素。Evans和Levinson(2009)认为,现有的语言是由历史事件和其他因素的共同影响,而不是语言的普遍性产生的。.Leavitt (2011, p. 143)认为,相对主义的主要贡献之一是,它明确区分了任何语言的使用者可能思考的东西,以及人们可能受到语言深远影响的习惯思考。弱SW假说认为,语言在反映文化成见并限制我们的思维方式的同时,也是文化的载体:由看似共同的概念引起的语义联想存在文化差异(Kramsch1998,p. 13)。结果显示,尽管从一种语言翻译到另一个的可能性,任何特定语言的语言结构都会有一些不能直接翻译和比较的残留词汇(Kramsch 1998, p12),或者在不同的术语,这些词的意思没有完全包含在词汇和语法(Gumperz和莱文森1991,p.614)。一群新的认知主义语言学家也开始进行实验,结果非常接近SW假说:我们说的语言深刻地塑造了我们思考的方式,看世界的方式以及生活的方式(Boroditsky 2009)。 对SW假说的证实或否定,大多基于个案。因此这似乎很难证实或证伪其中的大部分内容。很有可能,在某些情况下假设被证实,而在另一些情况下被证伪,并且结论可能经常要被推翻重新讨论。此外,语言与一些经济事实的相关性或因果关系并不直观,Fabb (2016, p. 45)指出,语言和人的行为可能存在反向因果:一群人(祖先)的文化价值导致语言形式的产生,这意味着文化和语言在最好的情况下也只能证明是相关关系。 争论仍在继续,接下来作者举了一个语言与颜色的案例。颜色是建立在公认的物理概念上的,因此不应该有语言相对主义,这样就可以进行简单的实验来分析相对主义和普遍主义之间的争论。 2.2.1语言与颜色 不同语言命名基本颜色的单词数量存在差异。英语中描述颜色的单词有11个,而玻利维亚亚马逊语,提曼尼语里只有黑色、白色和红色三种。在一些语言中,绿色和蓝色只用一个词表达。在班图语,斯瓦希里语中,绿色和蓝色分别用草和天空的颜色来描述。阿富汗和巴基斯坦使用的一种印度-伊朗语中,“shin”一词既指绿色也指蓝色,但如果很难理解“shin”与哪种颜色有关,就可以加上斯瓦希里语中的植物或天空。希腊语还区分了一种叫做ble的较深的蓝色和一种叫做ghalazio的浅蓝色。根据Thierry等人(2009,p. 4567)的研究,这导致以希腊语为母语的人比以英语为母语的人对这些颜色的知觉辨别速度更快,从而形成了特定语言用辞对人类颜色感知的潜在影响。 Brown和Lenneberg(1954)和Lenneberg和Roberts(1956)是最早通过颜色实验来研究词汇差异源于认知差异这一观点的人之一。Berlin and Kay (1969)提出并推广了这一观点,他们发现颜色在我们的认知系统中是固有的,因此拒绝了相对主义假说。这场辩论从一个极端转向了另一个极端,可以用Kay和Regier提出的以下两个问题来概括(2006, p. 52) (1)跨语言的颜色命名很大程度上是一种任意的语言惯例吗? (2)颜色命名的跨语言差异是否导致了相应的颜色认知差异? 相对主义者认为两个答案都是肯定的,而普遍主义者则认为两个答案都是否定的。 这生成了数以百计的论文选择两个方向之一,甚至创建第三个方向:例如Gibson (2017)认为这个问题与其说与感知有关,不如说是与颜色的使用有关:“现在已经确定,母语影响一个人对世界的看法。然而,这种效应是否仅仅是由基于语言环境有意识的评价所驱动,还是反映了不同语言的个体在知觉处理方面的根本差异,目前尚不清楚。”在Kay和Regier(2006,p. 52)提出上述两个问题的三年后,Regier和Kay(2009年,第439页) 在一篇题为“沃尔夫说对了一半”的论文中做出回应:关于问题(1),颜色名称确实影响颜色感知,但主要是在右视觉领域,而在左视觉领域影响较小。关于问题(2),跨语言的颜色命名确实反映了普遍的趋势,如早期的工作所示,但也在一定程度上反映了当地的语言惯例。 如果一个关于基本颜色的简单问题的答案都如此复杂,那么其他更困难的问题的答案无法显而易见也就不足为奇了。语言和行为之间的关系还远远没有确定下来,我们将在后面看到,语言学家们仍然在争论这个问题。 作者在之后集中讨论几个案例,包括时间及其与空间的关系,名词的性别和礼貌的区别。尽管Fabb (2016)将它们定义为表面属性,可能并不代表人们在掌握一种语言时实际知道的东西,但语言学家、心理学家、认知科学家和经济学家已经对它们进行了研究。 在谈到这一点之前,有必要先看看经济学文献中的一篇论文,该论文探讨到底是语言还是文化影响了经济决策。它描述和分析了Roth等人(1991)进行的一个实验,可能没有任何意图去验证哪个语言学理论是正确的或错误的。作者在四个不同的文化和语言环境(以色列、日本、美国和南斯拉夫)中进行了两人和多人讨价还价实验(最后通牒博弈和单期市场环境)。他们得出的结论是,这四个国家不同的行为可能是由于文化而不是语言的不同。即使在今天,语言是否是文化的一个方面仍然是大家关注的问题。 2.2.2时间的表示 Whorf研究了霍皮当地美国人说的语言,发现它不包含与我们所说的时间、过去、现在、未来、或持久有关的表达;Boroditsky(2001)提到英语和中国普通话谈论时间的方式不同。尽管他们的观点都受到其他学者不同程度的反对。 Chen(2013)采取了不同的方法分析语言的语法,特别是语言如何标志未来方面。他区分了一组必须在口语中标记未来的语言,即所谓的强FTR语言,以及那些不需要标记未来的语言,称为弱FTR语言。如果你想用法语说明天会下雨。因为to rain的将来时pleuvra存在,你应该说demain, il pleuvra,如果你说demain, il pleut,那就奇怪了,因为pleut是现在时态。在英语中,你必须加上will: tomorrow it will rain(明天下雨),而你很难说tomorrow it rains(明天下雨)。法语和英语是强FTR语言。在德语中,你可以用动词regnen(to rain)和今天的heute regnet es的相同形式说明天(morgen)。但是你也可以用其他形式,如morgen wird es regnen,可以翻译成tomorrow it is going to rain。因此德语被认为是一种弱FTR语言。 通过回归分析,Chen指出,母语为强FTR和弱FTR的人在储蓄(和其他类型)行为中对未来的解释方式不同。他发现,以弱FTR语言为母语的人在许多货币和非货币行为中更倾向于未来。在任何一年里,他们的储蓄比别人多31%,退休前积累的财富比别人多39%,吸烟的可能性比别人少24%,参加体育活动的可能性多29%,肥胖的可能性少31%。Chen还发现,母语为弱FTR语言的国家比母语为强FTR语言的国家多储蓄约6%的GDP。出现这个反直觉结果的原因是,强FTR语言使未来变得更遥远,因此不那么重要(Dahl 2003)。 他的论文受到了包括达尔在内的语言学家的强烈抨击,达尔有三个主要的担忧 (1)指代将来时的非过去式(如将来时)不仅只有一种,如tomorrow, it is going to rain而不是it will rain,这使得strong- FTR和weak-FTR的区别不那么二分化 (2)一些强FTR语言,如法语和西班牙语,也会使用现在时来表示我们在不久的将来想要做的事情,并且我们可能更多地使用基于目的而不是基于预测的陈述,这再次模糊了强FTR和弱FTR的区别 (3)除了将来时的存在与否外,还有很多其他的方式来指代将来时。 Sutter等人(2015)在意大利北部的一个双语小镇进行了一项对照实验,研究了860名6至11岁的儿童在说德语(弱FTR语言)或意大利语(强FTR语言)的情况下长大的跨期选择之间的关系。结果证实了Chen的发现:说德语的孩子比说意大利语的同龄人更有可能延迟满足。 值得注意的是,Galor and Ozak(2016)和Galor, Ozak, and Sarid(2016)为Chen和Sutter提供了另一种解释。他们定义一个将来时态是否存在的哑变量,用probit模型与地理特征(纬度、海拔高度、强度、海岸长度);天气条件(降雨、温度、和公元1500年以前的不生产时期),公元1500年以前的种植收益,以及地区固定效应做回归,发现种植收益增加一个标准差导致拥有强将来时态的概率下降12 - 23%,且该发现能排除反向因果的干扰。因此,拥有更丰富的作物是更少关注未来的原因之一。 2.2.3名词的性别 在德语中,表示table的“Tisch”是男性化的,而在法语中“table”是女性化的。这是否会对认知产生影响? Boroditsky, Schmidt和Phillips(2003)总结了心理学家的发现,名词的性别确实影响思维,但不是很深。尽管如此,Borodistky(2009)指出,德语和西班牙语使用者对key这样一个词的描述,在德语中是男性化的,在西班牙语中是女性化的,会让德语使用者想到硬的、重的、金属的或有用的,而西班牙语使用者指的是金色的、可爱的、闪亮的和微小的。Borodistky还注意到,抽象实体,如死亡、罪恶、胜利或时间,根据每一种语言中单词的语法性别,在绘画或雕塑中常常被代表为男性或女性。 经济学家们也有这种想法。Mavisakalyan(2015)的研究表明,在以性别密集语言为主的国家,女性参与劳动力的比例较低,使用性别密集语言的人更有可能认为女性不应该有平等的就业机会。但这是否存在反向因果关系?Galor、Ozak和Sarid(2018)在他们最近的论文中再次表明,可能是农业生产力中性别差距的农业决定因素助长了基于性别的语法性别的存在。 2.2.4礼貌的区别 Tabellini(2008)根据两条支配代词使用的规则来区分语言: (1)对话中第一和第二人称代词的使用:在某些语言中,例如意大利语,对话中第一和第二人称代词的使用可以省略,在英语中这是很少见的; (2)在法语中,如果你很了解对方,你可以用“tu”来称呼对方;否则,你会用“vous;”在西班牙语中,”tu”和“usted”的使用也是如此,而这种差别在英语中是不存在的。 塔贝里尼认为,这些语法规则可以用来衡量信任和尊重等文化特征,它们本身也被用于第二阶段的评估,以解释制度的质量。Galor、Ozak和Sarid(2018)再次提出,等级社会的生态起源可能有助于礼貌区别的存在,并很可能是解释礼貌区别的深层变量。 2.2.5其他问题 Heblich、Lameli和Riener(2015)发现,在德国,方言影响个体的互动。如果人们来自同一个地区,有相同的口音,他们往往会合作。然而,他们更倾向于与那些用另一种口音说话的人竞争。必须补充的是,除了方言差异,这可能是其他原因造成的。Costa等人(2014)指出,当一个人使用母语或习得语言时,道德决定可能会有所不同。他们认为,母语比习得语言夹杂着更多的情感的因素,而情感的缺乏会导致更多的功利行为。 2.2.6 未完待续的故事? 支持和反对Whorf的争论还在继续。它已经有70多年的历史了,而且还在继续发展。幸运的是,语言学家和最近的经济学家都赋予了它新的生命,这两个学科之间的合作会变得更加频繁。经济学家最近研究的例子指向不同的结果。比较Galor、Chen、Sutter、Mavisakalyian和Tabellini的结论,我们可以初步得出:气候、农业条件和人类干预(耕作)似乎会影响语言,进而影响行为。即使是一个相对简单和古老的关于颜色和语言的问题引出了语言学家Regier和Kay题为“Whorf was half right”的论文,这可能也会让相对主义者和普遍主义者都感到高兴。 2.3语言的情感 各种决定和政策往往会剥夺某些群体的语言权利。语言政策不可避免地会带来社会上的牺牲,必须平衡共同利益和各群体的利益。但结果可能是痛苦的,如下面的例子所示。 斯里兰卡有两个主要的民族和语言社区:僧伽罗人和泰米尔人。他们和平共处了大约2000年。在英国统治了150年之后,该岛于1948年实现自治,这引发了两派试图推广他们自己的语言以取代英语作为官方语言。由于害怕泰米尔人的统治,占人口多数的僧伽罗人强迫签署了“仅限僧伽罗人”的法案,这引发了泰米尔少数民族的情绪化和暴力反应。一场旷日持久的内战接踵而至,夺去了数千人的生命,摧毁了这个国家。 情感显然是由一个人所说的语言引起并表达出来的。情绪会影响经济、社会和政治决策。为了量化这些影响,作者在3.2.2节中考察了一些形式化的现象,这些形式化的现象是通过使用种族语言的分化、极化和剥夺选举权利等概念来表现的。 3. 多语种国家 3.1群体识别 我们必须解决两个问题,第一个问题是确定各群体的边界,以便划分一个或几个国家,并计算由此造成的社会分化。第二个问题是,个人如何将自己与他们可能所属的社会联系起来。 的确很难确定文化群体,为了简单起见,语言经常被用作文化和种族的代理。然而,按照语言分组并不完全可靠的,于是经济学家引入语言邻近性的概念,这可以缓解二分法的不利影响。 还应该指出的是,个体可能会试图通过从群体中迁出来彰显自己不同的身份。通过内在选择他们的感知身份,个体可能改变他们的语言、口音、名字、社会网络等。Kim and Loury (2019)创造了“外迁”(out-migrating)一词,他们分析了这种选择对经济和福利的影响,认为它们可能导致社会不平等加剧。 自我认同的程度和与自己所在群体的联系程度并不能反映多语言社会的全部情况。特别是在内战和冲突的背景下,解决群体之间的关系是至关重要的,这体现了两个概念:对自己群体的认同和对其他群体的异化。 问题是语言多样性真正代表的是什么?它是否代表了偏好的多样性?它与团队之间的信任有关吗?或者语言仅仅与交流有关?在第5.1节中,作者将继续讨论这些问题。 3.2语言距离和种族语言指标 3.2.1距离的测量 为了衡量语言之间的相似性,语言学家使用两种基本方法:共时性语言学和历史性语言学。共时性语言学研究语言在某个时间点上的变化,尤其是计算语言距离。历史性语言学的思维方式是重建一种或几种语言的早期阶段,于是出现了语言树。作者列举了共时性和历时性分析中最常用的8种方法,包括:

  1. 大量比较(Mass Comparison)

  2. 词汇统计学(Lexicostatistics)

  3. 词汇距离(Lexicostatistical Distances)

  4. 编辑距离(Levenshtein Distances)

  5. 进化枝的距离(Cladistic Distances)

  6. 内部沟通距离(Intercommunication Distances)

  7. 分析声音(Analyzing Sound)

  8. 基于学习分数的距离(Distances Based on Learning Scores)

3.2.2.分解、极化和剥夺公民选举权指数 前面所描述的构建模块,即民族语言群体识别和语言距离,被结合起来定义特定社会中的分化、两极分化和剥夺权利指数。

  1. 分化指数(Fractionalization Indices)
  2. 极化指数(Polarization Indices)
  3. 剥夺公民选举权指数(Disenfranchisement Indices) 具体公式细节可见原文,本推送主要为读者提供一个宏观视角,细节还待感兴趣的读者探索。 3.3在引力模型中使用语言距离 Hagerstrand(1957)是第一个在研究瑞典移民时使用引力模型的人。Tinbergen(1962)将该模型应用于研究国家间的贸易流动,从而推广了该模型。在这些早期应用,Hagerstrand和Tinbergen使用地理距离代表摩擦和成本,之后,语言距离也被纳入研究范畴。在本节中,作者介绍了将语言距离纳入引力模型在国际贸易(3.3.1),迁移决策(3.3.2),翻译(3.3.3),洗钱(3.3.4)和金融交易(3.3.5)方面的研究。 3.4种族语言指标和经济结果 在本节中,作者介绍了分化、极化和剥夺公民权等种族语言指标对经济结果的影响。3.4.1中作者总结了分化对增长以及其他经济结果的影响,大多数文献发现语言分化对经济发展有负面影响,甚至导致了低效和腐败。3.4.2节中作者介绍了现有研究中使用的A指数(Hibbs,1973),RQ指数(Montalvo and Reynald-Querol,2002, 2005)以及RQ距离权重指数(Castaneda Dower、Ginsburgh and Weber,2017),这些指数用于衡量国内冲突水平。最后,作者使用剥夺权利指数来检验哪些语言经过一定的时间后会成为通用语言。 3.5外语习得 Selten和Pool(1991)在博弈论模型中提出了一种更广泛的方法,即个体效用随着使用共同语言进行交流的人数的增加而增加。Lazear(1999)、Gabszewicz、Ginsburgh和Weber(2011)进一步引入了学习的异质性。这导致了内部纳什均衡和封闭解的存在:在某种程度上,这两个群体都学习非母语语言,学习者的比例取决于每个群体中的个体数量和学习的成本。考虑到学习的均衡水平低于社会最优水平,可能导致效率低下。考虑到网络外部性,一个社区中的一些人依赖于另一个社区的成员来学习。这意味着,对学习进行补贴对于改善共同的社会福利是至关重要的。 3.6语言学习的经济回报 估计语言能力对工资的影响会出现著名的问题:收入可能取决于难以观测的个人技能和天赋,因此需要工具变量解决内生性。 Chiswick和Miller(2014)总结了大量关于移民语言学习的经济回报的研究。根据数据集、来源和目的地国家、语言以及性别的不同,它们的差异在5%到35%之间。Adsera和Chiswick(2007)以及Ginsburgh和Prieto-Rodriguez(2007)分别使用了1994-2000年欧洲共同体家庭追踪调查数据库来研究移民和侨民。尽管不同国家的收入差异很大,但在这两种情况下,了解移民国家的语言或在工作场所使用外语都有积极的回报。 4.多语言世界:解决方案和政策 马克斯·韦伯(1968,[1910])首先认识到语言多样性不可避免地需要某种程度的标准化。正如Jain (2017, p. 475)指出的那样,“使用统一的语言可以降低沟通成本,促进教育和扩大经济增长。然而,尝试强制使用官方语言会遇到相当大的阻力,一方面是因为语言是身份认同的重要组成部分,另一方面学习一门新语言很困难。” 作者在4.1节中的例子将讨论限制在几种语言转换策略的情况下,经济学家观察和研究改革对劳动力市场的影响。其中作者重点讨论了两分法政策,即教育从一种语言向另一种语言的重大转变。4.2节作者专门讨论平衡不同语言教育的各种政策。这种模式在印度,尼日利亚失败了,但似乎在哈萨克斯坦取得了成功。 4.1语言转变政策 考虑到语言技能所体现的人力资本的经济价值,语言转变的影响是值得关注的。学校教育的经济回报在教学语言的改变后可能增加或减少,作者在本节中列举的大多数例子表明,短期来看,语言转换对学生表现的影响有限。 摩洛哥六年级以上的教学语言从法语改为阿拉伯语,Angrist and Lavy (1997)指出取消法语义务教育导致受这一变化影响的人上学回报大幅减少;Eriksson (2014)研究了1955年南非《班图教育法》的影响,发现产生了积极的影响,与摩洛哥的情况相反。2004年,前苏联加盟共和国拉脱维亚实施了类似的改革,Ivlevs和King(2014)观察到,在改革后的早期,少数民族学校的成绩显著下降。1983年,印度共产党政府取消了公立学校小学的英语教学,Roy (2005),Chakraborty and Kapur Bakshi(2008)指出这一政策的影响是消极的,他们表明,学习英语的可能性下降1%,周薪就会下降1.6%,而这种下降在很大程度上要归因于政策的变化。Jain (2017) 利用印度的邦制,调查了官方语言政策对教育的影响,发现语言不匹配的地区的识字率低了18.8%,大学毕业率低了27.6%,1956年印度各邦语言重组后,不匹配地区的教育成就赶上了,这表明政治重组可以减轻不匹配语言政策的影响。1898年,西班牙输了与美国的战争。波多黎各公立学校的大多数小学后的年级里教学语言变成了英语。50年后,西班牙的教育重新转向西班牙语。尽管美国的政策制定者声称英语教学增加了波多黎各人的英语能力,Angrist, Chin, and Godoy (2008)则发现没有任何影响。 4.2 平衡的语言政策 1965年至1966年,印度引入了旨在追求公平的“三语方案”,但由于缺乏公众的承诺和执行该建议所需的资源,导致了该建议的失败,尼日利亚也遭遇了相同的情况。有必要指出的是,在没有适当投资的情况下改变国家官方语言不太可能拯救一种以前被边缘化的语言的经济劣势。 哈萨克斯坦2011年也引入了“三语方案”,除了哈萨克语和俄语,英语也被列为世界语言。与印度和尼日利亚相反,哈萨克斯坦投入了大量资源改善基础设施,激励人们学习英语,在政府项目中提高了对这三种语言的需求,并保持了语言多样性。哈萨克斯坦对三种语言方案的承诺程度使其前景比印度和尼日利亚更有希望。 很容易注意到,在大多数情况下,广泛和平衡的语言政策的应用会导致学习水平超过社会最佳水平。这种福利成本可以被认为是国家凝聚和文化融合的代价。这涉及到减少和消除被剥夺权利的问题,并支持这样一种论点,一个国家要在竞争日益激烈的时代取得进步,就必须把所有人口群体包括在政治和经济进程中。 5. 结论,问题和进一步研究 最后,作者讨论了值得在未来继续研究的问题,包括群体的识别、计量经济学问题、相对主义与普遍主义以及其他研究问题。 5.1群体的识别 识别一个国家的群体通常基于语言,因为这是比较容易观察到的特征。然而,正如Laitin(2000)和Fearon(2003)所指出的,语言可能不足以描述一个人的所有方面。Alesina (2003)计算了约190个国家基于语言、种族和宗教多样性的分化指数,他们发现这些指数对增长、政府政策和制度质量的影响在方向和程度上都不尽相同。 因此,未来在群体识别上的研究应该考虑语言之外的其他文化因素。Desmet、Ortuno-Ortin和Wacziarg(2017)的一篇非常有前途的论文探讨了一种基于文化规范、价值观和态度的新型多样性,利用世界价值观调查(2009)在1981年至2008年间对76个国家进行的调查。他们构建了与通常的种族语言划分指数具有相同的函数形式的文化划分指数,如

Desmet、Ortuno-Ortin和Wacziarg(2017)还定义了一个新的指数图片,该指数结合了文化和种族的多样性。 5.2计量经济学问题 第2.2、3.3和3.4节中的实证文献是基于变量之间的相关性,尽管排除了反向因果,学者通常避免使用因果关系这个词。真正的问题是,我们是否需要像Angrist和Pischke(2009,p.3)所指出的那样,做出因果性的陈述,这对于预测不断变化的环境或政策的后果是有用的,它告诉我们在另一个(或反事实的)世界里会发生什么。 我们可能满足于发现相关性,但即便只是相关,如果与误差项相关,估计的系数可能有很大的偏差,甚至符号都是相反的。因此,计算出的增长和分化之间的负相关关系甚至可能不是负的,从而导致错误的结论。然而,我们经常将这些结果解释为因果关系,并建议减少语言的多样性,这可能会导致好坏参半的结果。 在2.2节关于Sapir-Whorf假说中还有其他计量经济学问题需要进一步研究: (1) Chen(2013)和Sutter等人(2015)发现,强将来时和弱将来时对储蓄有影响。Galor和Ozak(2016)认为,时态的类型可以由公元1500年以前的作物产量和生长周期来解释。 (2) Mavisakalyan s(2015)研究指出,在语言性别密集的国家,女性参与劳动力的比例较低。Galor、Ozak和Sarid(2018)再次提出,可能是等级社会的生态起源形成了当前的名词性别。 (3) Tabellini(2008)认为礼貌规则可以用来衡量信任和尊重等文化特征,然后在第二阶段的评估中使用这些文化特征来解释制度的质量。Galor、Ozak和Sarid (2018)指出,等级社会的生态起源可能有助于礼貌区分的存在,并可能是解释礼貌区分的“深层”变量。 这三个例子引出了以下问题: (1) Chen(2013)、Sutter等人(2015)、Mavisakalyan(2015)和Tabellini(2008)是否使用了正确的语言差异变量来解释人类行为?这将使我们接受语言导致行为的假说。 (2) Galor and Ozak(2016)和Galor, Ozak, and Sarid(2018)认为作物产量和等级社会的生态起源对语言有影响,进而可能影响我们的行为。 (3)或Galor、Ozak和Sarid提到的变量直接影响我们的行为。 (4)又或者Galor, Ozak和Sarid(2016, 2018)提到的变量和语言差异都一致影响我们的行为? 其中的因果关系能否获得?或许我们该放松休谟(2017 [1748],p. 38)的著名句子,因果关系应该是这样的:“如果第一件事没有发生,第二件事也不会发生?”还是所有这些都是共同进化或相互关联?至少,这表明语言学家和经济学家还有充分的理由合作。 5.3语言,文化与行为 前面的例子表明,很难区分是语言还是文化对行为产生影响。正如Kramsch(1998,第13页)所指出的,看似相同的概念所引起的语义联想存在着文化差异。语言和文化都是一个民族价值观的组成部分,它们可能同时发展,或者在很短的时间间隔内发展,因此历史学家能够区分出哪个在前哪个在后,而经济学家几乎没有希望进行严格的因果关系检验。 然而,有一些当代案例可以证明文化对语言有影响,在这些案例中,语法遵循价值观(Everett, 2012,p 273)。女性化最终改变了思维方式以及写作和说话方式。今天,我们几乎不能在模型中将消费者或生产者写成“he”,一些作者将其改为(s)he, he/she或she/he。 5.4其他研究问题 语言学习与劳动力市场之间的关系还没有明确的理论模型。根据实证可以推断出学习东道国语言的移民的工资溢价,以及那些出生在一个国家但掌握了其他国家语言移民的工资溢价,但目前还没有做出这些决定的微观经济基础。因此,经济学家和神经科学家仍然有共同的工作要做。 语言和社会认同的问题应该引起经济学家的注意。此外,尚未探索的身份测量、构建和转换问题亟待解决,包括多重身份的可能性或在某些情况下自愿改变身份的问题。 将语言多样性整合到生产功能中也可能碰撞出有趣的研究。有研究在社会效用函数中引入了不同语言群体的数量,或土著和移民之间的文化和语言差异程度等变量。在经济演算中引入不同层次的多样性可能是有用和有前途的。 最后,Esteban、Mayoral和Ray(2012)开拓了一个关于种族分化对冲突影响的新研究线。他们发现语言距离可以驱动或者至少影响不同组织的对立。将这一论点进一步延伸,我们也许会发现,语言距离和收入不平等可能是冲突出现和持续时间的决定因素。 背景知识:1.因果推断专题:4.有向无环图DAG,2.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具! 3.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书,4.你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表,5.因果推断专题:2.因果图,6.用"因果关系图"来进行因果推断的新技能

关于Stata,1.Stata16新增功能有哪些? 满满干货拿走不谢,2.Stata资料全分享,快点收藏学习,3.Stata统计功能、数据作图、学习资源,4.Stata学习的书籍和材料大放送, 以火力全开的势头,5.史上最全Stata绘图技巧, 女生的最爱,6.把Stata结果输出到word, excel的干货方案,7.编程语言中的函数什么鬼?Stata所有函数在此集结,8.世界范围内使用最多的500个Stata程序,9.6张图掌握Stata软件的方方面面, 还有谁, 还有谁? 10.LR检验、Wald检验、LM检验什么鬼?怎么在Stata实现,11.Stata15版新功能,你竟然没有想到,一睹为快,12."高级计量经济学及Stata应用"和"Stata十八讲"配套数据,13.数据管理的Stata程序功夫秘籍,14.非线性面板模型中内生性解决方案以及Stata命令,15.把动态面板命令讲清楚了,对Stata的ado详尽解,16.半参数估计思想和Stata操作示例,17.Stata最有用的points都在这里,无可替代的材料,18.PSM倾向匹配Stata操作详细步骤和代码,干货十足,19.随机前沿分析和包络数据分析 SFA,DEA 及Stata操作,20.福利大放送, Stata编程技巧和使用Tips大集成,21.使用Stata进行随机前沿分析的经典操作指南,22.Stata, 不可能后悔的10篇文章, 编程code和注解,23.用Stata学习Econometrics的小tips, 第二发礼炮,24.用Stata学习Econometrics的小tips, 第一发礼炮,25.广义合成控制法gsynth, Stata运行程序release,26.多重中介效应的估计与检验, Stata MP15可下载,27.输出变量的描述性统计的方案,28.2SLS第一阶段输出, 截面或面板数据及统计值都行,29.盈余管理指标的构建及其Stata实现程序, 对应解读和经典文献,30.Python, Stata, R软件史上最全快捷键合辑!,31.用Stata做面板数据分析, 操作代码应有尽有,32.用Stata做面板数据分析, 操作代码应有尽有,33.没有这5个Stata命令, 我真的会活不下去!,34.第一(二)卷.Stata最新且有趣的程序系列汇编,35.第三卷.Stata最新且急需的程序系列汇编,36.第四卷.Stata最新且急需的程序系列汇编,37.干货: UN和WTO推荐的最全且权威的实证研究方法及在Stata实现!必收藏!,38.再中心化影响函数RIF回归和分解的Stata操作程序,39.R和Stata软件meta分析操作详细攻略, 对研究再开展研究的利器!,40.不能安装Stata命令咋弄?这个方法一直都比较靠谱!,41.使用Stata做结构方程模型GSEM的操作指南,42.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,43.一些Stata常见操作代码和注释, 能够让年轻学人更快掌握相关命令!44.Stata语言中的常用函数及其用法解释, 在附上42篇Stata相关学习资料

关于一些计量方法的合辑,各位学者可以参看如下文章:①“实证研究中用到的200篇文章, 社科学者常备toolkit”、②实证文章写作常用到的50篇名家经验帖, 学者必读系列、③过去10年AER上关于中国主题的Articles专辑、④AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向,⑤2020年中文Top期刊重点选题方向, 写论文就写这些。后面,咱们又引荐了①使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!,②这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授,③Python, Stata, R软件史上最全快捷键合辑!,④关于(模糊)断点回归设计的100篇精选Articles专辑!,⑤关于双重差分法DID的32篇精选Articles专辑!,⑥关于合成控制法SCM的33篇精选Articles专辑!⑦最近80篇关于中国国际贸易领域papers合辑!,⑧最近70篇关于中国环境生态的经济学papers合辑!⑨使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!⑩最近50篇使用系统GMM开展实证研究的papers合辑! 下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。