什么是帕累托分布

  帕累托分布是以意大利经济学家维弗雷多·帕雷托命名的。 是从大量真实世界的现象中发现的幂次定律分布。这个分布在经济学以外,也被称为布拉德福分布。

  帕累托因对意大利20%的人口拥有80%的财产的观察而著名,后来被约瑟夫·朱兰和其他人概括为帕累托法则(80/20法则),后来进一步概括为帕累托分布的概念。

 

帕累托分布的概述

  19世纪末期,意大利经济学家维弗雷多·帕累托认为,贫与富的存在,既是经济问题,也有政治原因。

  帕累托在研究英国人的收入分配问题时发现,绝大部分社会财富最终总会流向少数人群;他还发现,某一部分人口占总人口的比例,与这一部分人所拥有的财富的份额具有比较确定的计量经济关系;进一步的研究证实,这种不平衡模式可以重复出现,甚至可以预测。经济学把这一社会财富的分布状态,称为“帕累托分布”。

  帕累托分布可以归纳为一个非常简洁的表述:通过市场交易,20%的人将占有80%的社会财富,如果交易可以不断进行下去,那么,“在因和果、努力和收获之间,普遍存在着不平衡关系,典型的情况是:80%的收获来自20%的努力;其他 80%的力气只带来20%的结果”。丹尼尔·贝尔在《帕累托分布与收入最大化》中进一步叙述到:“如果待分配的财富总量是100万元,人数为100人,那么我们会有这样一组对应的分配比例:排在前面的20个人,分得80万元;同理,这20人中的4个人,分得64万元;4个人中的1个人,分得50万元。”

  如果我们把这些数据用数学公式简单处理一下,就会显示一条收缩中的“财富曲线”以及一条发散中的“贫困曲线”。它的最终走向,是必然会“清零”的,也只有如此,“财富”中所包含的生产力因子才能重新释放出来。

  帕累托分布从经济学角度论证出,社会分配的“绝对的失衡”必然导致“绝对的贫困”,甚至导致“宗教末日审判”的来临,除非我们可以通过政治手段,人为地阻止财富向高端不断聚集,否则,贫富双方的利益冲突是不可避免的。

 

帕累托分布的函数

  帕累托分布(Pareto distributions)、马太效应_数据挖掘

  图:帕累托分布 (xmin=1)

  在帕累托分布中,如果X是一个随机变量, 则X的概率分布如下面的公式所示:

帕累托分布(Pareto distributions)、马太效应_数据挖掘_02

  其中x是任何一个大于xmin的数,xminX最小的可能值(正数),k是为正的参数。帕累托分布曲线族是由两个数量参数化的:xmink。分布密度则为

帕累托分布(Pareto distributions)、马太效应_数据挖掘_03

  帕累托分布属于连续概率分布。

  “吉普夫定律”, 也称为“zeta 分布”, 也可以被认为是在离散概率分布中的帕累托分布。 一个遵守帕累托分布的随机变量的期望值为 帕累托分布(Pareto distributions)、马太效应_数据挖掘_04 (如果 帕累托分布(Pareto distributions)、马太效应_数据挖掘_05, 期望值为无穷大) 且随机变量的标准差为 帕累托分布(Pareto distributions)、马太效应_数据挖掘_06 (如果 帕累托分布(Pareto distributions)、马太效应_数据挖掘_07, 标准差不存在)。

被大致认为的帕累托分布

被认为大致是帕累托分布的例子有:

  • 在现代工业资本主义创造了大量中产阶级之前,财富在个人之间的分布。
  • 甚至在现代工业资本主义创造了大量中产阶级之后,财富在个人之间的分布。
  • 人类居住区的大小
  • 对维基百科条目的访问
  • 接近绝对零度时,爱因斯坦凝聚的团簇
  • 在互联网流量中文件尺寸的分布
  • 油田的石油储备数量
  • 龙卷风带来的灾难的数量

 

相关背景介绍:

马太效应(Matthew Effect),指强者愈强、弱者愈弱的现象,广泛应用于社会心理学、教育、金融以及科学领域。马太效应,反映的社会现象是两极分化,富的更富,穷的更穷。名字来自圣经《新约·马太福音》一则寓言: “凡有的,还要加倍给他叫他多余;没有的,连他所有的也要夺过来”。“马太效应”与“平衡之道”相悖;与“二八定则”类似,是十分重要的人类社会规律。中国古代哲学家老子曾提出类似的思想:“天之道,损有余而补不足。人之道则不然,损不足以奉有余。”
内涵:指存在的两极分化现象。
1968年,美国科学史研究者罗伯特·莫顿(Robert K. Merton)提出这个术语用以概括一种社会心理现象:“相对于那些不知名的研究者,声名显赫的科学家通常得到更多的声望;即使他们的成就是相似的,同样地,在一个项目上,声誉通常给予那些已经出名的研究者”。
罗伯特·莫顿归纳“马太效应”为:任何个体、群体或地区,在某一个方面(如金钱、名誉、地位等)获得成功和进步,就会产生一种积累优势,就会有更多的机会取得更大的成功和进步。
此术语后为经济学界所借用,反映赢家通吃的经济学中收入分配不公的现象。
社会心理学上也经常借用这一名词。
积极和消极的影响:
从积极的方面来说,一个人只要努力,让自己变强,就会在变强的过程中受到鼓舞,从而越来越强。从消极的方面来说,这社会上大多数人并不具有足以变强的毅力,马太效应就会成为逃避现实拒绝努力的借口。态度积极主动执着那么你就获得了精神或物质的财富,获得财富后你的态度更加强化了你的积极主动,如此循环,你才能把马太效应的正效果发挥到极致。
出处:
马太效应的名字就来源于圣经《新约·马太福音》中的一则寓言:从前,一个国王要出门远行,临行前,交给3个仆人每人一锭银子,吩咐道:“你们去做生意,等我回来时,再来见我。”国王回来时,第一个仆人说:“主人,你交给我的一锭银子,我已赚了10锭。”于是,国王奖励他10座城邑。第二个仆人报告:“主人,你给我的一锭银子,我已赚了5锭。”于是,国王奖励他5座城邑。第三仆人报告说:“主人,你给我的1锭银子,我一直包在手帕里,怕丢失,一直没有拿出来。 ”于是,国王命令将第三个仆人的1锭银子赏给第一个仆人,说:“凡是少的,就连他所有的,也要夺过来。凡是多的,还要给他,叫他多多益善。”这就是“马太效应” ,反映当今社会中存在的一个普遍现象,即赢家通吃。


二八定律又名80/20定律、帕列托法则(定律)也叫巴莱特定律、最省力的法则、不平衡原则等,被广泛应用于社会学及企业管理学等。
分析方法:
80/20分析法检验两组类似数据之间的关系,并用来改变它们所描述的关系。一个主要用途是去发现该关系的关键起因——20%的投入就有80%的产出,并在取得最佳业绩的同时减少资源损耗。
假如20%喝啤酒的人喝掉70%的啤酒,那么这部分人应该是啤酒制造商注意的对象。尽可能争取这20%的人来买,最好能进一步增加他们的啤酒消费。啤酒制造商出于实际理由,可能会忽视其余80%喝啤酒的人,因为他们的消费量只占30%。
同样的,当一家公司发现自己80%的利润来自于20%的顾客时,就该努力让那20%的顾客乐意扩展与它的合作。这样做,不但比把注意力平均分散给所有的顾客更容易,也更值得。再者,如果公司发现80%的利润来自于20%的产品,那么这家公司应该全力来销售那些高利润的产品。
80/20分析法的第二个主要用途是对80%的投入只产出20%的生产状况进行改进,使之发挥有效作用。
不同于线性思维,我们应该系统并谨慎地应用80/20分析法,因为线性思维会导致对80/20原则的误解,也可能会导致滥用。“不要轻易地认为某一变量是关键的原因是其他每个人都会关注……这就是线性思维。80/20分析法赋予的最有价值的洞察力总是检验别人都忽视的非线性关系。”二八现象:
1.管理学:通常一个企业80%的利润来自它20%的项目;这个80/20定二八定律图示
律被一再推而广之--经济学家说,20%的人手里掌握着80%的财富。有这样两种人,第一种占了80%,拥有20%的财富; 第二种只占20%,却掌握80%的财富。
-漠视20%80%两者相关性,如同只认可喂饱口腹的最后一口饼子
2.心理学:20%的人身上集中了人类80%的智慧,他们一出生就鹤立鸡群。
大智出有大伪,朴素的力量同样托起了蓝天
3.日常生活中的“二八法则”:以下是二八定律在生活中的体现:
20%的重要软件需要80%的时间去测试
20%的人成功------------------80%的人不成功 唯成功论近似于唯利是图,没有大众默默无闻忍辱负重怎么凸显‘人上人’
20%的人用脖子以上赚钱--------80%的人脖子以下赚钱
20%的人正面思考--------------80%的人负面思考
20%的人买时间----------------80%的人卖时间
20%的人找一个好员工----------80%的人找一份好工作
20%的人支配别人--------------80%的人受人支配
20%的人做事业----------------80%的人做事情
20%的人重视经验--------------80%的人重视学历
20%的人认为行动才有结果------80%的人认为知识就是力量
20%的人我要怎么做才有钱------80%的人我要有钱我就怎么做
20%的人爱投资----------------80%的人爱购物
20%的人有目标----------------80%的人爱瞎想
20%的人在问题中找答案--------80%的人在答案中找问题
20%的人在放眼长远------------80%的人只顾眼前
20%的人把握机会--------------80%的人错失机会
20%的人计划未来--------------80%的人早上起来才想今天干嘛
20%的人按成功经验行事--------80%的人按自己的意愿行事
20%的人做简单的事情----------80%的人不愿意做简单的事情
20%的人明天的事情今天做------80%的人今天的事情明天做
20%的人如何能办到------------80%的人不可能办到
20%的人记笔记----------------80%的人忘性好
20%的人受成功人的影响--------80%的人受失败人的影响
20%的人状态很好--------------80%的人态度不好
20%的人相信自己会成功--------------80%的人不愿改变环境
20%的人永远赞美、鼓励--------------80%的人永远谩骂、批评
20%的人会坚持--------------80%的人会放弃
20%的人敢于面对困难--------------80%的人逃避现实
20%的人认为他们应该满足以上的80%--------------80%的人觉得上面说的我有20%就好
——20%的罪犯的罪行占所有犯罪行为的80%;
——20%的汽车狂人,引起80%的交通事故;
——20%的已婚者,占离婚人口的80%(那些不断离婚的人,扭曲了统计数字);
——世界上大约80%的资源,是由世界上20%的人口所消耗;
——世界财富的80% 为20%的人所拥有;
——80%的能源浪费在燃烧上,只有其中的20%可以应用到车辆中,而这20%的投入,却回报以100%的产出;
——在一个国家的医疗体系中,20%的人口与20%的疾病,会消耗80%的医疗资源。
——20%的产品或20%的客户,为企业赚得约80%的销售额;
总而言之,在原因和结果、投入和产出、努力和报酬之间存在的这种不平衡关系,可以分为两种不同类型:多数,它们只能造成少许的影响;少数,它们造成主要的、重大的影响。

20%的强势品牌,占有80%的市场份额。一般来说,第一品牌的市场占有率比第二品牌高出一倍以上,在行业中是价值最大的品牌。在网络界,三大门户网站无论是在吸引力方面,还是收入方面都占据网络产业的绝大部分。
“二八定律”之所以得到业界的推崇,就在于其提倡的“有所为,有所不为”的经营方略,确定了传媒业的视野。