关于本福特定律的简单解释和推导,参见:
https://zhuanlan.zhihu.com/p/440462854
思考本福特定律,与齐夫定律对照,它们之间似乎可以相互推导,是真的吗?
本福特定律说首数为的概率:
写成连续的形式:
从这个形式上看,它是一个定积分 。设不定积分式为,则:
积分实际上就是所有首数字概率的积累分布函数,其概率密度函数为一个反比例函数:
从本福特定律的概念上讲,首数字为的概率可以写成两种形式:
- 定积分的形式:
- 概率密度的形式:
连续化是为了拟合微积分计算,回到离散的形式:
换一种写法:
这看起来符合齐夫定律。来看下是不是。
经过了连续~离散变换,连续情况下的反比例形式不能用于离散情况的计算,只能直观理解。现在直接从本福特定律的结论入手,实际计算一下:
设:
快速逼近,但仅在取1~9时,有意义,分别为:
单调递增,计算和的值,分别为:
它们相差非常小,可近似为符合齐夫定律。
这是为什么?
通过上述推导,和是可以相互转换的,只要可以将事情抽象成的定积分形式,结合概率密度函数和积累分布函数的概念,一定可以通过求导换算成,后者正好是一个反比例函数。这意味着位标与函数值的乘积是一个常数,这是满足齐夫定律的条件。
那么齐夫定律的典型case,城市人口问题是否可以写成类似的形式呢?是可以的。
城市人口来自于外来者的定居(城市没有土著,土著是乡村的概念),一个人选择哪个城市定居取决于多个维度,列如下:
…
设人们有个城市可选,它们综合排名如下:,人们选择定居地时,会在这个城市中考虑:
- 若,则优先考虑
若问是什么初始因素导致了城市规模的初始差异,就要涉及优先依附原则了,这又要牵扯到无标度网络的生长动力学,本文不谈这些,所以直接假设了排名。
几乎每人都会考虑,但,可能有人不关心。终于,可以将所有人按照下列方式分类:
- 只考虑的人。
- 同时考虑的人。
- 同时考虑的人。
- 同时考虑的人。
- 同时考虑的人。
- …
无论如何,对于任何维度,排名靠前的城市一定被优先考虑。
进行下面的类比:
- 把上述考虑维度看作自然数集首数概率问题中的个位,十位,百位…
- 把上述待考虑城市看作自然数集首数概率问题中的
- 把上述待定居人们的分类看作自然数集首数概率问题的个位数,十位数,百位数…
显然可以导出遵循齐夫定律的城市规模分布同样也遵循本福特定律:
- 第大城市的人口占比:
浙江温州皮鞋湿,下雨进水不会胖。