概述

今天逛B站时看到了李永乐老师用“本福特定律”验证拜登选票的真实性的文章,在这里分享一下。感觉挺有意思的,纯分享而已。

No.1 定义

根据我们的自然认知,在不同位数的数据中以1为首位的概率为1/9。

一位数 P1=1/9

二位数 P1=10/90=1/9

三位数 P1=100/900=1/9

.......

然后在实际中并非如此,自然杂乱无章的数据首位为1的概率约为30.1%。推广开来也就是越大的数以其为首位出现的概率越低,以上就是本福特定律的定义。

No.2 说明

在10进制中,首位为n的概率为Pn=lg((n+1)/n).

P1=lg2=30.1%

P2=lg(3/2)=17.6%

......

P9=lg(10/9)=4.6%

总体如下图所示。

** No.3 应用**

应用的前提是数据需要符合一部分要求。

1.非人为规律

2.数据之间的跨度大

李老师举了很多例子去验证,如视频播放量、地区人口、国家GDP、国土面积、菲波那切数列等。