从宏观角度分析,数据类型分为定性定量两种。

定性:变量是品质特征,如车的品牌,宝马,奔驰,只是为了区分
定量:变量是数值,可以量化,如身高体重等。定量可以分为离散型和连续型。

  • 离散型一般为计数结果,如抛五次硬币正面的次数。
  • 连续型一般为测量结果,如手掌长度的测量。

 

从统计学分析,数据类型分为四种:定类,定序,定距,和定比,这四种类型是从低到高的递进关系,高级的类型可以用低级类型的分析方法来分析,而反过来却不行。

1、定类变量

定类就是给数据定义一个类别。这种数据类型能将所研究的对象区分开。例如把性别分成男女两类

 

2、定序变量  Ordinal Data:【可以分类( = 和 ≠ ),可以排序(> 和 <),但不能(+ 和 - )】

定序变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,但各个定序变量的值之间没有确切的间隔距离,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。例如文化程度可以分为大学、高中、初中、小学、文盲

 

3、定距变量

注意:定距变量没有绝对零点

定距变量的值之间可以比较大小,两个值的差有实际意义。但乘法是没有意义的。但是加减法有效。

例如华氏温度:10,20,30,华氏度40不是20的两倍热

4、定比变量

注意:定比变量有绝对零点

定比变量除了具有定距变量的特性外,还具有一个真正的零点,因而它具有乘与除(×、÷)的数学特质。
如A的体重是60kg,而B的体重是30kg,可以算出前者是后者的两倍重,因为其零点是绝对的。

定比变量是最高测量层次的变量。

 

如何将定类变量转化为定量变量Python 定类变量属于什么_定性、定量、定距、定比