平均值是若干种可以用于描述样本的典型值或几种趋势的汇总统计量之一。

变异系数:比较两组的变化程度可以计算变异系数,即标准差除以均值。

期望

1.离散型

离散型随机变量X的取值为 

 , 

 为X对应取值的概率,可理解为数据 

 出现的频率 

 ,则:

并且保证该级数绝对收敛,对于随机变量的取值来说我们只关心值的不同而不关心值的顺序,只要得到的值和所对应的概率相同,就可以保证期望也相同,同时级数也收敛。

2.连续型

对于连续性随机变量X的概率密度函数为f(x),若积分

 绝对收敛,则定义X的数学期望为

上述中表示f作用于x时,f(x)的平均值。连续型随机变量可以扩展到多个随机变量

对于连续性随机变量X、Y的函数为Z=g(X,Y),(X,Y)的概率密度函数为f(X,Y),则定义X、Y的数学期望为

期望又称均值,是为了描述集中趋势,而方差则是描述分散的情况。

性质:

(1)常数C的期望,E(C)= C

(2)X为随机变量,C为常数,则E(CX)=CE(X)

(3)X、Y为随机变量,则E(X+Y)=E(X)+E(Y)

(4)X、Y为随机独立变量,则E(XY)=E(X)E(Y)(对于多个独立变量也适用)

方差

设X是一个随机变量,如E(X-EX)^2存在,则称为随机变量X的方差,记为DX,方差的平方根叫做标准差或者根方差。

以此来度量X与其均值EX的偏离程度,若DX较小则说明X的取值比较集中在EX的附近,反之,若DX较大则说明X的取值比较分散。因此,DX是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。

性质:

(1)常数C,D(C)= 0

(2)X为随机变量,C为常数,则D(CX)=C^2D(X)

(3)X、Y为相互独立,则D(X+Y)=D(X)+D(Y)

(4)DX=0的充要条件是X取某一常数值a的概率为1,即P(X=a)=1,a=EX

协方差

若(X,Y)为一个二维随机变量,若E(X-EX)(Y-EY)存在,则称为他为X与Y的协方差,记作Cov(X,Y),即

Cov(X,Y)=E(X-EX)(Y-EY)

              =E(XY)-E(yEX)-E(XEY)+EXEY

              =E(XY)-EXEY

性质:

(1)a和b为常数,Cov(aX,bY)=abCov(X,y)

(2)Cov(X1+X2,Y)=Cov(X1,y)+Cov(X2,Y)

描述X与Y之间相互关系的数字特征,如果两个随机变量X和Y是相互独立,则协方差为0。协方差的绝对值如果很大则意味着变量值变化很大并且它们同时距离各自的均值很远。如果协方差是正的,那么两个变量都倾向于同时取得相对较大的值。如果协方
差是负的,那么其中一个变量倾向于取得相对较大的值的同时,另一个变量倾向于取得相对较小的值。

缺点:

(1)它的大小依赖于计量单位

(2)它的数值不尽与X,Y本身的取值有关,而且还与各随机变量关于他们的数学期望的偏差有关。如果随机X或Y中的任何一个与其数学期望的偏差较小,那么无论X,Y之间联系如何紧密,他们的协方差的绝对值都会很小。

协方差矩阵的对角元是方差;

相关系数

若(X,Y)为一个二维随机变量,若Cov(X,Y)存在,且DX>0,DY>0,则r(X,Y)为相关系数,记为ρ

相关系数克服了协方差具有的两个缺点。

定理:

(1)设ρ为X与Y的相关系数,则a.|ρ|<=1; b.|ρ|=1的充要条件是存在常数a,b使P(Y=a+bX)=1

(2)随机变量X与Y不相关(ρ=0)与下面结论是等价的:a.Cov(X,Y)=0; b.D(X+Y)=D(X)+D(y),D(X-Y)=D(X)+D(y);  c.E(XY)=EXEY;


总结

相互独立和不相关是有明显的区别:不相关是指他们之间不存在线性关系,而相互独立则说明他们之间没有任何关系。