前言

     掌握一门核心课程,一定要从其定义,应用环境,和其他知识点之间的联系入手,纵向对比,横向对比,比较相同点,比较不同点。这样才能加深对知识的掌握,做到灵活应用。从思想方法与具体实践来讲,一旦理解和知识点,思想方法容易记忆,很容易想到,但是具体的算法可能容易忘记,到使用的时候有点无能为力的感觉,不过掌握了思想方法,才知道什么场景可以使用,什么场景不可以使用。思想方法是基础,算法是关键,解决问题是目的。以多元统计分析为例,本节主要讲述多元统计分析的知识点。

第一章  多元统计基础

      多元,即多个变量。可以为一个向量,也可以为一个矩阵。向量的话为单一的截面数据或者时间序列数据,矩阵的话可以为面板数据,或者是多个变量构成的截面数据或者时间序列数据。那么在此和Python中的列表和字典有什么区别呢?sql server 与 R 以及 SPSS表达变量的方式,都是一致的,同一列表示一个变量,同一行表示一个样本。不同环境,可以对行列进行转置,以便实现自己的目的。

第二章  聚类分析

      聚类分析方法:对样本聚类,对变量聚类。主要方法有模糊聚类法,K-mean 聚类法,系统聚类法等等

      掌握欧氏距离,马氏距离,明考斯基距离。距离与中心点的远近,半径之间的关系。

第三章  方差分析

      单样本的方差分析,两独立样本的方差分析,两配对样本的方差分析。

第三章  主成分分析

      采用降纬的方式,将多个存在相关关系的变量整合为几个互相独立的变量,用较少的变量来解释,根据各个新变量对解释结果方差的大小,保留几个主要成分即可。在此可不可以和回归分析的多重共线性关联,当构建回归分析的时候,一旦存在多重共线性,可以使用主成分分析,得到新变量,消除共线性?

第四章  因子分析

      因子分析,也是采用降纬的方式,

 

第五章  典型相关分析

      在此联想到pearson相关性,Kendall相关性以及。。。?共三种相关性

 

第六章  联合分析

      比较经典的案例就是购房者对买房地点的选择,考虑交通,房价,安全,距离上班地点的远近等等。