前言
掌握一门核心课程,一定要从其定义,应用环境,和其他知识点之间的联系入手,纵向对比,横向对比,比较相同点,比较不同点。这样才能加深对知识的掌握,做到灵活应用。从思想方法与具体实践来讲,一旦理解和知识点,思想方法容易记忆,很容易想到,但是具体的算法可能容易忘记,到使用的时候有点无能为力的感觉,不过掌握了思想方法,才知道什么场景可以使用,什么场景不可以使用。思想方法是基础,算法是关键,解决问题是目的。以多元统计分析为例,本节主要讲述多元统计分析的知识点。
第一章 多元统计基础
多元,即多个变量。可以为一个向量,也可以为一个矩阵。向量的话为单一的截面数据或者时间序列数据,矩阵的话可以为面板数据,或者是多个变量构成的截面数据或者时间序列数据。那么在此和Python中的列表和字典有什么区别呢?sql server 与 R 以及 SPSS表达变量的方式,都是一致的,同一列表示一个变量,同一行表示一个样本。不同环境,可以对行列进行转置,以便实现自己的目的。
第二章 聚类分析
聚类分析方法:对样本聚类,对变量聚类。主要方法有模糊聚类法,K-mean 聚类法,系统聚类法等等
掌握欧氏距离,马氏距离,明考斯基距离。距离与中心点的远近,半径之间的关系。
第三章 方差分析
单样本的方差分析,两独立样本的方差分析,两配对样本的方差分析。
第三章 主成分分析
采用降纬的方式,将多个存在相关关系的变量整合为几个互相独立的变量,用较少的变量来解释,根据各个新变量对解释结果方差的大小,保留几个主要成分即可。在此可不可以和回归分析的多重共线性关联,当构建回归分析的时候,一旦存在多重共线性,可以使用主成分分析,得到新变量,消除共线性?
第四章 因子分析
因子分析,也是采用降纬的方式,
第五章 典型相关分析
在此联想到pearson相关性,Kendall相关性以及。。。?共三种相关性
第六章 联合分析
比较经典的案例就是购房者对买房地点的选择,考虑交通,房价,安全,距离上班地点的远近等等。