目录

5.1.1 实现步骤

5.1.2 常用分类预测算法:

5.1.3 回归分析

1. logistic回归分析介绍:

2. 决策树:

3. 人工神经网络ANN

4. 分类预测算法评价 测试集效果评价指标::

总结:

5.挖掘建模

5.1 分类与预测

5.1.1 实现步骤

分类:

输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别

预测:

建立两种或以上的变量间互相依赖的函数模型,然后进行预测或者控制

实现:

  1. 学习步: 归纳训练集,建立分类模型,得到分类规则
  2. 分类步: 测试集评估分类准确率,可接受的话,使用该模型对未知样本进行预测
  3. 预测步: 模型通过检验后进行预测或者控制

5.1.2 常用分类预测算法:

 

5.1.3 回归分析

包含:

 

1. logistic回归分析介绍:

2. 决策树:

 

 

 

3. 人工神经网络ANN

 

4. 分类预测算法评价 测试集效果评价指标::

 

算法

描述

回归分析

确定属性与其他变量之间相互依赖关系的最常用统计模型,包括:线性回归,非线性回归,logistic回归,ridge回归,lasso回归,主成分回归,偏最小二乘回归

决策树

自顶向下的递归方式,在内部节点进行属性值比较,根据不同的属性值从该节点向下分支,得到最终也节点的学习划分的类

人工神经网络

模仿大脑圣经网络结构和功能而建立的信息处理系统,表示神经网络的输入输出之间的关系模型

贝叶斯网络

信度网络,bayes方法的扩展,目前不确定知识表达和推理领域的最有效模型之一

支持向量机

通过某种非线性映射,把低维度的非线性转换为高维的线性可分问题,在高位空间进行线性分析的方法