一、实验内容
思想:在一些已知研究对象用某种方法已经分成若干类的情况下,确定新的样本属于已知类别中的哪一类。
二、实验要求
1、以舒张期血压和血浆胆固醇含量预测被检查者是否患冠心病。测得15名冠心病患者和16名健康人的舒张压X1(mmHg)及血浆胆固醇含量X2(mg/dL),结果见下表。
(1)对每一组数据用不同的符号做两变量的散点图,观察它们在平面上的散布情况,并判断对该组数据做判别分析是否合适;
(2)分别建立距离判别(等方差和不等方差)、Fisher判别和Bayes判别分析模型,计算各自的判别符合率,以此确定哪种判别方法最恰当;
(3提交报告三、实验工具
R软件
解答
1、判别是否适合做判别分析?
先把表格里面的数据存放到txt中,方便后续实验操作
- 读取数据
data=read.table("C://Users//Administrator//Desktop//r.txt",header=F)//读取数据
attach(data) //固定数据
data //显示数据
- 绘制散点图
plot(V2,V3) //绘制散点图
- 标记散点图标示点的属性
test(V2,V3,V4,adj=-0.5)
- 分析散点图有上面的图我们可以发现标志‘1’(这里是冠心A组)数据大多都处于图像的右上方,而发现标志‘2’(这里是冠心B组)数据大多都处于图像的左下方,我们大概可以画一个分割线,如下图所示,所以适合做辨别分析
- 2、建立距离判别、Fisher判别和Bayes判别分析模型?
- 创建距离判别,并求判别符合率
- 所以距离判别的符合度约为0.83
- 创建Fisher判别,并求判别符合率
- 所以Fisher判别的符合度约为0.76
- 创建Bayes判别,并求判别符合率
- 所以Bayes判别的符合度约为0.76
比较三种判别可知距离判别方法为最佳的判别方法!!
今天是10.24号,写此博客其实只是为了得勋章。哈哈哈哈,祝大家节日快乐呀!加油加油!!!
😉😉😉😉