* * * * 四分位差(quartile deviation) 对顺序数据离散程度的测度 也称为内距或四分间距 上四分位数与下四分位数之差 QD = QU – QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 未分组数据—箱线图(box plot) 用于显示未分组的原始数据的分布 箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成 其绘制方法是: 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 未分组数据—单批数据箱线图(箱线图的构成) 中位数 4 6 8 10 12 Q U Q L X 最大值 X 最小值 简单箱线图 可以把若干行命令保存在一个文本文件中,然后用source 函数来运行整个文件: > source("E:/lian.R") > source("E:/lian1.txt") 注意字符串中的反斜杠。用sink()函数可以把以后的输出从屏幕窗口转向到一个外部文本文件,例如: > sink(“E:/lianresult.txt") 要恢复输出到屏幕窗口,使用:> sink() 在S中还可以用“?”号后面跟要查询的函数来显示帮助信息,例如:> ?c > ?"==" 例2:计算6, 4, 7, 8,10的均值和标准差,把若干行命令保存在一个文本文件(比如E:\lian2.R)中,然后用source 函数来运行整个文件。 a ?fivenum > fivenum(0:100) > fivenum(1:100) >fivenum(c(rnorm(100))) > fivenum(c(rnorm(100),-1:1/0)) 实验作业 1、查询stem的函数帮助信息,并用帮助文件 中的案例进一步学习. 绘制 12 12 11 10 9 10 12 的茎叶图。 2、绘制y=x3 +sin(x)*cos(x)的函数图,并加注 图例“自变量X”、“函数Y”、“示意图”. 要求:需给出程序、结果,存成word文档 发送到 52 用户名:r 密码:123456 一个R的演示会话 见相应文件 作为阅读材料 附录一 S常用函数参考 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 rep:重复 NA:缺失值 seq,from:to,sequence:等差序列 NULL:空对象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:对象属性 mode,typeof:对象存储模式与类型 names:对象的名字属性 二、字符串处理 character:字符型向量 nchar:字符数substr:取子串 format,formatC:把对象用格式转换为字符串 paste,strsplit:连接或拆分 charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配与替换 三、复数 complex,Re,Im, Mod,Arg,Conj:复数函数 四、因子 factor:因子 codes:因子的编码 levels:因子的各水平的名字 nlevels:因子的水平个数 cut:把数值型对象分区间转换为因子 table:交叉频数表 split:按因子分组 aggregate:计算各数据