术语中英对照
自变量 :independent variable
因变量 :dependent variable
外在因素: extraneous factors
潜在变量:lurking variables
散点图:scatter spot
对照实验:a controlled experiment
调查问卷:survey
总体:population
抽像概念:constructs
对照组:comparison group
双盲测试:Double Blind
随机样本:random sample
群体参数:pupulation parameter
样本误差:sampling error
众数:mode
中位数:median
平均数:mean
均匀分布:uniform distribution
异常值:outlier
箱线图:boxplot
平均偏差:average deviation
方差:variance
标准偏差:standard deviation
抽样分布:sampling distribution
中心极限定理:central limit theorem
标准误差:standard error
抽样误差:sampling error
抽样分布:sampling distribution
频率表:frequency table
绝对数值:absolute number
类别:category
区间:interval
组距:binsize
直方图:histogram
柱状图:bar grath
正态分布:nomal distribution
英语充电:
这是1个非常重要的概念,我们要去深入理解它:Now this is a really important concept ,and we're going to try to drive this point home
相关并不代表因果:Correlation does not imply causation
硕士论文:masters thesis
远程进行:conducted remotely
有根据的猜测:enduated guess
一般来说:in general
小学:an elementary school
华氏72度: 72 degree Fahrenheit
在。。。拿不定主意:debating between
偏离基准不受很大影响:It's not affected much by departures from the norm
期末考试:final exam
提供数据如何分散的概要信息:provide a quick thumbnail picture of how spreed out data is
方便是有代价的:convenience comes out of price
初步了解:barely dipping our toes in the water
非常难的:this is very tricky
相互抵消:cancell each other out
受欢迎程度:Popularity Score
概率密度函数:Probability Density Function
术语定义
自变量:不受外界影响的变量
因变量:随自变量变化而变化的变量
例如:早睡,精神好,早睡晚睡即自变量,精神为因变量
外在变量:除了早睡,晚上吃的多不多也会影响第2天的精神,吃就是一个外在变量,在对照实验中,外在变量需要被控制
潜在变量与外在变量定义一致
双盲测试:观察者和被测试者都不知道自变量甚至因变量,只有研究人员才知道所有实情。例如在对照实验中,为了测试安眠药的睡眠效果,1组给真正的安眠药,1组给外观一致的安慰剂(无安眠效果),睡眠时间,睡眠地点等外在变量都控制一致,观察记录者只负责记录评分被测试者的睡眠,也不知道被测试者真正吃的什么药
直方图:
1.x 轴只能代表数值数据 ,不能代表类别数据
2.组距间没有间隙
柱状图:
x轴可以代表数值数据和类别数据
群体参数:μ、σ
众数:出现次数最高的值
中位数:位于中间的数,例如:奇数个 1234567,4是中位数,偶数个:123456 (3+4)/2=3.5, 3.5是中位数
平均数:求所有数的平均值
四分位差:IQR = Q3-Q1,将一组数字从小到大排列,并用中位数把这组数字,分成个数相同的两部分,分别算出前半部分的中位数记为Q1,后半部分的中位数记为Q3 例一组数字:4563217 按从小到大排列并以中位数分组: 123 | 4 | 567,那么,Q1=2,Q2=4,Q3=6
箱线图:用来图形化四分位差的一种图形
异常值计算公式:outlier < Q1-1.5(IQR) 或 outlier >Q3 +1.5(IQR)
方差计算公式:Σ(Xi-μ)^2/n
平均差:方差求根
样本标准误差:SE=σ/√n
样本均值分布的均值与总体平均值相等
所有的正态分布图都可以归一为标准正态分布图,通过计算Z值,查询Z值表,找到概率
Z值=(x-μ)/σ