一、科学研究的基本过程和方法
1、基本过程
科学研究的目的在于探求新的知识、理论、方法、技术和产品。基本过程包括3个环节:
a、根据本人的观察了解或前人的观察(文献)对所研究的命题形成一种认识或假说
b、根据假说所涉及的内容安排相斥性试验或抽样调查
c、根据试验或调查所获的资料进行推理,肯定或否定或修改假说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的认识或理论逐步发展、深化。
2、基本方法
a、选题
b、文献
c、假说(归纳、演绎)
d、假说的检验
e、试验的规划与设计
比较试验中比较的对象不一定只有两个,可以是一组对象间的比较。这组比较的对象是按假说的内涵选定的,称为一组处理。
试验方案狭义:这一组处理可能是某一因子(因素)量的不同级别或质的不同状态(水平),也可能是不同因子的不同级别(或状态)的组合,全部处理规定了整个研究的内容和范围,称为试验方案。排除系统误差和控制偶然误差的试验设置称为试验设计。
试验方案广义:包括实施步骤在内的整个试验计划。确定试验方案是试验规划与设计的核心部分。‘唯一原则’。整个研究工作的设计。
二、试验方案
1、试验因素与水平
试验方案是根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。
被固定的因子在全试验中保持一致,组成了相对一致的试验条件;被变动并设有待比较的一组处理的因子称为试验因素,简称因素或因子(factor),试验因素的量的不同级别或质的不同状态称为水平(level)。试验因素水平可以是定性的,不同类别,具有质的区别,称为质量水平;定量的,具有量的差异,称为数量水平
按供试因子的多少分类:
(1)单因素试验(single-factor experiment)整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。最基本、最简单的试验方案。 (2)多因素试验(multiple-factor or factorical experiment) 在同一试验方案中包含两个或两个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。各因素不同水平的组合称为处理组合(treatment combination)。处理组合数是各供试因素水平数的乘积。目的在于明确各试验因素的相对重要性和相互作用,从中选出一个或几个最优处理组合。多因素试验的效率常高于单因素试验。
(3)综合性试验(comprehensive experiment)试验中各因素的各水平不构成平衡的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合。目的在于探讨一系列供试因素,某些处理组合的总和作用,不在于检测因素的单独效用和相互作用。 (1)和(2)是分析性的试验;(3)是在于对起主导作用的那些因素及其相互关系已基本清楚的基础上设置的试验。处理组合是一系列经过实践初步证实的优良水平的配套。
2、试验指标与效应
用于衡量试验效果的指示性状称试验指标(experimental indicator)。单指标、多指标
过简难以全面准确地评价试验结果,功亏一篑;
过繁琐增加不必要浪费。试验指标较多时,要分清主次,抓住主要方面。
试验因素对试验指标所起的增加或减少的作用称为试验效应(experimental effect)。
简单效应(simple effect):在同一因素内两种水平间试验指标的相差
主要效应(main effect)/ 主效: 一个因素内各简单效应的平均数称平均效应,亦称主效。
交互作用效应(interaction effect):两个因素简单效应间的平均差异称互作。反映一个因素各水平在另一因素的不同水平中反应不一致的现象。
I:两直线平行,反应一致,没有互作
II:,直线上升快,有互作,正互作
III 或 IV:,直线上升缓慢或下降,有互作,负互作
互作显著与否关系到主效的实用性。若交互作用不显著,则各因素的效应可以累加,主效就代表各个简单效应。正互作,从各因素的最佳水平推论最优组合,估计值要偏低些,但仍有应用价值。负互作,根据互作大小程度而有不同情况。
两个因素间的互作称一级互作(first order interaction)。一级互作易于理解,实际意义明确。
三个因素间的叫二级互作(second order interaction)。二级以上高级互作较难理解,实际意义不大,一般不予考虑。
三、试验误差及其控制
1、试验数据的误差和精确性
通过试验的观察和测定,获得试验数据,这是推论试验结果的依据。
将每次所取样品测定的结果称为一个观察值(observation),以y表示。
观察值=真值+误差
观察值间的变异:
一种是完全偶然性的,找不出确切原因的,称为偶然性误差(spontaneous error)或随机误差(random error);
另一种是有一定原因的称为偏差(bias)或系统误差(systematic error)。
举例:
试验数据的优劣是相对于试验误差而言。系统误差使数据偏离其理论真值;偶然误差使数据相互分散。
因而系统误差( 值)影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;
偶然误差( 值)影响了数据的精确性,精确性是指观测值间的符合程度。
如上图,以中心为理论真值
a:5枪集中在中心,准而集中,具有最佳的准确性和精确性;
b:5枪偏离中心有系统偏差但很集中,准确性差,精确度佳;
c:5枪既打不到中心,又很分散,准确性和精确性均很差;
d:5枪很分散,但能围绕中心打,平均起来具有一定的准确性,但精确性很差。
2、试验误差的来源
系统误差是一种有原因的偏差,有赖于经验的积累。
导致系统偏差的原因不止一个,方向也不一定相同,所以实际观察的系统偏差往往是多种偏差的复合。
随机误差是偶然性的。
理论上,系统误差是可以通过试验条件及试验过程的仔细操作而控制的。一些主要的系统性偏差较易控制,细微偏差较难控制。在分析数据时把误差中的一些主要偏差排除以后,剩下都归结为随机误差,因而估计出来的随机误差有可能比想象的要大,甚至大得多。
3、随机误差的规律性
理论上,系统偏差源自某种系统性原因,只要仔细检查,是有规律可循的。
随机误差,只要确实是随机波动所致,也有其变化规律。
4、随机误差的层次性
:第一阶段:取样误差 :第二阶段:测定过程误差
不同阶段有不同误差
四、统计学历史
统计学:实验数据搜集、分析及推论的理论、方法和科学。
试验统计学是统计学一个部分,统计学与试验设计相结合发展起来的。