试验设计与数据处理.ppt
《试验设计与数据处理.ppt》由会员分享,可在线阅读,更多相关《试验设计与数据处理.ppt(153页珍藏版)》请在课桌文档上搜索。
1、试验设计与数据处理,内 容,基本统计分析差异显著性分析试验设计方差分析回归分析与相关分析多元统计分析,未整理的数据资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,只有通过科学的整理和分析,可发现其规律性,揭示内在的本质。描述统计分析是最基本的数据处理方法,包括次数分布、统计量计算等等。,一、基本统计分析,总体或样本中观察值或某区间的观察值出现的次数在整个区间的分布情况,了解数据的分布规律。,1.1 试验资料的分类(1)数量资料 以测量、计量或计数的方式而获得的数据。如小麦蛋白质、容重、植株数等。(2)质量资料 指能观察到而不能直接测量的,只能用文字来描述其特征而获得的资料。如食品颜色、
2、风味,芒的有无、绒毛的有无等。,1、次数分布,(1)间断性数据资料的整理,例1:以某小麦品种的每穗小穗数为例来分析。随机采取100个麦穗,计数每穗小穗数,数据资料见表1-1。,1.2 次数分布表,表1-1 100个麦穗的每穗小穗数,表1-2 100个麦穗每穗小穗数的次数分布表,(2)连续性数据资料的整理,例2:为了分析某食品生产厂的罐头质量,现随机抽取100听罐头样品,分别称其净重,数据资料见表1-3。,表1-3 100听罐头样品的净重 g,表1-4 100听罐头净重的次数分布,由次数分布表可以看出,每听罐头净重小于332.5g及大于356.5g的为极少数。100听罐头净重分布基本以343.0
3、g为中心,向两边做递减对称分布。,(3)质量数据资料的整理,质量(属性)数据资料,也可以用类似次数分布的方法来整理。在整理前,把资料按各种质量性状进行分类,分类数等于组数;然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。例3:某水稻杂种第二代植株米粒性状情况,归于表1-5。,表1-5 水稻杂种二代植株 米粒性状情况,(1)方柱形图直方图,方柱形图适用于表示连续性数据的次数分布。,1.3 次数分布图,图1-1 100听罐头净重量次数分布直方图,(2)折线图,折线图也是表示连续性变数资料的一种普通的方法,且在同一图上可比较两组以上的资料。,图1-2 100听
4、罐头净重量次数分布折线图,(3)条形图,条形图适用于间断性数据和属性数据资料,用以表示这些变数的次数分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。,图1-3 水稻F2代米粒性状性状条形图,度量集中性的特征数。平均数是一组数据的代表值,表示资料中观察值的中心位置,可作为作为样本性状的代表,可与另一同质样本进行比较。包括算术平均数、中位数、众数等。常用的是算术平均数,简称平均数。,2、平均数,单用平均数不足以很好地表达一组数据的主要特征。如4:第一组数据24、25、26 第二组数据1、25、49,例5:调查两个小麦品种的每穗小穗数,每品种计数10个麦穗,经整理后见表。,3、变异数
5、度量数据资料变异程度大小的特征数,3.1 极差 R=Max(x)Min(x),两品种的平均数均为18个,但甲品种的极差较大,其变异范围较大,平均数的代表性较差;乙品种的极差较小,其变异幅度较小,其平均数代表性较好。,3.2 方差,3.3 标准差SD,例6:设某一水稻单株粒重的样本有5个观察值,以克为单位,其数为2、8、7、5、4(用y代表)。,水稻单株粒重的标准差为2.39g。,在比较两组平均数相差很大或数据单位不同的资料的变异程度时,则需要用变异系数。变异系数(Coefficient of Variation,记为CV)是指资料的标准差与平均数之比:,3.4 变异系数,变异系数是一个不带单位
6、的数值,可用于比较二个事物的变异度大小。,例7:表1-6为两个小麦品种主茎高度的平均数、标准差和变异系数。如从标准差看,甲品种比乙的变异大些;但因两者的均数不同,标准差间不宜直接比较。如果计算出变异系数,就可以相互比较,乙品种的变异系数为11.3%,甲品种为9.5%,可见乙品种的相对变异程度较大。,表1-6 两个小麦品种主茎高度的测量结果,2008年关中地区3市区小麦大田样品的蛋白质品质性状,陕西关中小麦大田样品的籽粒蛋白质平均含量为14.460.95%,沉淀值为31.027.18 mL,湿面筋含量为34.784.18%,面筋指数为68.6212.99%。沉淀值、湿面筋含量及面筋指数在品种间的
7、变异系数较高,分别为23.14%、12.01%、18.93%。宝鸡地区小麦籽粒蛋白质含量显著高于渭南和咸阳地区(p0.05),沉淀值和面筋指数显著低于渭南地区(p0.05)。除沉淀值外,咸阳地区小麦的蛋白质品质性状与渭南地区无显著差异。,玉米品种的籽粒品质特性,二、差异显著性分析,单个样本平均数的差异检验u检验,t 检验两个样本平均数的差异检验成组试验数据的检验 u 检验,t 检验成对试验数据的检验t 检验三个及三个以上样本平均数的差异检验方差分析(F检验),例8:某地区的当地小麦品种一般667m2产量300kg,多年种植获得产量标准差为75kg,现有一新品种通过25个小区的试验,其平均产量为
8、每667m2 330kg,即=330,那么新品种与当地品种的产量是否有显著差异?,单个样本的均值检验u检验,由于u=2u0.05=1.96,P(概率)界于0.01和0.05之间,小概率事件,有显著差异。,1、单个样本平均数的假设测验,已知大田小麦生长后期不喷磷,千粒重0=36.0g,2=6.4 g2;试验表明,喷磷:千粒重=37.9 g,n=10。问:小麦生长后期叶面喷施磷对千粒重是否有作用?,例9:,在5%的显著水平上否定 H0:=0=36.0 g,接受HA,两者差异达显著水平,小麦生长后期叶面喷施磷能显著增加千粒重。,由于,,例10:某春小麦良种的千粒重 34g,现由外地引入一高产品种,在
9、8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?,总体 为未知,又是小样本,故需用t 测验。,df=7,t0.05=2.365。|t|0.05。表明即新引入品种千粒重与当地良种千粒重指定值没有显著差异,例11:已知某水稻品种的千粒重为 28 g。施钾试验表明,10个小区的千粒重分别为:29.3,29.8,30.5,31.0,30.0,30.7,29.0,29.5,30.1,29.4 g。问:施钾对水稻千粒重是否有作用?,自由度df=10-1=9时,t0.05=2.262,t0.01=3
10、.250,由于 t 3.250,所以可在1%的显著水平上否定H0:=0=28 g,接受HA,两者差异达极显著水平,施钾能极显著地增加水稻千粒重。,2、两个样本平均数的假设测验,成组试验数据检验,成对试验数据检验,如果两个处理为完全随机设计的两个处理,各试验单元彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据。,2.1 成组试验平均数比较,成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等,(1)u 检验,1)两个样本总体的方差12 和22 已知;2)2未知,但两个样本均为大样本(n1,n2 30);,采用 u 检验的条件,基本计算式:,例12:下表是不同插秧期的每穗
11、结实数。试分析插秧期对水稻每穗结实数有无影响?,表2-1 水稻不同插秧期的每穗结实数,由于u 2.58,所以可在1%的显著水平上否定H0:1=2,接受HA,两者差异达显著水平,插秧期对水稻每穗结实数有极显著影响,提早插秧可增加水稻每穗结实数。,例13:在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。,表2-2 甲乙两条生产线日产量记录,故:,由0.01查附表2,得u0.012.58,实际|u|3.28u0.012.58,故P0.01,应否定H0,接受HA。说明两个生产线的日平均 产量有极显著差异,甲生产线日平均产量高于乙生产线日平均产量。,两个
12、样本总体的方差12和22未知,且n1,n230 时,可用 t 检验来确定 H0:1=2 能否成立。,(2)t 检验,可假定两个样本所属总体的方差12=22 时,采用合并方差,即两个两本方差的加权平均值。,表2-3 施用化成复合肥和掺合肥的小麦籽粒产量(单位:g/盆),例14:分析两种不同肥料对小麦产量的影响。,当自由度 df=n1+n2-2=5+5-2=8 时,t0.05=2.306,t0.01=3.355,由于 t 2.306(t0.05),所以接受 H0:1=2,两者差异不显著,A肥和B肥对小麦籽粒产量的效应没有差异。,例15:现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定
13、其粗提物中的茶多糖含量,结果见表2-4。问两种工艺的粗提物中茶多糖含量有无差异?,表2-4 两种工艺粗提物中茶多糖含量测定结果,当df=9时,查临界值得:t 0.05(9)=2.262,|t|1.381 0.05,表明两种工艺的粗提物中茶多糖含量无显著差异。,2.2 成对试验平均数的比较,若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。,两个处理的观测值一一配对,即(x11,x21),(x12,x22),(x13,x23),(x1n,x2n),例16:为研究电渗处理对草莓果实中的钙离子含量的影响,选用10
14、个草莓品种进行电渗处理与 对照处理对比试验,结果见表2-5。问电渗处理对草莓钙离子含量是否有影响?,本例因每个品种实施了一对处理,试验资料为成对资料。,表2-5 电渗处理对草莓钙离子含量的影响,根据df=n-19,查临界t值:t0.01(9)3.250,因为|t|8.358 t0.01(9),P0.01,否定 H0,接受HA,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。,表2-6 施用氯化铵和尿素对水稻籽粒产量的影响(单位:kg/亩),例17:分析肥料对水稻籽粒产量的影响。一一配对!,查附表,当自由度 df=n-1=9-1=8时,t0.05=2
15、.306,t0.01=3.355,由于 t=0.467 2.306,所以接受 H0:1=2,两者差异不显著,施用氯化铵和尿素对水稻籽粒产量影响不显著。,例18:选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的饨化病毒效果,表2-7结果为病毒在番茄上产生的病痕数目,试分析两种处理方法的差异显著性。,表2-7 A、B两法处理的病毒在番茄上产生的病痕数,配对设计,由于df=7-1=6时,t0.01=3.707。实得|t|t0.01,故P0.01。即A、B两法对饨化病毒的效应有极显著差异。,单因素试验复因
16、素试验综合试验,三、试验设计,1、单因素试验,在其他因素相对一致的条件下,只研究某一个因素效应的试验,称为单因素试验。单因素试验不仅简单易行,结果易于分析,而且能对被试验因素作深入研究,是研究某个因素具体规律时常用而有效的手段。单因素试验方案制定时,应根据研究目的要求及试验条件,把要研究的因素分成若干水平,每个水平就是一个处理,再加上对照(有时就是该因素的零水平)即可。,在设计单因素试验方案时,应注意数量水平的级差不能过细。过细,试验因素不同水平的效应差异不明显,甚至会被试验误差所掩盖,试验结果不能说明问题。单因素试验由于没有考虑各因素之间的相互关系,试验结果往往具有一定的局限性。,例19:小
17、麦磷肥用量试验,磷肥用量:P0,P1,P2,P3 四水平,试验方案如下:,1)不施肥(CK1);2)肥底NK+P0;3)NK+P1;4)NK+P2;5)NK+P3,例20:氮肥品种比较试验,氮肥品种:尿素,碳铵、硝铵、硫铵。方案如下:,1)不施肥(CK1);2)肥底PK+尿素;3)PK+碳铵;4)PK+硝铵;5)PK+硫铵,2、复因素试验,研究两个或两个以上不同因素效应的试验,称为复因素试验或多因素试验。复因素试验克服了单因素试验的缺点,可分析因子的主效应及其交互作用,确定各因素不同水平的优化组合,其结果能较全面地说明问题,试验效率较高。能但随着试验因素的增多,往往容易使试验过于复杂庞大,反而
18、会降低试验的精确性。处理数目与试验种类、排列方法、要求的精确程度有关,应以较少的处理解决较多问题。因此,复因素试验一般以2-4个试验因素较好。,复因素试验的种类,完全方案 不均衡方案 正交设计 均匀设计回归设计 配方试验设计,回归设计(1)回归正交试验设计 a、一次回归正交试验设计 b、二次回归正交试验设计(2)回归旋转设计 a、二次回归正交旋转组合设计 b、二次通用旋转组合设计,2.1 完全方案,如:氮磷肥料配合试验,,氮 3 个水平:N1,N2,N3磷 3 个水平:P1,P2,P3,N1 P1,N2 P1,N3 P1 N1 P2,N2 P2,N3 P2 N1 P3,N2 P3,N3 P3,
19、试验方案组合:,各试验因素不同水平一切可能的组合均作为试验处理。,表3-1 N、三因素二水平完全实施方案,特点:一个因素各水平与其它因素各水平组合机会相等;处理数为:a b c;优点:可分析所有因素的简单效应、主效应和交互作用,提供的信息量较大。缺点:试验因素和水平较多时方案过于庞大,实施起来难度大。,2.2 不完全实施方案,用完全方案的一部分处理构成试验方案。,经验设计正交设计 均匀设计回归设计 配方试验设计,对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限
20、制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合 的一种高效率试验设计方法。,(1)正交试验设计,利用正交表,适用于多因素试验,以部分实施代替全面实施。常用的等水平正交表有:L4(23),L8(27),L9(34),L16(45);常用的混合水平正交表有:L8(424),L12(324),L12(622),L16(4229),L16(4423),正交试验设计的基本程序,对于多因素试验,正交试验设计是简单常用的一种试验设计方法,其设计基本程序如图所示。正交试验设计的基本程序包括试验方案设计及试验结果分析两部分。,试验目的与要求,试验指标,选因素、定水平,因素、水平确定,选择合适正交
21、表,表头设计,列试验方案,试验方案设计:,试验结果分析,进行试验,记录试验结果,试验结果极差分析,计算K值,计算k值,计算极差R,绘制因素指标趋势图,优水平,因素主次顺序,优组合,结 论,试验结果分析:,试验结果方差分析,列方差分析表,进行F 检验,计算各列偏差平方和、自由度,分析检验结果,写出结论,正交试验结果的直观分析法,1、选出参考最优组合2、判明各因子对试验指标影响的主次关系(1)分别计算各因素、各水平的试验指标Ki及其平均值,与Ki的极差Ri(2)比较各因素的极差R,排出各因素的主次关系,根据K值的大小,选取理论上的最优组合3、比较参考最优组合和理论最优组合,确定最终最优组合,方差分
22、析可以分析出试验误差的大小,从而知道试验精度;不仅可给出各因素及交互作用对试验指标影响的主次顺序,而且可分析出哪些因素影响显著,哪些影响不显著。对于显著因素,选取优水平并在试验中加以严格控制;对不显著因素,可视具体情况确定优水平。但极差分析不能对各因素的主要程度给予精确的数量估计。,正交试验结果的方差分析,例21:研究有机肥(A)、氮肥(B)、磷肥(C)、钾肥(D)用量对小麦产量的影响(分析各因素的主效应),利用正交设计法设计试验方案。,1)确定试验的因素水平,表3-2 试验的因素水平(单位:kg/hm2),2)选择正交表 有个因素、每个因素有个水平,因此可选L8(27)正交表。,L8(27)
23、正交表,L8(27)正交表的交互作用表,3)表头设计,表头设计,表3-3 正交设计实施方案(单位:kg/hm2),4)正交设计方案,正交表,注:任意两列间的交互作用为另外二列。,正交表,L8(424)正交表,特点:可设置 8 个处理,最多可分析出 5 个试验效应(包括交互效应),其中一个因素为 4 水平,其余因素为 2 水平。,正交设计时应注意:,正交设计中效应的混杂不可避免,所以在应用前必须充分考虑混杂情况,只有在效应混杂不影响试验目的的情况下才适用。试验因素越多,水平越多,混杂越严重;选用的正交表越简化,混杂的也越严重。所以在一般情况下,当因素间交互作用不清楚时应选用复杂的正交表。,(2)
24、均匀试验设计,均匀设计是另一种部分实施的试验设计方法。它可以用较少的试验次数,安排多因素、多水平的析因试验,是在均匀性的度量下最好的析因试验设计方法。它可以使试验点在试验范围内充分地均匀分散,不仅可大大减少试验点,而且仍能得到反映试验体系主要特征的试验结果。均匀试验设计点没有整齐可比性,因此试验结果的处理不能采用方差分析法,而必须用回归分析方法线性回归或多项式回归分析。,均匀设计表,每个均匀设计表都有一个使用表,它将建议我们如何选择适当的列安排试验因素,进行试验设计,这样可以减少“试验偏差”。其中偏差为均匀性的度量值,数值小的设计表示均匀性好。例如 U7(74)的使用表为:,回归设计(也称为响
25、应曲面设计)目的是寻找试验指标与各因子间的定量规律,考察的因子都是定量的。它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种试验设计方法。,(3)回归设计,响应面方法(Response Surface Methodology,简称RSM)是利用合理的试验设计并通过实验得到的一定数据,采用多元二次回归方程来拟合因素与响应值之间的函数关系,通过对回归方程的分析来寻求最优工艺参数,解决多变量问题的一种统计方法。响应面法目前已成为降低成本、优化加工条件的一种有效方法,广泛地应用于农业、生物、食品、化学等领域。,Plackett-Burman 设计法,Plackett-Bur
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 设计 数据处理
链接地址:https://www.desk33.com/p-1274215.html