DOE培训资料.ppt
实 验 设 计 基 础,Alexander MengSQA,SAE Magnetics Ltd.,课程安排,第一讲:实验设计中的正交试验第二讲:方差分析和2k因子、3k因子设计第三讲:正交试验的方差分析第四讲:稳健设计和产品的三阶段设计第五讲:可靠性设计,第一讲:实验设计中的正交试验,第一节:优秀工程师应当掌握的质量管理技术第二节:进行实验设计的意义及其发展过程第三节:正交试验、正交表及其用法第四节:混合水平的正交试验设计第五节:有交互作用的正交试验设计,第一节:优秀工程师应当掌握的质量管理技术,在掌握专业知识的基础上,一个优秀的工程师至少应当掌握以下的质量管理技术:1.Cpk(过程能力指数)2.GR&R(重复性和再现性)3.Correlation(相关性),4.SPC(统计过程控制)技术就是利用统计技术对过程中的各个阶段进行监控,从而达到改进与保证质量的目的。SPC强调全过程的预防。居QC七工具核心地位的控制图是SPC的重要工具,它包括计量值控制图和计数值控制图。,第一节:优秀工程师应当掌握的质量管理技术,5.CUSUM控制图和EWMA控制图CUSUM(累积和)控制图的设计思想就是对数据的信息加以积累.它的理论基础是序贯分析原理中的序贯概率比检验,通过对信息的累积,将过程的小偏移累加起来,达到放大的效果,提高检测过程小偏移的灵敏度。CUSUM控制图分别可用于计量性数据(正态分布)不合格品数(泊松分布),不合格品率(二项分布)。EWMA(指数加权滑动平均)控制图中控制统计量同样利用了历史数据,而且它可以对不同阶段的数据取不同的权重,距今越近的数据权重越大,反之则越小。EWMA控制图设计的本质就是寻找最优参数(入,K)组合的过程,所依据的原则是:对给定的稳态ARL(0),使过程出现设定偏移量的偏移时具有最小失控的ARL。,第一节:优秀工程师应当掌握的质量管理技术,6.稳健设计技术产品、工艺过程的稳健设计方法和技术开发阶段的稳健技术开发方法统称为稳健设计技术,它是开发高质量低成本产品最有效的方法.在实际生产中,任何一种产品都存在一些噪声因素影响其质量,对待这些因素一般可以有两种态度:一是尽可能消除这些因素,但实际上往往很难实现,即使可能也需要花费很大的代价,这是不值得的;二是尽量降低这些因素的影响,使产品特性对这些因素的变化不十分敏感。基本功能的性能稳健取决于两点:一是输出质量特性本身的波动小;二是该质量特性应尽可能接近设计目标值。S/N可以比较准确地反映这两个目标。稳健设计主要包括损失模型法、响应面模型法、容差模型法和随机模型法等。,第一节:优秀工程师应当掌握的质量管理技术,第一节:优秀工程师应当掌握的质量管理技术,7.质量机能展开(QFD)QFD产生于日本,是一种在开发阶段就对产品的适用性实施全方位保证,在产品的设计阶段就确定制造过程中的质量控制要点,以减少生产初期大量错误发生的系统方法。它从市场要求的情报出发,将其转化为设计语言,继而纵向经过部件、零件展开至工序展开;横向进行质量展开、技术展开、成本展开的可靠性展开。形式上以大量的系统展开表和矩阵图为特征,尽量将生产中可能出现的问题提前揭示,以达到多元设计、多元保证的目的。最常用质量功能展开的文件有:顾客要求策划矩阵;设计矩阵;最终产品特性展开矩阵;生产、采购矩阵;过程计划和质量控制表;作业指导书;,8.并行工程(或同步工程)现代企业面临的主要课题是如何做好创新,但创新又面临着两个风险:市场不确定性和技术不确定性。市场因顾客需要的变化和技术进步引起的竞争态势的变化,要求产品的寿命周期缩短和更新换代速度加快;技术上则由于产品结构的复杂化和新原理的采用,延长了开发周期。而并行工程则为企业如何以尽可能短的开发周期推出顾客与社会需要的产品提供了解决思想和方法。并行工程是对产品及制造和辅助过程实施并行、一体化设计,促使开发者始终考虑从概念形成直到使用后处置的产品整个生命周期内的所有因素(包括质量、成本、进度和使用要求)的一种系统方法。并行工程中普遍采用质量工程技术(如QFD、田口法、FMEA等)和计算机技术。,第一节:优秀工程师应当掌握的质量管理技术,9.水平比较(Benchmarking)Benchmarking 是一个系统和连续的测量过程,这个过程就是要针对世界范围内的领先企业和具体的领先过程进行连续不断的测量和比较,以获得帮助公司采取改进行动的有效信息。水平比较可分为:内部水平、竞争性水平、功能性水平、一般性水 平比较。水平比较的内容:质量、生产率和时间(生产率和时间反映了成本 问题)。,第一节:优秀工程师应当掌握的质量管理技术,10.失效模式和效果分析(FMEA)FMEA被应用于产品设计和过程开发。它是一个重要的分析工具,有助于防止代价高的失效。它为设计小组提供了一个预期并消除这些失效的有效途径。FMEA包括(设计)DFMEA和(过程)PFMEA。DFMEA应从列出设计希望做什么以及不希望做什么开始,即设计意图。期望的特性的定义越明确,就越容易识别潜在的失效模式,采取纠正措施.PFMEA应从整个过程的流程图/风险评估开始。流程图应确定与每个工序有关的产品/过程特性参数。如果可能的话,还应根据相应的DFMEA确定某些产品的影响后果。,第一节:优秀工程师应当掌握的质量管理技术,11.制造设计(DFM)和装配设计(DFA)为优化设计功能、可制造性、易于装配之间关系所设计的同步工程最主要的是要增进对工艺变量与产品结果之间的关系的理解。在此基础上,设计者再在技术规范中确定必须在制造过程中加以控制的产品特性及其限制,以实现其使用要求。这将有利于:1)改进产品的投产;2)改进现有制造过程能力;3)提供可用于主管和工人培训的信息;DFM和DFA通常由一个横向职能小组来应用,这可以防止工程师设计超出装配技术或产量能力的制造或装配步骤。小组通常有其他领域的专家和顾客参与,以解决设计人员知识不足或未领悟某一重要设计特性。,第一节:优秀工程师应当掌握的质量管理技术,12.实验设计(DOE)一种用于控制过程输入以便更好地理解对过程输出影响的试验技术.实验设计的代表性方法包括传统方法和田口方法。田口方法的目的是通过设计保证质量,它通过确定和控制造成过程/产品质量出现偏差的关键变量(或噪音)来达到目的。其整个概念可描述为以下两个基本点:1)应该用相对于规定的目标值的偏差来衡量质量,而不应该由是否满足预先设定的公差限度来衡量质量。2)质量不能先靠检验和返工来保证,必须通过适当的过程和产品设计来实现。设计循环分为三个阶段:系统设计、参数设计、公差设计。,第一节:优秀工程师应当掌握的质量管理技术,13.运动/人机工程学分析通过对过程设计的评估,以确保与人的能力兼容。运动分析是指与完成任务(如升、扭、延伸)有关的人的能力,以防止或减轻应变、应力、过度疲劳等问题。有关影响因素包括工人的人体尺寸、设计产品的布置、按扭/开关的位置,加在人身上的负荷,及诸如噪音振动、照明和空间等方面的环境影响。,第一节:优秀工程师应当掌握的质量管理技术,14.价值分析和价值工程(VA和VE)采用多种技术来正确地分析某一产品的功能,往往能够改进产品的性能,降低成本,因为这样可以找到并应用其它的代用材料生产方法。这种功能评价的过程叫做价值分析。美国则将应用价值分析过程以降低设计成本称之为价值工程。,第一节:优秀工程师应当掌握的质量管理技术,15.可靠性工程计划通常一个可靠性项目要具备三个必要条件:1).产品设计:如果在产品设计中未对可靠性进行足够的考虑的话,任何诸如检验和试验的其它的后续措施都不能弥补不足;2).零件:用于制造产品的零件必须满足功能要求,能够在经过制造过程后而不致衰退,并且能够在其使用的环境条件下正常运行而不至损坏;3).质量控制:必要的制造程序、过程和控制必须予以执行和保持;,第一节:优秀工程师应当掌握的质量管理技术,16.蒙特卡洛方法Monte Carlo 方法也称为随机模拟方法,其基本思想是,为了求解数学、物理、工程技术以及生产管理等方面的问题,首先建立一个概率模型或随机过程,使它的参数等于问题的解;然后通过对模型或过程的观察或抽样试验来计算所求参数的统计特征,最后给出所求解的近似值。,第一节:优秀工程师应当掌握的质量管理技术,17.计算机辅助设计(CAD)它们可以将产品的具体要求转化为最终的实物产品,可以使设计者考虑许多不同的设计方案,并大大缩短工作时间。现在常被用于以下领域:1)可靠性:为改进的低温设计可靠性而进行的设备的热工设计;2)可维修性:工件位置,可达到距离及其它与设计相关的人体需要 图解;3)可试验性:将试验策划考虑在设计过程中的总体试验要求的分析;,第一节:优秀工程师应当掌握的质量管理技术,进行实验设计的意义:实验设计方法是数理统计学的应用方法之一,在很多学科中得到广泛的应用。它的主要内容是讨论如何合理地安排试验、取得数据,然后进行综合的科学分析,从而达到尽快获得最优方案的目的。实验设计在工程学领域是改进制造过程的性能的非常重要的手段。它在开发新工序中亦有着广泛的应用。在工序开发的早期应用实验设计方法能得出以下成果:1.提高产量;2.减少变异性,与额定值或目标值更为一致;3.减少开发时间;4.减少总成本;,第二节:进行实验设计的意义及其发展过程,前言:实驗設計在生產/制造過程中的位置.,生產/制造 過程,可控制因素,不可控制因素,資源,產品,統計技術在 生產/制造過程 中的應用是對 過程中輸入 的變量(人,机,料,法,環)進行有目的地优化,使輸出的結果更加理想.实驗設計 是其中較為有效的一种工程工具.,通過實驗進行优化設計,通過實驗,控制其不良的影響程度,第二节:进行实验设计的意义及其发展过程,实验设计的发展过程:实验设计方法始于本世纪20年代,其发展过程大致可分为三个阶段:1.早期的方差分析法。这种方法是在本世纪20年代由英国生物统计学 家、数学家费歇(Fisher)提出的,开始主要应用于农业、生物学、遗 传学方面,取得了丰硕成果。二战期间,英、美采用这种方法在工 业生产中取得显著效果;2.传统的正交试验设计法。以日本的田口玄一为代表;3.信噪比试验设计法与三阶段设计法。1957年,田口玄一提出信噪比 设计法和产品的三阶段设计法。他把信噪比设计和正交表设计、方 差分析相结合,开辟了更为重要、更为广泛的应用领域。,为什么要进行正交试验:在实际生产中,影响试验的因素往往是多方面的,我们要考察各因素对试验影响的情况。在多因素、多水平试验中,如果对每个因素的每个水平都互相搭配进行全面试验,需要做的试验次数就会很多.比如对两 个7水平的因素,如果两因素的各个水平都互相搭配进行全面试验,就要做73=343次试验,对6个7水平的因素,进行全面试验要做76=117649次试验。这显然是不经济的。我们应当在不影响试验效果的前提下,尽可能地减少试验次数。正交设计就是解决这个问题的有效方法。正交设计的主要工具是正交表。,第三节:正交试验、正交表及其用法,右圖是一個比較典型的正交表.“L”表示此為正交表,“8”表示試驗次數,“2”表示兩水平,“7”表示試驗最多可以有7個因素(包括單個因素及其交互作用).,第三节:正交试验、正交表及其用法,正交表:,正交表的表示方法:一般的正交表记为Ln(Mk),n是表的行数,也就是要安排的试验次数;k 是表中的列数,表示因素的个数;m 是各因素的水平数;常见的正交表:2水平的有 L4(23),L8(27),L12(211),L16(215)等;3水平的有 L9(34),L27(313)等;4水平的有 L15(45);5水平的有 L25(56);,第三节:正交试验、正交表及其用法,第三节:正交试验、正交表及其用法,正交試驗所需要的試驗次數.,普通試驗所需要的試驗次數,為什么說正交試驗節約成本,提高效率:,正交表的两条重要性质:1)每列中不同数字出现的次数是相等的,如L9(34)中,每列中不同的 数字是1,2,3,它们各出现3次;,第三节:正交试验、正交表及其用法,2)在任意两列中,将同一行的两个 数字看成有序数对时,每种数对 出现的次数是相等的,如L9(34)中 有序数对共有9个:(1,1),(1,2),(1,3)(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),它 们各出现一次。所以,用正交表来安排试验时,各因素的各种水平的搭配是均衡的,这是正交表的优点。,例1:(单指标的分析方法)某炼铁厂为提高铁水温度,需要通过试验选择最好的生产方案经初步分析,主要有3个因素影响铁水温度,它们是焦比、风压和底焦高度,每个因素都 考虑3个水平,具体情况见表。问对这3个因素的3个水平如何安排,才能获得最高的铁水温度?,第三节:正交试验、正交表及其用法,解:如果每个因素的每个水平都互相搭配着进行全面试验,必须做试验33=27次。现在我们使用L9(34)正交表来安排试验。,第三节:正交试验、正交表及其用法,我们按选定的9个试验进行试验,并将每次试验测得的铁水温度记录下来:为了便于分析计算,我们把这些温度值和正交表列在一起组成一个新表。另外,由于铁水温度数值较大,我们把每一个铁水温度的值都减去1350,得到9个较小的数,这样使计算简单。,第三节:正交试验、正交表及其用法,分析表,第三节:正交试验、正交表及其用法,解释:K1这一行的3个数分别是因素A,B,C的第1水平所在的试验中对应的铁水温度之和;K2这一行的3个数分别是因素A,B,C的第2水平所在的试验中对应的铁水温度之和;K3这一行的3个数分别是因素A,B,C的第3水平所在的试验中对应的铁水温度之和;k1,k2,k3这3行的3 个数,分别是K1,K2,K3这3行中的3个数的平均值;极差是同一列中,k1,k2,k33个数中的最大者减去最小者所得的差。极差越大,说明这个因素的水平改变时对试验指标的影响越大。极差最大的那一列,就是那个因素的水平改变时对试验指标的影响最大,那个因素就是我们要考虑的主要因素.通过分析可以得出:各因素对试验指标(铁水温度)的影响按大小次序应当是C(底焦高度)A(焦比)B(风压);最好的方案应当是C2A3B2。与此结果比较接近的是第9号试验。为了最终确定上面找出的试验方案是不是最好的,可以按这个方案再试验一次,并同第9号试验相比,取效果最佳的方案。,第三节:正交试验、正交表及其用法,例2:(多指标的分析方法-综合平衡法)为提高某产品质量,要对生产该产品的原料进行配方试验。要检验3项指标:抗压强度、落下强度 和裂纹度,前2个指标越大越好,第3个指标越小越好。根据以往的经验,配方中有3个重要因素:水分、粒度和碱度。它们各有3个水平。试进行试验分析,找出最好的配方方案。,第三节:正交试验、正交表及其用法,解:我们选用正交表L9(34)来安排试验。,第三节:正交试验、正交表及其用法,A水分,B粒度,C碱度,k3,k3,k3,k3,k3,k3,k3,k3,k3,k1,k1,k1,k1,k1,k1,k1,k1,k1,k2,k2,k2,分析:1)粒度B对抗压强度和落下强度来讲,极差都是最大的,说明它是影响最大的因素,而且以取8为最好;对裂纹度来讲,粒度的极差不是最大,不是影响最大的因素,而且也以取8为最好;2)碱度C对三个指标的极差都不是最大的,是次要的因素。对抗压强度和裂纹度来讲,碱度取1.1最好;对落下强度,取1.3最好,但取1.1也不是太差,综合考虑碱度取1.1;3)水分A对裂纹度来讲是最大的因素,以取9为最好;但对抗压强度和落下强度来讲,水分的极差都是最小的,是影响最小的因素。综合考虑水分取9;最后较好的试验方案是B3C1A2,第三节:正交试验、正交表及其用法,例3:(多指标的分析方法-综合评分法)某厂生产一种化工产品,需要检验两下指标:核酸统一纯度和回收率,这两个指标都是越大越好。有影响的因素有4个,各有3个水平。试通过试验分析找出较好的方案解:这是4因素3水平的试验,可以选用正交表L9(34)。试验结果如表。,第三节:正交试验、正交表及其用法,第三节:正交试验、正交表及其用法,总分=4 x 纯度+1 x 回收率,分析:1)根据综合评分的结果,直观上第1号试验的分数最高,应进一步分析它是不是最好的试验方案;2)通过直观分析法可以得知,最好的试验方案是A1B3C2D1。A,D 两个因素的极差都很大,是对试验影响较大的两个因素;3)分析出来的最好方案,在已经做过的9个试验中是没有的。可以按这个方案再试验一次,看能不能得出比第一号试验更好的结果,从而确定出真正最好的试验方案;综合评分法是将多指标的问题,通过加权计算总分的方法化成一个指标的问题,使对结果的分析计算都比较方便、简单。,第三节:正交试验、正交表及其用法,利用正交表进行试验的步骤:1)明确试验目的,确定要考核的试验指标;2)根据试验目的,确定要考察的因素和各因素的水平;要通过对实际问题的具体分析选出主要因素,略去次要因素;3)选用合适的正交表,安排试验计划;4)根据安排的计划进行试验,测定各试验指标;5)对试验结果进行计算分析,得出合理的结论;以上这种方法一般称为直观分析法。,第三节:正交试验、正交表及其用法,混合水平正交表及其用法:混合水平正交表就是各因素的水平数不完全相等的正交表。譬如:L8(41 x 24)就是一种混合水平的正交表。这张表有两 个重要特点:1)每一列中不同数字出现的次数是相同的;2)每两列各种不同的水平搭配出现的次数是相同的。但要注意,每两列不同水平的搭配的个数是不完全相同的。,第四节:混合水平的正交试验设计,例4:(直接利用混合水平正交表)某农科站进行品种试验,共有4个因素:A(品种)、B(氮肥量)、C(氮、磷、钾比例)、D(规格)。因素A是4水平的,另外3个因素是2水平的。试验指标是产量,数值越大越好。,第四节:混合水平的正交试验设计,解:分析结果见下表。,第四节:混合水平的正交试验设计,例5:(拟水平法)今有一试验,试验指标只有一个,它的数值越小越好,这个试验有4个因素,其中因素C是2水平的,其余3个因素都是3水平的,试安排试验。解:我们从第1、第2两个水平中选一个水平让它重复一次作为第3水平,这就叫虚拟水平。一般应根据实际经验,选取一个较好的水平。,第四节:混合水平的正交试验设计,分析结果见下表。,第四节:混合水平的正交试验设计,总结:拟水平法是将水平少的因素归入水平数多的正交表中的一种处理问题的方法。在没有合适的混合水平的正交表可用时,拟水平法是一种比较好的处理多因素混合水平试验的方法。它不仅可以对一个因素虚拟水平,也可以对多个因素虚拟水平。,第四节:混合水平的正交试验设计,什么是交互作用:在多因素试验中,各因素不仅各自独立地在起作用,而且各因素还经常联合起来起作用。也就是说,不仅各个因素的水平改变时对试验指标有影响,而且各因素的联合搭配对试验指标也有影响。这后一种影响就叫做因素的交互作用。因素A和因素B的交互作用记为A X B.,第五节:有交互作用的正交试验设计,單個因子的影響与其交互作用的影響比較,30 m,50Kg 磷,25 m,50Kg 鉀,20kg 磷30kg 鉀,40 m,交互作用=總效果-(20kg 磷的效果+30kg 鉀的效果),交互作用表(以正交表L8(27):用正交表安排有交互作用的试验时,我们把两个因素的交互作用当成一个新的因素来看,让它占有一列,叫交互作用列。,第五节:有交互作用的正交试验设计,例6:(水平数相同)我们用一个3因素2水平的有交互作用的例子来说明某产品的产量取决于3个因素A,B,C,每个因素都有两个水平。每两个因素之间都有交互作用,试验指标为产量,越高越好。具体如下:,第五节:有交互作用的正交试验设计,解:这是3因素2水平的试验。3个因素A,B,C要占3列,它们之间的交互作用A x B,B x C,A x C 又占3列。可用正交表L8(27).,第五节:有交互作用的正交试验设计,分析:从极差大小看,影响最大的因素是C,以2水平为好;其次是AxB,以2水平为好,第3是因素A,以1水平为好,第4是因素B以1水平为好。由于因素B影响较小,1水平和2水平差别不大但考虑到AxB是2 水平好,它的影响比B大,所以因素B取2水平。AxC 和 BxC的极差很小,对试验的影响很小,忽略不计。综合分析,最好的方案应是C2A1B2。从试验结果看出,这个方案确实是8个试验中最好的一个试验。,第五节:有交互作用的正交试验设计,作 业 要 求,1.按照正交试验(直观分析法)的原理,解决你实际工作中的一个问题,并总结成实验分析报告。2.补充作业(另附),第一节:问题的提出第二节:单因素试验的方差分析第三节:双因素试验的方差分析第四节:因子设计的一般概念第五节:2k 因子设计第六节:3k 因子设计,第二讲:方差分析和2k因子、3k因子设计,第一节:问题的提出,先看一个例子:考察温度对某一化工厂产品的得率的影响,选了五种不同的度,同一温度做了三次试验,测得结果如下:要分析温度的变化对得率的影响,总平均得率=89.6%,第一节:问题的提出,从平均得率来看,温度对得率的影响?1)同一温度下得率并不完全一样,产生这种差异的原因是由于试验过程中各种偶然性因素的干扰及测量误差等所致,这一类误差统称为试验误差;2)两 种温度的得率在不同的试验中的倾向有所差别。如 65oC 与 70oC相比较,第一次65oC比70oC 好,而后二次70oC比65oC 好。产生这种矛盾的现象也是由于试验误差的干扰。由于试验误差的存在,对于不同温度下得率的差异自然要提出疑问,这差异是试验误差造成的,还是温度的影响呢?,第一节:问题的提出,1)由于温度的不同引起得率的差异叫做条件变差;例中的全部15个数据,参差不齐,它们的差异叫做总变差(或 总离差)。产生总变差的原因一是试验误差,一是条件变差。2)方差分析解决这类问题的思想是:a.由数据的总变差中分出试验误差和条件变差,并赋予它们的数 量表示;b.用条件变差和试验误差在一定意义下进行比较,如两者相差不大,说明条件的变化对指标影响不大;反之,则说明条件的变化影响是很大的,不可忽视;c.选择较好的工艺条件或确定进一步试验的方向;,第一节:问题的提出,变差的数量表示:有n个参差不齐的数据 x1,x2,xn,它们之间的差异称为变差。如何给变差一个数量表示呢?1)一个最直观的想法是用这n个数中最大值与最小值之差,即极 差来表达,用R记之;2)变差平方和,以S记之。S是每个数据离平均值有多远的一个测度,它越大表示数据间的差异越大。,其中,第一节:问题的提出,对变差平方和的进一步讨论:例:测得某高炉的六炉铁水含碳量为:4.59,4.44,4.53,4.52,4.72,4.55,求其变差平方和。,第一节:问题的提出,对变差平方和的进一步讨论(2):我们看到S的计算是比较麻烦的,原因是计算x时有效位数增加了因而计算平方时工作量就大大增加。另外,在计算x时由于除不尽而四舍五入,在计算S时,累计误差较大。为此常用以下公式:,对于前面的例子,第一节:问题的提出,对变差平方和的进一步讨论(3):这样计算虽然计算误差较小,但工作量还较大,因此常采用如下的办法:1.每一个数据减(加)去同一个数a,平方和S仍不变。如在此例中令,即每个数同减去4.50,这时与以上结果是完全一样的。,第一节:问题的提出,对变差平方和的进一步讨论(4):2.每一个数据乘(除)同一个数b,相应的平方和S增大(缩小)b2倍。如在此例中令,则相应数据变为9,-6,3,2,22,5,这时把原来的平方和S放大了1002倍。,第一节:问题的提出,自由度的提出:例2:在上例的基础上在同样的工艺条件下又测了四炉铁水,它们是:4.60,4.42,4.68,4.54,加上原来的六炉共十炉,求其平方和。将数据减去4.50然后乘上100得,第一节:问题的提出,自由度的提出(2):平均数与过去的结果是相近的,但平方和是显著地变大了。我们要设法消除数据个数的多少给平方和带来的影响。一个直观的想法是用平方和除以相应的项数,但从数学理论上推知这不是一个最好的办法,而应把项数加以修正,这个修正的数就叫做自由度。,第一节:问题的提出,自由度的提出(3):设有n个数y1,y2,yn,它们的平方和 的自由度是多少呢?这就看yi 之间有没有线性约束关系,如果有m个(0mn)线性约束方程 a11y1+a12y2+a1nyn=0 a21y1+a22y2+a2nyn=0 am1y1+am2y2+amnyn=0并且这m个方程相互独立,即方程系数矩阵的秩等于m,则S的自由度是n-m.,第一节:问题的提出,自由度的提出(4):根据这个定义,如令yi=xi-x(i=1,2,n)则显然 yi之间有一个线性约束关系,即即m=1,a11=a12=a1n=1所以变差平方和的自由度=n-m=n-1,第一节:问题的提出,均方的概念:平均平方和(简称均方)等于变差平方和除以相应的自由度f.平均平方和以MS表示,它的开方叫做均方差对例1、MS=0.043483/5=0.0086966,均方差为0.09326对例2、MS=0.07949/9=0.0088322,均方差为0.09398我们看到六炉和十炉的MS是很相近的,这与工艺条件相同是吻合的,说明用MS反映波动的大小是更为合理的。,假设:单因素A有a个水平A1,A2,Aa,在水平Ai(i=1,2,a)下,进行ni次独立试验,得到试验指标的观察值列于下表:我们假定在各个水平Ai下的样本来自具有相同方差2,均值分别为i的正态总体XiN(i,2),其中i,2均为未知,并且不同水平Ai下的样本之间相互独立。可以取得下面的线性统计模型:xij=+i+ij,i=1,2,a;j=1,2,ni,ij N(0,2)其中i=i-,第二节:单因素试验的方差分析,方差分析的任务就是检验线性统计模型中a个总体N(i,2)中的各i的相等性,即有:原假设 H0:1=2=a对立假设H1:i=j 至少有一对这样的i,j,也就是下面的等价假设:H0:1=2=a=0H1:i=0 至少有一个i,第二节:单因素试验的方差分析,总离差平方和的分解:记在水平Ai 下的样本均值为样本数据的总平均值为总离差平方和为将ST改写并分解得,第二节:单因素试验的方差分析,总离差平方和的分解(2):上面展开式中的第三项为0若记 SA=SE=则有:ST=SA+SEST表示全部试验数据与总平均值之间的差异SA表示在Ai水平下的样本均值与总平均值之间的差异,是组间差SE表示在Ai水平下的样本均值与样本值之间的差异,是组内差,它是由随机误差引起的。,第二节:单因素试验的方差分析,自由度的概念:在实际计算中,我们发现在同样的波动程度下,数据多的平方和要大于数据少的平方和,因此仅用平方和来反映波动的大小还是不够的。我们要设法消去数据个数的多少给平方和带来的影响。为此引入了自由度的概念。一个直观的想法是用平方和除以相应的项数,但应把项数加以修正,这个修正的数就叫自由度。ST的自由度为(n-1);SE的自由度为(n-a);SA的自由度为(a-1);均方:MSA=SA/(a-1);MSE=SE/(n-a),第二节:单因素试验的方差分析,方差分析:在H0成立的条件下,取统计量 F=MSA/MSE F(a-1,n-a)对于给出的,查出F(a-1,n-a)的值,由样本计算出SA和SE,从而算出F值。从而有如下判断:若F F(a-1,n-a),则拒绝H0;若F F(a-1,n-a),则接受H0为了方便计算,我们采用下面的简便计算公式:记 i=1,2,a,则有,第二节:单因素试验的方差分析,方差分析表:,第二节:单因素试验的方差分析,例1:(单因素的方差分析)人造纤维的抗拉强度是否受掺入其中的棉花的百分比的影响是有疑问的。现确定棉花百分比的5个水平:15%,20%,25%,30%,35%。每个水平中测5个抗拉强度的值,列于下表。问:抗拉强度是否受掺入棉花百分比的影响(0.01)?,第二节:单因素试验的方差分析,解:设抗拉强度为xij=i+ij,i,j=1,2,3,4,5.原假设H0:1=2=3=4=5备选假设H1:i=j,至少有一对i,j.这里 a=5,ni=5(i=1,2,5),n=25ST,SA,SE的自由度分别为24,4,20,第二节:单因素试验的方差分析,解(2):已给出=0.01,查表得F(a-1,n-a)=F0.01(4,20)=4.43这里F=14.764.43=F0.01(4,20)故拒绝原假设H0,接受H1:i=j说明棉花的百分比对人造纤维的抗拉强度有影响。,第二节:单因素试验的方差分析,无交互作用的方差分析:设两因素A,B。A有a个水平A1,A2,Aa,B有b个水平,B1,B2,Bb,在每一个组合水平(Ai,Bj)下,进行一次无重复试验,得到试验指标的观察值列于下表:设XijN(ij,2),各xij相互独立。可以取得下面的线性统计模型:xij=+i+j+ij,i=1,2,a;j=1,2,b,ij N(0,2),各相互独立,其中,i,j,2都是未知数,第三节:双因素试验的方差分析,对这个线性模型,我们检验如下的假设 HA0:1=2=a=0 HA1:i=0 至少有一个i,HB0:1=2=b=0 HB1:j=0 至少有一个j,第三节:双因素试验的方差分析,总离差平方和的分解:记在水平Ai 下的样本均值为记在水平Bj 下的样本均值为样本数据的总平均值为总离差平方和为将ST改写并分解得记为ST=SA(效应平方和)+SB(效应平方和)+SE(误差平方和),第三节:双因素试验的方差分析,自由度:ST的自由度为(ab-1);SA的自由度为(a-1);SB的自由度为(b-1);SE的自由度为(a-1)(b-1);均方:,第三节:双因素试验的方差分析,方差分析:在H0成立的条件下,取统计量对于给出的,查出F(a-1,(a-1)(b-1),F(b-1,(a-1)(b-1)的值,由样本计算出F1,F2值。从而有如下判断:若F 1 F(a-1,(a-1)(b-1),则拒绝HA0,否则就接受;若F2 F(b-1,(a-1)(b-1),则拒绝Hbo,否则就接受;为了方便计算,我们采用下面的简便计算公式:,第三节:双因素试验的方差分析,方差分析表:,第三节:双因素试验的方差分析,例2:(双因素无交互作用的方差分析)使用4种燃料,3种推进器作火箭射程试验,每一种组合情况做一次试验,则得火箭射程列在表中,试分析各种燃料(Ai)与各种推进器(Bj)对火箭射程有无显著影响(=0.05),第三节:双因素试验的方差分析,解:设火箭的射程为:xij=+i+j+ij,i=1,2,3,4,j=1,2,3原假设 HA0:=0 HB0:=0备择假设 HA1:i=0,至少一个i HB1:j=0,至少一个j这里a=4,b=3,ab=12,第三节:双因素试验的方差分析,解(2):给出的=0.05,查出F0.05(3,6)=4.76,F0.05(2,6)=5.14因为F1=0.434.76,F2=0.925.14所以接受原假设HA0,HB0故不同的燃料、不同的推进器对火箭射程均无显著影响。,第三节:双因素试验的方差分析,有交互作用的方差分析(分析过程略):自由度:ST的自由度为(abn-1);SA的自由度为(a-1);SB的自由度为(b-1);SAxB的自由度为(a-1)(b-1):SE的自由度为 ab(n-1);均方:,第三节:双因素试验的方差分析,例2:(双因素无交互作用的方差分析)使用4种燃料,3种推进器作火箭射程试验,每一种组合情况做一次试验,则得火箭射程列在表中,试分析各种燃料(Ai)与各种推进器(Bj)对火箭射程有无显著影响(=0.05),第三节:双因素试验的方差分析,解:设火箭的射程为:xij=+i+j+ij,i=1,2,3,4,j=1,2,3原假设 HA0:=0 HB0:=0备择假设 HA1:i=0,至少一个i HB1:j=0,至少一个j这里a=4,b=3,ab=12,第三节:双因素试验的方差分析,解(2):给出的=0.05,查出F0.05(3,6)=4.76,F0.05(2,6)=5.14因为F1=0.434.76,F2=0.925.14所以接受原假设HA0,HB0故不同的燃料、不同的推进器对火箭射程均无显著影响。,第三节:双因素试验的方差分析,有交互作用的方差分析(分析过程略):自由度:ST的自由度为(abn-1);SA的自由度为(a-1);SB的自由度为(b-1);SAxB的自由度为(a-1)(b-1):SE的自由度为 ab(n-1);均方:,第三节:双因素试验的方差分析,有交互作用的方差分析(2):简化公式,第三节:双因素试验的方差分析,有交互作用的方差分析(3):方差分析表,第三节:双因素试验的方差分析,为什么要进行因子设计:很多试验包含着两个、三个或更多的因子。对这些因子产生的效果都要进行研究。使用因子设计方法,在每一个完全的试验或试验的多次重复中,各个因子的各个水平的所有可能的组合都要考虑。例如,假若因子A有a个水平,因子B有b个水平。完成全部试验应包含所有的ab个组合。一个因子的效果是由因子水平的改变而引起的反应的变化,经常称为主要效果。,第四节:因子设计的一般概念,例:设某一试验有两个因子A和B,因子A有两个水平A1,A2,因子B两个水平B1,B2,试验所得数据如表。试考察因子A,B 的效果。解:对于第一种情况。因子A的主要效果可看成是在A的第一个水平下的平均反应与在第二个水平下的平均反应之差,即类似地,因子B的主要效果是,第四节:因子设计的一般概念,解:对于第二种情况。因子A的主要效果是因子B的主要效果是分别画出这两种情况的图形:交互作用是不能忽视的 有时它比因子的作用还 大。,第四节:因子设计的一般概念,什么是2K因子设计:假设试验中共有k个因子,每个因子都只有两个水平。这些水平可以是数量性的,也可以不是数量性的(如两种操作方法)。这种设计的安排总共有2k个不同的组合,若每种组合下取一个观察值,总观察值共有2K个,因此叫2K因子设计。我们对2K设计作如下假设:1)因子是固定的;2)设计是完全随机的;3)一般都满足正态性假定;4)反应近似于线性;,第五节:2k 因子设计,22设计:这是2k因子设计中最简单的一种设计,每个因子的两个水平可以用“低”和“高”来作一般性的描述。为分析问题方便,我们用A表示因子A的效果,B表示因子B的效果,AB表示交互作用AxB的效果。a表示因子A在高水平、因子B在低水平情况下观察值之和;b表示因子A在低水平、因子B在高水平下的观察值之和;ab表示因子A,B都在高水平情况下观察值之和,l表示因子A,B都在低水平情况下观察值之和。,第五节:2k 因子设计,假设在每一种水平组合下作n次重复观察因子A的平均效果:在B的低水平下为 在B的高水平下为 总平均效果是这两个数的平均值同理因子B的总平均效果是交互作用AxB的平均效果AB定义如下:它是在B的高水平下与在B的低水平下 A的平均效果之差的平均值。,第五节:2k 因子设计,方差分析:定义:若有线性组合 满足约束条件,则称这样的线性组合为对照(contrast),并记为:(对照)C=根据前面的式子,我们可以定义因子A,B,交互作用AxB的总效果分别为:(对照)A=ab+a-b-l(对照)B=ab+b-a-l(对照)AB=ab+l-a-b因此,A,B,AB的平方和分别为:SA=1/4n(对照)2=(ab+a-b-l)2/4nSB=1/4n(对照)2=(ab+b-a-l)2/4nSAB=1/4n(对照)2=(ab+l-a-b)2/4n,第五节:2k 因子设计,例3:考虑一个化学反应过程,这里有两个因素:因素A为反应物的浓度,它有两个水平,15%,25%,因素B为催化剂的是否使用,有两个水平:不用、用。每种组合做3次试验。因素各水平的组合情况为:A(低)15%B(低)不用催化剂 A(高)25%B(低)不用催化剂 A(低)15%B(高)用催化剂 A(高)25%B(高)用催化剂 全部试验得出的观察值见表:试分析因子A,B和交互作用AxB对化学反应的影响。,第五节:2k 因子设计,解:由前表可以求出然后求出平方和总离差平方和