第5章假设测验.ppt
《第5章假设测验.ppt》由会员分享,可在线阅读,更多相关《第5章假设测验.ppt(64页珍藏版)》请在课桌文档上搜索。
1、第5章 假设测验,Tests of Significance,Section 5.1Principle of Significance Tests假设测验的基本原理,一、假设测验的理论基础,某人宣称自由球命中率有80%。命中率有80%的射手,实地投射只有8/20命中率的机会不大。实地投射结果显示投20球中8球。结论:命中率有80%的宣称不可信。命中率有80%的自由球射手投20球命中的次数应服从二项分布B(20,0.8)。命中的次数小于或等于8的概率约为 0.0001。即重复实地投射20球10,000次只中8球以下的情形约只发生一次。,假设宣称的叙述为真(命中率有80%),可推得实验结果发生的可
2、能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。“Prove by Contradiction”小概率原理,一、假设测验的理论基础,例 某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数=300(kg),并从多年种植结果获得其标准差=75(kg),而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m2330kg,即=330,问新品种产量与当地品种产量是否有显著差异?,二、假设测验的步骤,(一)先假设新品种产量与当地品种产量无差异,记作 无效假设或零假设 对立假设或备择假设,二、假设测验的步骤,二、假设测验的步骤,(二)在承
3、认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数=300(kg),标准误=15(kg)。如果新品种的平均产量很接近300 kg,应接受H0。如果新品种的平均产量与300相差很大,应否定H0。但如果试验结果与300不很接近也不相差悬殊,就要借助于概率原理,具体做法有以下两种:,1.计算概率 在假设 为正确的条件下,根据的抽样分布算出获得 330kg的概率,或者说算得出现随机误差 30(kg)的概率:在此,,查附表,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果
4、:30(kg),属于抽样误差的概率小于5%。,二、假设测验的步骤,2.计算接受区和否定区 在假设H0为正确的条件下,根据 的抽样分布划出一个区间,如 在这一区间内则接受H0,如 在这一区间外则否定H0。由于,因此,在 的抽样分布中,落在()区间内的有95%,落在这一区间外的只有5%。,二、假设测验的步骤,如果以5%概率作为接受或否定H0的界限,则上述区间()为接受假设的区域,简称接受区(acceptance region);和 为否定假设的区域,简称否定区(rejection region)。,同理,若以1%作为接受或否定H0的界限,则()为接受区域,和 为否定区域。,二、假设测验的步骤,如上
5、述小麦新品种例,=300,,1.96=29.4(kg)。因之,它的两个2.5%概率的否定区域为 30029.4和 300+29.4,即大于329.4(kg)和小于270.6(kg)的概率只有5。,图 5%显著水平假设测验图示(表示接受区域和否定区域),二、假设测验的步骤,(三)根据“小概率事件实际上不可能发生”原理接受或否定假设,当 由随机误差造成的概率P小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。如P0.05,则称这个差数是显著的。如P0.01,则称这个差数是极显著的。用来测验假设的概率标准5%或1%等,称为显著水平(significance level)。一般以 表示,如
6、=0.05或=0.01。,二、假设测验的步骤,综合上述,统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。(2)规定测验的显著水平 值。(3)在 为正确的假定下,根据平均数()或其他统计数的抽样分布,获得实际差数(如 等)由误差造成的概率(P值)。或者根据已规定概率,如=0.05,划出两个否定区域如:和。(4)将规定的 值和算得的P值相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的推断。,二、假设测验的步骤,如果统计假设为,则备择假设为,在假设测验时所考虑的概率为曲线左边一尾概率和右边一尾概率的总和。这类测验称为两尾测验(two-ta
7、iled test),它具有两个否定区域。,如果统计假设为,则其对应的备择假设必为。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。这类测验称一尾测验(one-tailed test)。一尾测验还有另一种情况,即,,这时否定区域在左边一尾.,三、两尾测验与一尾测验,0,-1.96x,+1.96x,0.95,0.025,0.025,左尾,右尾,否定区,否定区,接受区,双尾测验(two-sided test),三、两尾测验与一尾测验,0.95,0.95,0.05,0.05,1.64,-1.64,H0:0 HA:0,假设:,否定区,H0:0 HA:0,左尾测验,
8、右尾测验,单尾测验(one-sided test),接受区,接受区,三、两尾测验与一尾测验,u 0.05=1.64u 0.01=2.33,单尾测验分位数,双尾测验分位数,u 0.05=1.96u 0.01=2.58,查表时,单尾概率等于双尾概率乘以2,三、两尾测验与一尾测验,第一类错误(type I error),又称弃真错误或 错误;第二类错误(type II error),又称纳伪错误或 错误第一类错误的概率为显著水平 值。第二类错误的概率为 值。,四、假设测验的两类错误,关于两类错误的讨论可总结如下:(1)在样本容量n固定的条件下,提高显著水平(取较小的 值),如从5%变为1%则将增大第
9、二类错误的概率 值。(2)在n和显著水平 相同的条件下,真总体平均数 和假设平均数 的相差(以标准误为单位)愈大,则犯第二类错误的概率 值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水平,如=0.05;或适当增加样本容量。(4)如果显著水平 已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。,四、假设测验的两类错误,Section 5.2 Significance Tests for Means平均数的假设测验,一、t分布,数据来自正态总体N(,2)的假设下,随机样本的均数 服从正态 N(,2/n)标准差未知,用样本标准差s估计 以 标准化后服从标准正态
10、以 标准化后则服从 t 分布 的标准差估计值 又称为 的标准误(standard error of mean,简记为),0,标准正态分布,t 分布自由度9,t 分布自由度2,一、t分布,t 分布图形与正态分布图形相似都具有对称于零、单峰及钟形的特性t 分布图形的散布(spread)比正态分布图形大,t 分布图形的尾端具有较大的概率以 替代 来标准化,使得t分布有较大的变异性。t分布自由度越大图形越接近正态。样本容量越大s估计越可靠,估计值造成的额外变异性越小。,一、t分布,在自由度为 的t分布曲线图下,右方与 左方的面积和为 a,则称 为自由度为 的t分布概率为 a 的双侧临界值。可查表。,0
11、,面积为a/2,面积为a/2,一、t分布,在自由度为 的t分布曲线图下,右方的面积为 a,则称 为自由度为 的t分布概率为 a 的单侧临界值。可查表。,0,面积为a,一、t分布,一、t分布,t 界值表,1.812,2.228,-2.228,t,f(t),=10的t分布图,例1 某春小麦良种的千粒重 34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?,这里总体 为未知,又是小样本,故需用t 测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验
12、。测验步骤为:,二、单个样本平均数的假设测验,H0:34g;对HA:34g。,显著水平=0.05。,测验计算:,查附表,v=7时,t0.05=2.365。现实得|t|0.05。,推断:接受H0:34g,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。,二、单个样本平均数的假设测验,由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。,测验方法,成组数据的平均数比较,成对数据的比较,三、两个样本平均数相比较的假设测验,(一)成组数据的平均数比较,如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平
13、均数作为相互比较的标准。,在两个样本的总体方差 和 为未知,但可假定,而两个样本又为小样本时,用t 测验。,三、两个样本平均数相比较的假设测验,从样本变异算出平均数差数的均方,,其两样本平均数的差数标准误为:,于是有:,由于假设,故,自由度,三、两个样本平均数相比较的假设测验,例2 调查某农场每亩30万苗和35万苗的稻田各5块,得亩产量(单位:kg)于表1,试测验两种密度亩产量的差异显著性。,表1 两种密度的稻田亩产(kg),假设H0:两种密度的总体产量没有差异,即 对,显著水平=0.05,测验计算:=428kg=440kg SS1=1930 SS2=550,故,三、两个样本平均数相比较的假设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设 测验

链接地址:https://www.desk33.com/p-747367.html