心理统计学PPT课件6:推断统计学原理.ppt
推断统计学原理,抽样分布(sampling distribution)参数估计(parameter estimation)假设检验(hypothesis testing)抽样分布是参数估计与假设检验的理论基础,三种不同性质的分布,总体分布(population distribution):总体内个体数值的次数分布。样本分布(sample distribution):样本内个体数值的次数分布。抽样分布(sampling distribution):根据所有可能的样本观察值计算出来的某一种统计量的观察值的概率分布。,从总体分布到抽样分布,总体X的概率分布这是一个均匀分布(uniform distribution)总体,总体平均数和总体方差,样本(n=2)的所有可能结果,样本(n=2)的平均数的抽样分布,样本(n=2)的平均数的抽样分布图,不同总体情况下的抽样分布,示意图,抽样分布的定理,设总体X服从分布F(x),(X1,X2,Xn)是抽自该总体的一个简单随机样本(simple random sample),总体均值与样本均值、总体方差与样本均值的方差有如下关系:,抽样分布的定理,从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数;从总体中随机抽出容量为n的一切可能样本的平均数的方差,等于总体方差除以n,样本(n=2)平均数的平均数和方差,=(20+22.52+253+27.54+305+32.54+353+37.52+40)/25=30,样本均值的抽样分布(2已知),若(X1,X2,Xn)是抽自总体X的一个容量为n的简单随机样本,则依据样本的所有可能观察值计算出的样本均值的分布,称为样本均值的抽样分布。,样本均值的抽样分布,定理设(X1,X2,Xn)是抽自正态分布总体XN(,2)的一个容量为n的简单随机样本,则其样本均值也是一个正态分布随机变量,且有,样本均值的抽样分布,例题,某类产品的强度服从正态分布,总体平均数为100,总体标准差为5。从该总体中抽取一个容量为25的简单随机样本,求这一样本的样本均值介于99101的概率。如果容量为100呢?,样本均值的抽样分布(2已知),非正态总体、已知时设总体X的均值和2,当样本容量趋向无穷大时,样本均值的抽样分布趋于正态分布,且样本均值的数学期望和方差分别为,例题,某类产品的强度不服从正态分布,总体平均数为100,总体标准差为5。从该总体中抽取一个容量分别为25的简单随机样本,求这一样本的样本均值介于99101的概率。如果容量为100呢?,例题,某种灯具平均寿命为5000小时,标准差为400小时,从产品中抽取100盏,问它们的平均使用寿命不低于4900小时的概率是多少?如果是从2000盏灯具中不放回地抽取100盏呢?,有限总体修正系数,设总体X服从分布F(x),(X1,X2,Xn)是以不放回形式抽自该总体的一个样本,总体均值与样本均值、总体方差与样本均值的方差有如下关系:,参数估计,用样本统计量的来估计相应总体参数,称为参数估计判断估计量优劣的标准无偏性有效性一致性充分性,参数估计的基本方式,点估计(point estimation)用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。区间估计(interval estimation)以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。,区间估计,示意图,区间估计的基础抽样分布,根据抽样分布的原理,可得到不同条件下总体参数的区间估计的计算方法区间估计涉及置信水平(confidence level)和置信区间(confidence interval)。,例题,某种零件的长度服从正态分布。已知总体标准差=1.5厘米。从总体中抽取100个零件组成样本,测得它们的平均长度为10.00厘米。试估计在95%置信水平下,全部零件平均长度的置信区间。,例题*,上例中,若已知该批零件共有2000件,抽样方式采用不放回抽样,求该批零件平均长度的置信水平为95%的置信区间。,假设检验,假设检验回答的问题某总体平均水平有无显著变化?两总体平均水平有无显著差异?多个总体平均水平有无显著差异?两个或多个总体方差有无显著差异?以上:参数假设检验某总体是否服从正态分布(或其他分布)?某串数据是否随机?以上:非参数假设检验,非参数假设检验举例,单样本游程检验某食堂窗口前排队性别规律性:F M F M F F F F F M M M F F M MF M F M F M F M F M F M F M F MF F F F F F F F M M M M M M M MM M M M M M M M F F F F F F F F,F M F M F F F F F M M M F F M MF M F M F M F M F M F M F M F MF F F F F F F F M M M M M M M MM M M M M M M M F F F F F F F F,假设检验,利用样本信息根据一定概率对总体参数或分布的某一假设作出拒绝或保留的决断称为假设检验,假设,有两个相互对立的假设即零假设(null hypothesis,或称原假设、虚无假设、解消假设)备择假设(alternative hypothesis,或称研究假设、对立假设)假设检验是从零假设出发,视其被拒绝的机会,从而得出决断。,假设检验,示意图,显著性水平,拒绝零假设的概率称为显著性水平(significance level)。显著性水平和可靠性程度(置信水平)之间的关系是:两者之和为1。,双侧检验与单侧检验,双侧检验(two-tailed test,two-sided test):零假设为无显著差异的情况;左侧检验(left-tailed test):零假设为大于等于的情况;右侧检验(right-tailed test):零假设为小于等于的情况。,例题,某小学历届毕业生汉语拼音测验平均分数为66分,标准差为10分。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取25份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?,统计决断的两类错误,第一类型的错误(Type I error)错误拒绝了属于真实的零假设。这种错误的可能性大小正是显著性水平的大小水平未变而认为有显著差异第二类型的错误(Type II error)错误保留了属于不真实的零假设水平显著差异而认为无显著差异,