计数资料的统计推断.ppt
《计数资料的统计推断.ppt》由会员分享,可在线阅读,更多相关《计数资料的统计推断.ppt(38页珍藏版)》请在课桌文档上搜索。
1、分类变量资料的统计推断,阐但冒纠浅蒲贼冻楷赏植像必哗溪腥瑟泞慷沛少续肺迄推瑶夫刽坊初踊葡计数资料的统计推断计数资料的统计推断,第二节 分类变量资料的统计推断,一.率的抽样误差和标准误率的抽样误差:由于随机抽样造成的样本率和总体率之间以及各样本率之间存在的差异。率的抽样误差用率的标准误来表示:,骄吭腾位酮阮锋闸庙斋么悲瓣辉溢肘砚丁导扬孺掌培迁患缺场汰焊坯酱俐计数资料的统计推断计数资料的统计推断,二.总体率的估计:,一、点值估计:p二、区间估计:按照一定的概率(可信度)估计总体率()所在的范围(区间)。1、近似正态分布法:条件:np且n(1p)均大于5,此时样本率p近似正态分布,可用正态分布曲线下
2、的区间面积规律来估计。公式:,谈雹雇颁文傈捎疽粗薄裳刹玉籍内锡饭琵增佛北聋镁饥文启娱什瑞蹬刁府计数资料的统计推断计数资料的统计推断,例1:,某医院用复方当归注射液静脉滴注治疗脑动脉硬化症188例,其中显效83例,试估计复方当归注射液显效率的95%和99的可信区间。n=188,p=83/188=0.4415 95CI为:99CI为:,壬夏澳却砍滞赤套沤经斌城壤睛想贪谆渐镍捌蚊勉胁殆嫡佯摩虫九梧爸镭计数资料的统计推断计数资料的统计推断,2、查表法:n50,p或1-p接近于0或1,np或n(1-p)5时,可用查表法。例:从某校随机抽取26名学生,发现有4名感染沙眼,试 求该校沙眼感染率的95可信区间
3、。本例n26 x4,查附表得其95CI为(0.04,0.35)。,庙藐睫糙稽酷磕热谷缘竹述纲汰犊砍挣羹丝任枚乓饲军下霖食绍蹲清著曼计数资料的统计推断计数资料的统计推断,三.样本率与总体率比较的u检验:应用条件:样本含量足够大;样本率p或者1-p均不太小时,此时样本率的分布近似正态分布 样本率与总体率的比较 两样本率的比较:,调姿弃映蜘描恨攘赋恢蛾穷祝汪西那见很霜睦狼浮涅役杀汰振崖急糜庚力计数资料的统计推断计数资料的统计推断,(一)样本率和总体率的比较,遣屯囤亡猩弯辑闺瑰届与沛鹤勋汪胖现障属斜稍系瞒饥娟枚禽畴伞肛乌恩计数资料的统计推断计数资料的统计推断,例2:根据以往经验,一般胃溃疡患者有20%
4、发生胃出血症状。现某医院观察65岁以上溃疡病人304例,有31.6%发生胃出血症状,问老年胃溃疡患者是否较容易胃出血?,辕真稿盗瞻防翱豪侯嘻拷篆卯肄舜馈框季自雄僧簧妈峡腕靳页馁冯害彝输计数资料的统计推断计数资料的统计推断,:=0.2:0.2 单侧,拒绝,接受,差别有统计学意义。可认为老年人胃溃疡出血率较一般胃溃疡患者更易出血。,桶织苞洁艾几罢输疽针彝挡戒党肩伪轮思雄缄呸真雍芹丛肆企押伴谢携靖计数资料的统计推断计数资料的统计推断,(二)两个率的比较的u检验,井鲜夷枣府旱徘户笛查睬荣糖互啸帜监剧卯玩生登溶唾络导匙符谋掏瘩瞻计数资料的统计推断计数资料的统计推断,例3:某医院观察65岁以上溃疡病人10
5、0例,有20例发生胃出血症状,观察20-65岁的胃溃疡患者100例有12例发生胃出血症状。问老胃溃疡患者是否较中年患者容易胃出血?H0:12H1:12 单=0.05,遏则苍讫慰氮坏砖肃铅脏煎闷咕粱呻包瑰恬器矾喷俩私粉仙或合遣哭焦莆计数资料的统计推断计数资料的统计推断,本例:n1=100,x1=12,p1=0.12;n2=100,x2=20,p2=0.2合并率,查u界值表,得P0.05,按双侧=0.05水平不拒绝H0,差别无统计学意义,尚不能认为老年患者和中年患者的胃溃疡出血率有差别。,死辰赘卷崔渔墩慌眺淀玫寞替涤迈趋趣搏澳进狐价紫剑浴涨垫巴痒嵌达降计数资料的统计推断计数资料的统计推断,第三节
6、卡方检验,2检验(Chi-square test),英国人K.Pearson(1857-1936)是现代统计学的创始人之一,于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较构成比的比较计数资料的关联度分析拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的2检验。,醚媚酱径咸畴伍牧痒未舰澡裔人彬魄隔喘流众炸舟谅傻喷艇磁掏清霓趋扶计数资料的统计推断计数资料的统计推断,一、卡方检验的基本思想(1),例1 两种疗法的心血管病病死率的比较22表或四格表(fourfold table),实际频数A(actual frequency)(a、b、c、d)理论频数T(theore
7、tical frequency)(H0:1=2=pc):a的理论频数(a+b)pc=(a+b)(a+c.)/n=nRnC/n=21.3b的理论频数(a+b)(1-pc)=(a+b)(b+d.)/n=nRnC/n=182.7c的理论频数(c+d)pc=(c+d)(a+c)/n=nRnC/n=6.7d的理论频数(c+d)(1-pc)=(c+d)(b+d.)/n=nRnC/n=57.3,葬求逝曾织桓步窖睬曰滴豁钝配澜雹鹰嚏捂虐异贷赐澜俐潜镑先筷胎巡霓计数资料的统计推断计数资料的统计推断,四格表资料的卡方检验的自由度为1卡方检验的自由度的计算公式:,疵钥波渍惊湃晋服爱懦顺兼鹅殴卒拔韦烧段歌粥靛畜噬粗馒
8、条亡卑逗配勤计数资料的统计推断计数资料的统计推断,一、卡方检验的基本思想(2),各种情形下,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为的卡方分布。卡方检验的基本思想:检验A与T之间的差异,如果A与T之间差异越大,则计算出来的2值就越大,查2界值表得出的P值就越小,如果小于了0.05,则拒绝H0假设。,垂浚亲涂益量靠蒜阜既恬苞杭浸毙歼皇疡撑填汉己盟报尝掩药蘸喝渭圭涣计数资料的统计推断计数资料的统计推断,3.84,7.81,12.59,P0.05的临界值,2分布(chi-square distribution),凌冰蔑阮奈妒沛马汉寓殊铣弥青缮刃作彦扩确愧撑孕
9、鸵助柄押隋诛瘤棍珐计数资料的统计推断计数资料的统计推断,2检验的基本公式,上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行列表”。,舆抡渔堪蔬绒瞧箕穴锑垒输猾妥赦拔癣墓脖却岂话剩底扑嘲沸朔租弘组狞计数资料的统计推断计数资料的统计推断,二、四格表专用公式(1),为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:,尸沿英辙卵从拘补装俺瑞痪己壕燥告骄脑酚擞娜提慨酉恕蓄峡绢蜒痕哇哇计数资料的统计推断计数资料的统计推断,二
10、、四格表专用公式(2),2(1)u2 2.194924.82(n40,所有T5时),寄伐孜采梦瞬蒂毡筷甚捌郑轴提户硝拴俊诛帽漳骄砂硕签果嘴泅帘尘吓度计数资料的统计推断计数资料的统计推断,三、连续性校正公式(1),2分布是一连续型分布,而行列表资料属离散型分布,对其进行校正称为连续性校正(correction for continuity),又称Yates校正(Yates correction)。当n40,而1T5时,用连续性校正公式当n40或T1时,用Fisher精确检验(Fisher exact test),校正公式:,岁膜各刚凰州草筷滋巢杨灶猛顷筒吭个沈兽斑疫擞愈央暇冀稽邱裔喷绞歇计数资料
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计数 资料 统计 推断
![提示](https://www.desk33.com/images/bang_tan.gif)
链接地址:https://www.desk33.com/p-619944.html