复习资料医学统计.doc
word复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:· A. 样本· B. 有限总体· C. 无限总体· D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为,标准差为,头围均数为,标准差为,欲比拟两者的变异程度,如下结论正确的答案是:· A. 身高变异程度大· B. 头围变异程度大· C. 身高和头围的变异程度一样· D. 由于两者的均数相差很大,无法比拟两者的变异程度3、在计算方差时,假如将各观察值同时减去某一常数后求得的方差:( )· A. 会变小· B. 会变大· C. 不变· D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )· A. 概率· B. 构成比· C. 发病率· D. 相比照5、两个分类变量的频数表资料作关联性分析,可用 ( )· A. 积距相关或等级相关· B. 积距相关或列联系数· C. 列联系数或等级相关· D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,如此经回归分析得的相应的b 值:· A. 越大· B. 越小· C. 比 r小· D. 可能较大也可能较小7、多组均数的两两比拟中,假如不用q检验而用t 检验,如此:· A. 结果更合理· B. 结果一样· C. 会把一些无差异的总体判断为有差异· D. 会把一些有差异的总体判断为无差异8、在比拟甲、乙两种监测方法测量结果是否一直时,假如采用配对设计秩和检验,甲、乙两法测量值之差中有、,假如差值绝对值的位次为3、4,如此这两个差值的秩次分别为:· A. ,3.5 · B. ,-3.5 · C. ,3.5 · D. -3,4 9、Y14+4X是17岁儿童以年龄岁估计体重市斤回归方程,假如体重换成国际单位kg,如此此方程:· A. 截距改变· B. 回归系数改变· C. 两者都改变· D. 两者都不变10、某卫生局对其辖区甲、乙两医院医疗技术人员的业务素质进展考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。此题中资料类型与设计类型分别为:· A. 定量资料成组设计· B. 定量资料配对设计· C. 分类资料成组设计· D. 分类资料配对设计11、在某农村地区随机抽取100名儿童,进展蛔虫感染情况粪检,结果50名儿童蛔虫卵粪检为阳性,如此该地儿童蛔虫卵粪检总体阳性率的95%的置信区间为:· A. 35%60% · B. 37%63% · C. 30%70% · D. 40%60% 12、两样本均数比拟,经t 检验,差异有显著性时,P 越小,说明:· A. 两样本均数差异越大· B. 两总体均数差异越大· C. 越有理由认为两总体均数不同· D. 越有理由认为两样本均数不同13、用于推断总体特征的样本应该是: ( )· A. 从总体中随机抽取的一局部· B. 从总体中随便抽取的一局部· C. 总体中有价值的一局部· D. 总体中便于测量的一局部14、某研究欲了解男性高血压患者与女性高血压患者血脂是否有差异,从某市6家医院随机调查了400人,测量血脂水平,经t 检验,得P,有统计学差异,由此推断该地男、女高血压患者血脂总体均数有差异,这里所谓有统计学差异是指:( )· A. 两样本均数差异有统计学差异· B. 两总体均数差异有统计学差异· C. 两样本均数和两总体均数的差异有统计学差异· D. 其是有一个样本均数和总体均数有统计学差异15、如下关于医学参考值围的表示不正确的答案是:· A. 没有疾病的人的解剖、生理、生化等数据的波动围· B. 习惯以包含95%或99%的观察值为界值· C. 根据专业知识确定单侧围或双侧围· D. 资料为正态分布时,选择正态分布法计算16、假设某地35岁以上正常成年男性收缩压的总体均数为,标准差为,后者反映的是:· A. 个体变异的大小· B. 抽样误差的大小· C. 系统误差的大小· D. 总体的平均水平17、在计算标准化率时,标准人口应选择:· A. 文献中经常涉与的非目标人群· B. 方便获得、与目标人群不同类的人群· C. 前人研究过、与目标人群不相关的人群· D. 有代表性的、较稳定的、数量较大的人群18、Wilcoxon两样本比拟的秩和检验在编秩时,假如遇到两组中有一样数值,应:· A. 不计秩次· B. 依次序编秩· C. 取其平均秩次· D. 以平均秩次的整数为秩19、如下关于直线回归的说法中,错误的答案是:· A. 回归分析前应绘制散点图· B. 应变量与自变量关系应为线性· C. 回归方程可用来描述两定量变量间数量依存的关系· D. 假设检验的 P 值能够反映自变量对应变量数量上的影响大小20、如下关于样本含量的表示,正确的答案是: ( )· A. 样本含量越大越好· B. 以实际可以收集到的样本例数为准· C. 时间、财力、人力等条件允许下的最大样本例数· D. 一定的推断精度和检验效能下的最少样本例数21、均数与标准差的关系:· A. 均数越大,标准差越大· B. 均数越大,标准差越小· C. 标准差越大,均数对各变量值的代表性越好· D. 标准差越小,均数对各变量值的代表性越好22、两样本均数比拟,经t检验,差异有显著性时,P越小,说明:· A. 两个样本均数差异越大· B. 两总体均数差异越大· C. 越有理由认为两总体均数不同· D. 越有理由认为两样本均数不同23、成组设计的方差分析中,有( ) · A. MS组间=MS组· B. SS组=SS组间· C. MS总=MS组间+MS组· D. SS总=SS组间+SS组24、比拟身高和体重两组数据变异度大小宜采用:· A. 变异系数CV· B. 方差S· C. 极差R· D. 四分位数间距25、正态近似法估计总体率的95%置信区间为:· A. · B. · C. · D. 26、成组设计四格表资料的X2检验,选用根本公式的条件· A. A5· B. T5· C. A5且T5· D. n40且T527、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数 =1,如此有: ( )· A. SS总=SS残· B. SS残=SS回· C. SS总=SS回· D. SS总>SS回28、3. 由两样本均数的差异推断两总体均数的差异,H0:1=2,H1:12。 t检验结果,拒绝H0,承受H1,是因为:( ) · A. 第一型错误小于5% · B. H0成立的可能性小于5% · C. 第二型错误小于5% · D. H1成立的可能性大于95% 29、正态分布曲线下,横轴上,从均数到1.96S S的面积为:· A. 95% · B. 45% · C. 97.5% · D. 47.5% 30、符合t 检验条件的数值变量资料如果采用秩和检验,如此如下说确的是:· A. 第一类错误增大· B. 第二类错误增大· C. 第一类错误减少· D. 第二类错误减少31、实验设计应遵循的根本原如此是:· A. 随机化、对照、盲法· B. 随机化、盲法、配对· C. 随机化、重复、配对· D. 随机化、对照、重复32、以下资料类型不宜用秩和检验的是:· A. 等级资料· B. 二项分布· C. 极度偏态分布资料· D. 数据一端不确定资料33、某研究检测了男性和女性红细胞数,经检验该资料总体方差相等,欲比拟男性和女性的红细胞数有无差异,取双侧,经成组t检验得,如此:· A. 可认为男性和女性的红细胞均数差异有统计学意义· B. 可认为男性和女性的红细胞均数无差异· C. 可认为男性和女性的红细胞均数差异很大· D. 尚不能认为男性和女性的红细胞均数有差异34、根据500例正常人的发铅原始数据偏态分布,计算其95%医学参考值围应采用:( )· A. 双侧正态分布法· B. 双侧百分位数法· C. 单上侧百分位数法 · D. 单下侧百分位数法 35、用于推断总体特征的样本应该是: ( )· A. 从总体中随机抽取的一局部 · B. 从总体中随便抽取的一局部 · C. 总体中有价值的一局部 · D. 总体中便于测量的一局部 36、宜用均数和标准差进展统计描述的资料分布类型是:( )· A. 正态分布 · B. 对数正态分布 · C. 正偏态分布 · D. 两端无确切值的分布 37、关于t分布特征的表示错误的答案是:( )· A. 分布为单峰分布 · B. t分布曲线是一簇曲线 · C. 以0为中心,左右对称 · D. 自由度越大,t分布曲线的峰部越低,尾部越高 38、随机抽取某市100名10岁女孩,测得其体重均数为35kg,假如以一定的概率估计该市10岁女孩体重的总体均数,宜采用: · A. 点估计 · B. 区间估计 · C. 假设检验 · D. 医学参考值围 39、如下关于样本含量的表示,正确的答案是: · A. 样本含量越大越好 · B. 以实际可以收集到的样本例数为准 · C. 以实际可以收集到的样本例数为准 · D. 一定的推断精度和检验效能下的最少样本例数 40、方差分析的应用条件: · A. 样本小,来自正态总体,样本间相互独立 · B. 样本来自正态总体,样本例数足够小 · C. 样本例数小,样本相互独立 · D. 样本来自正态总体,方差齐,样本数据独立 41、用最小二乘法建立直线回归方程的原如此是各实测点距回归直线的: · A. 纵向距离平方和最小 · B. 垂直距离的和最小 · C. 垂直距离的平方和最小 · D. 纵向距离之和最小 42、假如以成年男性血红蛋白低于120g/L为贫血的判断标准,调查某地成年男性1000人,记录每人是否患有贫血,结果有19名贫血患者,981名非贫血患者,如此该资料的类型为: · A. 定量资料 · B. 二项分类资料 · C. 有序多分类资料 · D. 无序多分类资料 43、对两个地区恶性肿瘤发病率进展比拟时,应该:( )· A. 排除两地人口年龄构成不同的影晌 · B. 排除两地总人口数不同的影响 · C. 排除各年龄组死亡人数不同的影响 · D. 排除抽样误差 44、用某疗法治疗急性腰扭伤病人30例,两周后25例患者痊愈,由此可认为:( )· A. 该疗法疗效好 · B. 该疗法疗效一般 · C. 因无对照,尚不能说明该疗法的疗效如何 · D. 因冶疗例数少,尚不能说明该疗法的疗效如何 45、在计算标准化率时,标准人口应选择: · A. 有代表性的、较稳定的、数量较大的人群 · B. 方便获得、与目标人群不同类的人群 · C. 前人研究过、与目标人群不相关的人群 · D. 根据研究目的随机抽样获得的小样本人群 46、不受年龄构成的影响,能够反映整个人群死亡水平的指标是: · A. 死因别死亡率 · B. 粗死亡率 · C. 标准化死亡率 · D. 年龄别死亡率 47、描述血清抗体滴度资料的平均水平宜选用: · A. 均数 · B. 中位数 · C. 几何均数 · D. 标准差 48、抽样调查某市正常成年男性与女性各300人,测得其血红蛋白含量,欲比拟男性与女性的血红蛋白含量有无差异(假设男性和女性的血红蛋白的方差相等),应采用: · A. 样本均数与总体均数比拟的t检验 · B. 配对t检验 · C. 成组t检验 · D. 成组设计两样本比拟的秩和检验 49、完全随机设计的方差分析组间变异源于: · A. 个体变异 · B. 随机变异 · C. 处理因素 · D. 随机变异和处理因素 50、某医生对患某病的10例成年男性患者的血清蛋白含量与血红蛋白含量资料进展分析,得到两变量的相关系数为r=0.916且p<0.001,如下说确的是: · A. 两变量呈正相关关系 · B. 两变量呈负相关关系 · C. 两变量不存在相关关系 · D. 两变量间相关关系密切程度不高 51、如下分布中,均数等于方差的是: · A. X2· B. u分布 · C. 二项分布 · D. Poisson分布 52、男性的钩虫感染率高于女性,今欲比拟甲,乙两乡居民的钩虫感染率,最适宜的方法是: ( )· A. 分性别进展比拟 · B. 两个率比拟的X2检验 · C. 不具可比性,不能比拟 · D. 对性别进展标准化后再比拟 53、在同一正态总体中随机抽样,总体均数有90%的可能在: A. B. C. D. 54、正态性检验,按=0.10水准,认为总体不服从正态分布,此时假如推断的错,其错误的概率为: · A. 等于0.10 · B. ,而未知 · C. 等于0.90 · D. 1-,且未知 55、对于R×C行列表的X2检验,其自由度计算公式为: · A. R-1 · B. C-1 · C. (R-1)(C-1) · D. R×C-1 56、某研究欲比拟正常人(n1=10)与单纯肥胖者(n2=8)血浆总皮质醇是否有差异,采用秩和检验。计算得T1=96.5,T2=74.5,查两样本比拟的秩和检验用T界值表:当双侧=0.1时,T界值围为5696;当双侧=0.05时,T界值围为5399;当双侧=0.01时,T界值围为47105。如此P值为: · A. P>0.10 · B. 0.05 < P < 0.10 · C. P=0.05 · D. 0.01 < P < 0.05 57、如下符号中表示总体参数的是: · A. t· B. · C. 2· D. 58、如下关于均数的标准误的表示错误的答案是: · A. 是样本均数的标准差 · B. 反映样本均数抽样误差大小 · C. 与成正比,与成反比 · D. 其值越大,用样本均数估计总体均数的可靠性越好 59、采用正态近似法估计总体率的置信区间,要求: · A. n50 · B. P不接近与0 · C. np或n(1-p)大于5 · D. np与n(1-p)均大于5 60、为了反映某地区五年期间鼻咽癌病例的年龄分布,可采用_· A. 直方图 · B. 普通线图 · C. 半对数线图 · D. 复式直条图 第二大题:多项选择题1、当四格表的周边合计数不变时,假如某个格子的实际频数有变化,如此其理论频数说法不正确的答案是:· A. 增大 · B减小 · C. 不变 · D. 不确定 · E. 随该格实际频数的增减而增减 2、方差分析的条件是· A. 各样本相互独立 · B各样本来自正态总体 · C. 各处理组总体方差相等 · D. 样本例数大于50 · E. 各处理组样本例数应相等 3、频数表可用于A. 揭示资料分布类型 B揭示资料分布特征 C. 发现可疑值 D. 计算某些统计指标 E. 参数估计 4、某医生对患某病的10例成年男性患者的血清蛋白含量与血红蛋白含量资料进展分析,得到两变量的相关系数为=0.916,且P<0.001,如下说确的是 · A. 两变量呈正相关关系 · B两变量呈负相关关系 · C. 两变量不存在相关关系 · D. 两变量间相关关系密切 · E. 两变量间相关关系较弱 5、两样本比拟的t 检验的适用条件为( )· A. 资料须为数值变量资料 · B资料服从正态分布 · C. 两总体方差相等 · D. 任何资料类型 · E. 不确切数据资料 6、某研究调查了某地100名高血压患者的血胆固醇含量,经计算其均数为6.58mmol/L,标准差为1.23mmol/L,当样本含量增大到500人时,以下说法不正确的答案是:( )· A. 标准差会变小 · B标准差会变大 · C. 标准误会变小 · D. 标准误会变大 · E. 标准差与标准误均不变 7、 X2检验可用于:· A. 两个与两个以上样本均数的比拟 · B配对设计两个样本率的比拟 · C. 多个样本率或构成比的比拟 · D. 频数分布的拟合优度检验 · E. 率的线性趋势检验 8、如下指标中可用于描述频数分布集中趋势的指标有: · A. 全距 · B. 标准误 · C. 均数 · D. 变异系数 · E. 中位数 9、当两总体方差一样时,以下方法适用于两样本均数比拟的是: · A. t检验 · B. t检验 · C. Z检验 · D. 方差齐性检验 · E. 方差分析 10、两样本均数比拟时,n1、n2均小于30、总体方差不齐且呈极度偏态的资料宜用 · A. t检验 · B. t检验 · C. u检验 · D. 秩和检验 · E. 没有适宜的统计方法 11、假设某地35岁以上正常成年男性收缩压的总体均数为120.2mmHg,标准差为11.2mmHg,从该地随机抽取20名35岁以上正常成年男性,其平均收缩压为112.8mmHg,又从该地随机抽取10名7岁正常男孩,测得其收缩压为90.5mmHg,标准差为10.4mmHg,如此如下说法不正确的答案是:( )· A. 112.8mmHg与120.2mHg不同是由系统误差造成 · B112.8mmHg与120.2mHg不同是由两总体均数不同造成 · C. 90.5mmHg与112.8mmHg不同是由抽样误差造成 · D. 90.5mmHg与120.2mHg不同是由抽样误差造成 · E. 90.5mmHg与112.8mmHg不同是由两总体均数不同 12、如下属于相比照的指标是: · A. 相对危险度RR · B比值比OR · C. 病死率 · D. 变异系数 · E. 性比例 13、某研究用甲、乙两种方法测量某市10处水源中氟含量(mg/L),采用Wilcoxon符号秩和检验比拟两种方法测量结果有无差异,如下编秩方法错误的答案是: · A. 差值从小到大编秩 · B差值的绝对值从小到大编秩 · C. 差值从大到小编秩 · D. 差值的原始值从大到小统一编秩 · E. 原始值从小到大分别编秩 14、假如样本相关系数r=0,如此如下说法不正确的答案是:( )· A. 两变量x, y不存在任何关系 · B两变量存在相互关系的可能性很小 · C. 两变量的关系尚不能确定 · D. 两变量间必然存在某种曲线关系 · E. 两变量间不存在直线关系,但不排除存在某种曲线关系 15、对于服从双变量正态分布的资料,如果直线相关分析算出的r值越大,如此经回归分析得的相应的b值,如下说法不正确的答案是 · A. 越大 · B越小 · C. 比r小 · D. 比r大 · E. 可能较大也可能较小 16、在多组均数的两两比拟中,假如不用q检验而用t检验,如此如下不正确的答案是:( )· A. 结果更合理 · B结果一样 · C. 会把一些无差异的总体判断为有差异 · D. 会把一些有差异的总体判断为无差异 · E. 因条件不足,尚不能判断 17、关于t分布,如下表示正确的答案是: · A. t分布是以0为中心,左右对称的一簇单峰曲线 · B自由度越小,曲线峰度越低,尾部越高 · C. 当自由度趋近于无穷大时,t分布就是标准正态分布 · D. 自由度一样时,t的绝对值越大,概率P值就越小 · E. 自由度越大,一样概率值的t界值越大 18、如下指标,属于绝对数的是: · A. 甲区的急性传染病人数为乙区的1.25倍 · B甲区某年急性传染病的发病率为382/ 10万 · C. 甲区占某市急性传染病的比重为18% · D. 某区某男身高为168厘米 · E. 甲区某年急性传染病人数为2600人 19、如下属于非参数检验方法的是: · A. t检验 · B. H检验 · C. Wilcoxon符号秩和检验 · D. 方差分析 · E. M检验20、如下关于相关系数r的说法错误的答案是:( )· A. 根据|r|大小可将两变量关系分为低、中、高度相关 · B根据两组的|r|可直接比拟相关密切程度 · C. 假如r > 0.5,如此x和y必存在线性相关 · D. 得r值后尚须作假设检验才能确定x和y有无线性相关 · E. 正态双变量资料可以根据对b的假设检验对r作出判断 第三大题:简答题1、计算参考值围的方法有那些。答: 正态分布法和百分位数法。2分当指标服从正态分布时,用正态分布法;1.5分不服从正态分布时,用百分位数法。1.5分2、方差分析的根本思想与应用条件是什么?答:根本思想:将全部观察值的总变异按设计类型分解成两个或多个组成局部,然后将各局部的变异与随机误差进展比拟,以判断各局部的变异是否具有统计学意义。3分应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本的总体方差齐性。2分3、简述率的标准化需要注意的问题。答:1标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择标准不同,计算出的标准化率也不一样。因此标准化率是用于相互间的比拟,实际水平应采用未标化率来反映。2分2样本的标准化率是样本指标值,亦存在抽样误差,假如要比拟其代表的总体标准化率是否一样,需作假设检验。1分3注意标准化方法的选用。如对死亡率的年龄构成标准化,当被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。1分4各年龄组率假如出现明显交叉,或呈非平行变化趋势时,如此不适合采用标准化法,宜分层比拟各年龄组率。此外,对于因其它条件不同,而非部构成不同引起的不可比性问题,标准化法难以解决。1分4、简述患病率和发病率的区别。答:发病率表示在一定时期,可能发生某病的一定人群中新病例出现的频率,其分子是一定期间的新发病例数。2分患病率指在某特定时间总人口中某病新旧病例所占比例,适用于病程较长的疾病或发病时间不易明确的疾病的统计研究,按观察时间的不同可分为时点患病率和期间患病率。1分时点患病率用于反映在调查或检查时点一定人群中某病的现患情况(包含该病的新、旧病例);1分期间患病率可用于反映在观察期间一定人群中存在或流行某病的频度,包括观察期间的新病例数和现患病例数,但资料收集较为困难。1分5、请举例说明什么是总体和样本。答:总体:是根据研究目确实定的所有同质观察单位某种观察值的集合,通常有无限总体和有限总体。2分例:略。1分样本:是从总体中抽取局部观察单位其实测值的集合。1分例:略。1分6、在完全随机设计的方差分析中SS总、SS组间、SS组各表示的含义?答: SS总是各观测值与总均值之差的平方和,即总的离均差平方和,表示总变异的大小2分;SS组间表示组间变异,指各处理组均值大小的不同,是有处理因素和随机误差造成的2分;SS组表示组变异,指同一处理组部给观察值之间的变异,是由随机误差造成的。1分7、简述非参数统计方法的应用条件。答:1资料不服从正态分布、方差齐或总体分布类型未知1分2等级资料1分3个别数值偏大或某一端为确定数值1分4在资料满足参数统计的要求时,应首选参数法,以免降低检验效能。2分8、简述实验设计和调查设计的主要区别。答:调查设计指在没有任何干预措施的条件下,客观的观察和记录研究对象的现状与其相关特征,2分,影响因素较多,误差较难控制。1分实验设计指研究者根据研究目的,主动加以干预措施,并观察其结果,回答研究假设所提出的问题,1分影响因素较少,较易控制误差。1分9、简述小概率事件原理。答:当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件。2分其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是小概率事件的原理,也是进展统计推断的根底。3分10、参数统计和非参数统计的区别。答: 1参数检验是以特定的总体分布为前提,对未知总体参数做推断的假设检验方法;非参数检验不以特定的总体分布为前提,也不针对决定总体分布的参数做推断。2分2非参数检验不要求总体的分布类型,适用性广泛;在非参数检验中,一般不直接用样本观察值做分析,统计量的计算基于原数据在样本中的秩次,因此损失了局部样本信息。2分3假如对符合参数检验条件的资料用非参数检验,如此检验效能低于参数检验。因此对于符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;对不满足参数检验条件的资料,应选用非参数检验。1分11、简述Pearson积距相关与Spearman秩相关的区别和联系。答: 区别:1 Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。1分2Pearson积矩相关是基于原始数据进展统计分析,而Spearman秩相关是将原始数据进展秩变换后进展统计分析。Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。2分联系:1两种相关系数的取值都介于-1和1之间,无单位,小于 0 为负相关,大于0为正相关。 2用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。2分12、可信区间与医学参考值围的区别。答:(1)意义不同:可信区间:按一定的置信度1-a 估计总体均数所在的围;医学参考值围:大多数“正常人:的某项解剖、生理、生化指标的波动围。2分(2)计算公式不同:可信区间用的是标准误,而医学参考值围用的是标准差。2分(3)用途不同:可信区间用于总体均数的估计和假设检验,医学参考值围是用于判断观察对象的某项指标是否正常,为临床提供参考。1分13、t检验中是否都应采用双侧检验?答:t检验中是选择单侧检验还是双侧检验,需根据专业知识来确定。3分例如,根据专业知识能确定未知总体均数不会大于总体均数时,此时如此用单侧检验,否如此,采用双侧检验。2分14、标准差和标准误的区别和联系是什么?答: 区别:1计算公式不同:标准差,标准误;1分2统计学意义不同:标准差越小,说明个体越集中,均数对数据的代表性好;标准误越小,说明抽样误差越小,用样本均数来估计总体参数的可能性越大;1分3用途不同:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。1分 联系:当样本量n一定时,标准误随标准差的增加而增加,公式为。2分 15、简述x2检验的根本思想。答:根本思想:判断实际频数与理论频数的差异是否由抽样误差所引起,x2值的大小反映了实际频数与理论频数的吻合程度。2分在H0成立的条件下,实际频数与理论频数相差不应该很大,假如计算得到较大的x2值,超过了事先设定的检验水准所对应的x2值,如此P<0.05,说明实际频数与理论频数的较大差异是由抽样误差所引起的可能性很小,有理由拒绝H0 ,承受H1 。16、简述回归方程中a、b的含义?答: :即截距,表示x=0时,的值。2.5分b :即直线的斜率,表示自变量x改变一个单位时,应变量y平均变化b个单位。2.5分 第四大题:判断分析题1、某地抽样调查360名健康成年男子的红细胞数,均数为4.66×1012/L,标准差为0.58×1012/L,故该研究者得出该地健康成年男子的红细胞数的95可信区间为(4.66±1.96×0.58)1012/L。请问该结论是否正确,并说明理由。答:不正确.可信区间用的是标准误,而95%医学参考值围用的才是标准差,1分该题求的95%可信区间用的是标准差,混淆了标准差和标准误的区别,故该结论不正确。1分H0,认为该药效果优于对照药。但某医生怀疑检验效能是否足够大,你认为这种怀疑对吗?简述理由。答:不正确。2分检验效能,即1是指两总体参数间确实存在差异,如此,按照现有检验水准,检验出其差异的能力。1分当样本含量一定时,与成反比,与1成正比,1分因为P<0.05已经检验出差异,在这种情况下只可能犯I型错误,不用再考虑检验效能了。1分3、在临床实验中,样本含量越大越好。该说法是否正确,请说明理由。 答:不正确。2分样本含量越高,会增加研究的本钱,而且会降低科学研究的可操作性,应选择适当的样本含量,既能满足科研的统计学要求,又能最大限度的控制本钱和研究风险,提高研究效率。2分4、在完全随机设计的方差分析中,变异分解为MS总MS组间+MS组,该分解是否正确,请说明理由。答:不正确。2分完全随机设计资料只有一个研究因素,目的在于比拟两个或多个处理组的总体均数是否不同。完全随机设计资料的总离均差平方和可以分解为MS组间和MS组两局部,即SS总SS组间+SS组。5、“200例肝癌的病因与临床分析研究中,男性120例,占60.0%,女性40例,占40%,因此认为男性肝癌的发病率高于女性。试述该结论是否正确,并说明理由。答:不正确。2分它犯了以构成比代替率的错误。2分6、某班级全体男生32人,其平均身高为,女生26人其平均身高为,对其进展假设检验,测得P<0.05,可以认为男女身高不等。该分析是否正确?请说明理由。答:不正确。2分本研究的目的是全班同学不同性别间血压的比拟,因该题已经知道了全班男女身高的平均身高值,即了总体均数,不是抽样研究,没有抽样误差,所以不需要假设检验,所以该分析不正确。2分7、某研究者测得159名正常成年男性矿工的血红蛋白,红细胞的均数分别为:15g/dL、520万/mm3,标准误分别为/dL、12万/ mm3,由于0.5比起12来要小得多,因此有结论“红细胞数的变异大于血红蛋白的变异度。此结论是否合理?请说明理由。答:不正确。2分标准误是表示抽样误差大小的,要比拟两指标的变异程度的大小应用变异系数比拟,所以改说法不正确。2分8、在双变量正态分布的相关与回归分析中,| 值越大,如此 |b| 越大。该说确吗?请说明理由。答:不正确。2分因为在双变量正态分布资料中, 与b 同号,且其假设检验等价,但无能肯定 |值越大,如此|b| 越大。2分9、某研究者欲比拟甲乙两地高血压患病率,资料见下表: 甲、乙地各年龄组人数与高血压患病率(%) 年龄组 甲地 乙地 调查人数 患病率 调查人数 患病率 30 31240 359293 50 219325 60 369 合 计 10871125 该研究者根据两地的合计患病率认为甲地高血压患病率低于乙地高血压患病率。该结论是否正确?请说明理由。4分 答:不正确。2分从资料可以看出,甲地各年龄组的高血压患病率均高于乙地,但由于甲乙两地调查对象的年龄构成不同,甲地的年轻调查对象的构成比更大,最终导致其合计患病率反而更低,应将两地患病率进展标准化后再比拟。故该结论不正确。2分10、将20名某病患者随机分成两组,分别用甲乙两种药物治疗,用药一个月后测得治疗前后血沉mm/h如下表。要分析甲乙两种药物的疗效有无差异,某医生分别将甲乙两种药物治疗后的血沉值进展两样本均数的t检验,得到的结论为甲乙两种药物的疗效无差异。该结论是否正确,请说明理由。4分 甲、乙两药治疗前后的血沉mm/h 甲药组乙药组受试者治疗前治疗后受试者治疗前治疗后11061942139210236339541110413651010583674663782710488581129539105109310104答:不正确。2分由于甲、乙组治疗前的数据不一样,只用治疗后的数据进展分析,只能说明两组治疗后的血沉不同,而不能说明甲乙两药的疗效有无差异。要比拟甲乙两药疗效有无差异,应分别将甲乙两药各自治疗前后的血沉值作差值,比拟两组差值的均数是否有差异。2分11、某病潜伏期服从偏态分布,某医生收集了37名男性患者的潜伏期资料,欲采用均数、标准差描述其集中位置和离散程度,该医生所选指标是否合理?请说明理由。答:不正确。2分该资料为负偏态分布,应用中位数和四分数间距来表示其集中趋势和离散趋势。1分而均数和标准差是用于正态分布的资料,所以所选指标不正确。1分12、某工厂保健站在调查中发现946名工人中,患慢性病的274人,其中女性219人,占80,男性55人,占20,由此得出结论,女工易患慢性病。该说确吗?请说出理由。4分答:答:不正确。2分犯了以构成比代替率的错误。2分13、某地抽样调查360名健康成年男子的血红蛋白含量,均数为/L,标准差为7.10 g/L,如此该地健康成年男子的血红蛋白含量的95区间估计为154.50±1.96×7.10g/L。该方法是否正确?请说明理由。答:不正确。2分计算参考值围用的是标准差,计算可信区间用标准误,该题计算血红蛋白含量的95%可信区间用的是标准差,所以该方法不正确。2分14、某研究探讨体外表积与体重的关系,分别进展了直线相关与回归分析,得到r0.78,b-1.6。该分析结果是否正确?请说明理由。4分