《社会研究方法第三讲第二部分统计指标.ppt》由会员分享,可在线阅读,更多相关《社会研究方法第三讲第二部分统计指标.ppt(124页珍藏版)》请在课桌文档上搜索。
1、第二部分,统 计 指 标,统计指标是反映社会经济现象总体数量特征的概念和范畴。统计资料经过加工整理形成分布数列后,我们对它的变化规律已有了一个直观的了解。然而,要作进一步的统计分析仅靠这些直观了解是远远不够的,我们还需要寻找一些能充分度量统计分布数量特征的统计指标,以便对不同的研究对象进行分析研究。对统计资料的度量包括:对统计资料的简单描述和比较(总量指标、相对指标);集中趋势的度量(平均指标);离中趋势的度量(变异指标)。因此,统计指标从它们的作用和方法特点的角度可概括为三类:总量指标(又称绝对指标)、相对指标和平均指标。,(一)总量指标的概念和作用,是编制计划、实行经营管理的基本依据。,1
2、、概念:总量指标是反映社会经济现象在一定时空条件下的总体规模(或工作总量)和水平的统计指标,也称为绝对指标。,2、作用,是对社会经济现象认识的起点。,是计算相对指标和平均指标的基础。相对指标和 平均指标都是在总量指标的基础上派生出来的,一、总量指标,(二)总量指标的种类,总体标志总量(简称标志总量):总体 中各标志值的总和,1、按其反映 总体内容 的不同,总体单位总量(简称单位总量):总体内所有单位的总数,2、按其反映 时间状况 的不同,时期指标:反映某种社会经济现象在某一段时间 发展变化结果的总量指标,时点指标:反映某种社会经济现象在某一时点(瞬 间)状态上的总量指标,区别二者的方法:是否具
3、有可加性。,时期指标和时点指标的不同,(1)时期指标数值连续统计,时点指标数值间断统计;(2)时期指标可以累计相加,时点指标数值直接累加没有实际意义;(3)时期指标数值大小和统计期限长短有关,时点指标数值大小与时间间隔长短没有直接关系。,通过下表:1、区分总体单位总量与总体标志总量;2、区分时期指标与时点指标。,总体标志总量,时点指标,时期指标,总体单位总量,二、相对指标,(一)相对指标的概念又称为统计相对数,是两个有联系的统计指标对比形成的比率,它表明相关现象之间的数量联系程度和对比关系。作用:是最常用的对比分析方法,可使一些不能直接对比的现象有了共同对比的基础;可以从数量上反映事物之间的联
4、系,表明现象发展的相对水平、普遍程度、内部结构和比例关系等,可使我们能够更清楚地认识现象之间的关系。(二)相对指标的表现形式(三)相对指标的计算(四)正确运用相对指标的原则,用倍数、系数、成数、等表示,用双重计量单位表示的复名数:人/平方公里,(二)相对指标的表现形式,倍数与成数一般用整数的形式来表述,返回,(三)相对指标的计算,1、计划完成程度相对指标 2、结构相对指标 3、比例相对指标 4、比较相对指标 5、强度相对指标 6、动态相对指标,返回本节首页,1、计划完成程度相对指标,(1)计划完成相对数的一般公式(2)计划完成相对数的计算:原则:计划和实际以绝对数形式出现时,直接套用公式;计划
5、和实际以相对数形式出现时,如果含基数100%,直接套用公式计算;如果不含基数100%,则要转化成含基数的数字再进行计算。(3)长期计划的检查,下一页,计划完成相对数的计算例1,某工厂某年计划产值300万元,实际完成360万元,则:即超额完成20%。,下一页,计算计划完成相对数例2,某企业2002年的劳动生产率计划规定比上年提高8%,实际执行结果提高10%,则,即:超额1.85%完成计划。,下一页,某企业生产某产品,第一季度计划单位成本降低6%,实际降低7.6%,则即实际单位成本比计划成本低1.71%,成本降低率比计划多完成1.71%,超额完成任务。,返回首页,计算计划完成相对数例3,返回,长期
6、计划的检查,(1)水平法:提前完成5年计划的时间:在5年中,从前往后考察,只要有连续一年时间实际完成的水平达到了计划规定的最后一年的水平,就算完成了5年计划。(2)累计法:例:某5年计划的基建投资总额为2200亿元,5年内实际累计完成2240亿元,则:5年计划完成程度=2240/2200100%=101.8%,返回首页,例如,水平法举例,根据5年计划,某种工业产品在该5年计划的最后一年生产量应达到823万吨,该产品在5年计划最后两年的每月实际产量如下:试计算该产品5年计划完成程度和该产品提前完成5年计划的时间。,水平法举例,解:该产品5年计划完成程度 该产品提前完成5年计划的时间 实际在第四年
7、5月至第五年4月这十二个月就达到了823吨,则该产品计划提前完成时间为 5*12-(4*12+4)=8 个月,返回目录,2、结构相对指标,(1)定义(2)计算:例,下一页,例:2004年温州市三次产业比重如下:,2、结构相对指标(续),例:性别比全国2000年出生人口男女性别比119.92:100。,返回目录,3、比例相对指标,(1)定义(2)计算:例在 中某班男女生比例为3:1。,上例,返回目录,4、比较相对指标,(1)定义(2)计算:如:中国国土面积为960万平方公里,美国为937万平方公里,两者之比为,返回目录,再如(比较相对指标):2004年温州市农民人均纯收入为6202元,略高于浙江
8、省6096元的平均水平,为全国平均水平2936元的2.11倍。,选择题举例,(1)下列哪个指标属于比较相对指标()A、男性人口数与女性人口数比例 B、中国人口数与印度人口数比例C、合格品数与不合格品数比例 D、GDP与人口数的比例(2)甲地区2002年轻工业增加值为乙地区同时期轻工业增加值的56.8%,该指标为()A、强度相对指标 B、比例相对指标 C、比较相对指标 D、计划完成相对数,返回原处,5、强度相对指标,(1)定义 例 1998年末我国人口密度,例:2003年我国GDP11.67万亿元,消耗钢材3亿吨,每万元GDP消耗钢材:,(2)强度相对指标的表示方法:1)有名数;2)无名数(3)
9、强度相对数的正逆指标:一般情况下,和现象发展的密度成正比、指标数值越大越好的是正指标,和现象发展的密度成反比、指标数值越小越好的是逆指标。,返回目录,6、动态相对指标,(1)定义(2)举例:某地区2004年国内生产总值为2003年的108.8%,此指标为动态相对数。,(四)正确运用相对指标的原则,注意可比性总量指标和相对指标结合运用原则多种相对指标结合运用原则例:2004年温州市实际利用外资同比增长74.8%苏州市实际利用外资同比增长39.6%(相对指标)2004年温州市实际利用2.09亿美元,比上年增长0.894亿美元;2004年苏州市实际利用95亿美元,比上年增长26.95亿美元。(绝对指
10、标),小结:各种相对指标之间的关系,三、平均指标,(一)平均指标的概念、特点及分类(二)算术平均数(三)调和平均数(四)几何平均数(五)中位数(六)众数,返回本章首页,(一)平均指标的概念、特点及分类,1、概念:平均指标是指在一定条件下,同一总体各单位某一数量 标志值所达到的一般水平,它反映总体各单位数量标志值的集 中趋势。如平均收入、平均价格等。(集中趋势:指总体中各单位的次数分布从两边向中间集中的 趋势)。2、特点(1)抽象性:将数量差异抽象化。(2)同质性:只能就同类现象计算(同质总体内)。(3)代表性:作为各单位数量标志值的一般代表,反映 总体变量值的集中趋势。,3.分类,(二)算术平
11、均数,1、简单算术平均数:适用于总体资料未经分组整理、尚为原始资料的情况 例题 P73 2、加权算术平均数:适用于总体资料经过分组整理形成变量数列的情况,下一页,例题 P73-74,式中,f为分布在各组的次数或频数,也称为权数,x为各组标志值或组中值。单项数列直接用标志值,组距数列用各组的组中值代替各组标志值进行计算。变量数列的权数有两种形式,一种是以绝对数表示,即次数或频数(f);另一种是以比重表示,即频率(f/f)。加权算术平均数的大小不仅取决于各组标志值或组中值的大小,而且也取决于各组标志值对应的权数(频数或频率)的大小。,返回首页,可用计算器的存储功能和统计功能计算,下一页,变量值与其
12、算术平均数的离差之和恒等于零,即:变量值与其算术平均数的离差平方和为最小,即:,3、算术平均数的主要数学性质,下一页,离差的概念,-1,-1,-2,1,3,(三)调和平均数(倒数平均数),常作为加权算术平均数的变形公式使用。仍是总体的标志总量与总体单位总量的对比,仅仅是因为资料的不同,需要将算术平均数变形。它是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:,再求算术平均数:,求各标志值的倒数:,,再求倒数:,1.简单调和平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中:为调和平均数;为变量值 的个数;为第 个
13、变量值。,调和平均数的计算方法,2.加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,式中:为第 组的变量值;为第 组的标志总量。,调和平均数的计算方法,另,当己知各组变量值和标志总量时,作为算术平均数的变形使用。,因为:,调和平均数的应用,社会经济统计中使用的主要是权数为特定形式(m=xf)的加权调和平均数。加权调和平均数作为加权算术平均数的变形使用,仍然依据算术平均数的基本公式计算。,x、f 为已知,若只知 x 和xf,而f 未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。,苹果 单价 购买量 总金额 品种(元)(公斤)(元)红富士 2 3 6青香蕉 1.8
14、 5 9,计算该企业该日全部工人的平均日产量。,调和平均数的应用,即该企业该日全部工人的平均日产量为12.1375件。,调和平均数的应用,己知,采用基本平均数公式,己知,采用加权算术平均数公式,己知,采用加权调和平均数公式,小结:平均数或相对数的计算方法,练习:某乡甲、乙两个村的粮食生产情况如下:试分别计算甲、乙两个村的平均亩产。根据表列资料及计算结果,比较分析哪一个村的生产经营管理工作做得好,并简述作出这一结论的理由。,平均亩产=粮食总产量/播种面积甲:缺分母资料,用加权调和平均数,乙:缺分子资料,用加权算术平均数,,返回目录,是N项变量值连乘积的开N次方根。,用于计算现象的平均比率或平均速
15、度,应用:,(四)几何平均数,式中:为几何平均数;为变量值的个数;为第 个变量值。,几何平均数的计算方法,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,分析:,设最初投产100A个单位,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为(100A0.950.920.900.85)0.80;,因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水
16、线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,几何平均数的计算方法,因各车间彼此独立作业,所以有 第一车间的合格品为:1000.95;第二车间的合格品为:1000.92;第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1000.80,几何平均数的计算方法,分析:,不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为,
17、应采用加权算术平均数公式计算,即,式中:为几何平均数;为第 组的次数;为组数;为第 组的标志值或组中值。,几何平均数的计算方法,【例】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第2年末的本利和为:,第12年末的本利和为:,分析:,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。,解:,几何平均数的计算方法,分析,第1年末的应得利息为:,第2年末的应得利息为:,第12年末的应得利息为
18、:,则该笔本金12年应得的利息总和为:=V(0.034+0.052+0.151),这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为,假定本金为V,所以,应采用加权算术平均数公式计算平均年利息率,即:,解:,(比较:按复利计息时的平均年利率为6.85),是否为比率或速度,各个比率或速度的连乘积是否等于总比率或总速度,是否为其他比值,算术平均法,求解比值的平均数的方法,小结:数值平均数计算公式的选用顺序,指标,将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用 表示,中位数,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。,中位
19、数的作用:,中位数把标志值数列分为两个部分,一部分标志值小于或等于它,另一部分标志值大于或等于它.,(五)中位数,中位数的位次为:,即第3个单位的标志值就是中位数,中位数的确定(未分组资料),中位数的位次为,中位数应为第3和第4个单位标志值的算术平均数,即,中位数的确定(未分组资料),【例C】某企业某日工人的日产量资料如下:,计算该企业该日全部工人日产量的中位数。,中位数的位次:,中位数的确定(分组资料),(单值数列),中位数的确定(分组资料),(组距数列),【例D】某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,中位数的确定(分组资料),(组距数列),共 个单位,共 个单
20、位,共 个单位,共 个单位,L,U,中位数组,组距为d,共 个单位,假定该组内的单位呈均匀分布,中位数下限公式为,中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。,中位数的作用及用法,变量值34556910中位数 5平均值 6与中位数离差-2-1 0 0 1 4 5与平均数离差-3-2-1-1 0 3 4,返回目录,指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。,众数,(六)众数,众数(M0):出现次数最多即出现频率最高的变量值。,众数的确定方法(单项式数列),某年级83名女生身高资料,身
21、高 人数(CM)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4,身高 人数(CM)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计 83,身高 人数 比重(CM)(人)(%)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上 11 13.25 总计 83 100,某年级83名女生身高资料,众数的确定方法(组距式数列),概约众数:众数所
22、在组的组中值,在本例为162.5cm,已知某企业某日工人的日产量资料如下:,练习:众数的确定,(单值数列),计算该企业该日全部工人日产量的众数。,练习:众数的确定,(组距数列),某车间50名工人月产量的资料如下:,计算该车间工人月产量的众数。,众数的原理及应用,83名女生身高原始数据,83名女生身高组距数列,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数),众数的原理及应用,413名学生出生时间分布直方图,众数的原理及应用,(无众数),(双众数),当数据分布呈现
23、出双众数或多众数时,可以断定这些数据来源于不同的总体。,集中趋势弱、离散趋势强,集中趋势强、离散趋势弱,四、标志变异指标,返回本章首页,平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。但总体各单位之间的差异是客观存在的,这种差异也是统计总体的重要特征之一。因此,要全面反映一个总体的特征,还必须测定总体各单位之间差异程度。,第四节 标志变异指标,一、标志变异指标的概念二、标志变异指标的作用三、标志变异指标的种类 1、全距 2、平均差 3、标准差 4、变异系数指标 5、是非标志总体的指标四、偏度和峰度,返回本章首页,(一)标志变异指标的概念,是描
24、述总体各单位标志值之间差异程度大小的统计指标,又称标志变动度、离散程度或离中程度。例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,100,120(件)乙组:67,68,69,70,71,72,73(件)两组的平均日产量都是70件,但平均日产量70件的代表性乙组比甲组好。从下图可以看出甲组离散程度大,乙组离散程度小。变异指标越大,平均数代表性越小;变异指标越小,平均数代表性越大。,下一页,返回本节首页,70,70,返回目录,1、标志变异指标是评价平均指标代表性的尺度。标志变动度越大,标志值越分散,平均数的代表性越低。例 P852、标志变异指标反映社会经济活动过程的均衡性或
25、协调性,以及产品质量的稳定性。标志变异指标越小,说明现象发展过程越均衡;反之则相反。,返回目录,(二)标志变异指标的作用,(三)标志变异指标的种类,指所研究的数据中,最大值与最小值之差,又称极差。,1、全距,(三)标志变异指标的种类(续1),【例2】某季度某工业公司18个工业企业产值计划完成情况如下:,计算该公司该季度计划完成程度的全距。,(三)标志变异指标的种类(续2),优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差,往往应用于生产过程的质量控制中,全距的特点,(三)标志变异指标的种类(续3),返回目录,简单平均差适用于未分组资料,是
26、各个数据与其算术平均数的离差绝对值的算术平均数,用A.D 表示,2、平均差,计算公式:,(三)标志变异指标的种类(续4),【例1】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。,解:,即该售货小组5个人销售额的平均差为93.6元,(三)标志变异指标的种类(续5),加权平均差适用于分组资料,(三)标志变异指标的种类(续6),【例2】计算下表中某公司职工月工资的平均差,解:,即该公司职工月工资的平均差为138.95元,优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离
27、差的正负值问题,不便于作数学处理和参与统计分析运算。,平均差的特点,一般情况下都是通过计算另一种标志变异指标标准差,来反映总体内部各单位标志值的差异状况,返回目录,简单标准差适用于未分组资料,是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫做方差,用 来表示。,3、标准差,计算公式:,总体算术平均数,【例1】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。,解:,(比较:其销售额的平均差为93.6元),即该售货小组销售额的标准差为109.62元。,加权标准差适用于分组资料,(三)标志变异指标
28、的种类(续7),【例2】计算下表中某公司职工月工资的标准差。,解:,(比较:其工资的平均差为138.95元),即该公司职工月工资的标准差为167.9元。,由同一资料计算的标准差的结果一般要略大于平均差。证明:当a,b,c0时,有,标准差的特点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.,标准差的简捷计算,例3:,根据资料计算工人的平均日产量和标准差,工人平均日产量:,=74(件),工人日产量标准差:,=11(件),日产量(x)工人数(f)55 10 65 24 75 36 85 22
29、95 8 合计 100,550,1560,2700,1870,760,-19,-9,1,11,21,3610,1944,36,2662,3528,11780,30250,101400,202500,158950,72200,565300,7440,按简化式计算:,=11(件),返回目录,可比,4、变异系数指标,问题:能不能说兔子的平均体重的代表性高些?为什么?,身高的差异水平:cm,体重的差异水平:kg,可比,全距、平均差、方差和标准差有计量单位,是标志变异的绝对指标。而且指标的大小不仅取决于变量值的差异程度,还取决于变量值水平的高低。因而,对于具有不同水平的数列,不能直接用全距、方差和标准差
30、来比较平均数代表性的大小。只能用相对形式进行比较。,4、变异系数指标(续),各种变异指标的标准差与其算术平均数之比。一般用V表示。,【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。,解:,一班成绩的标准差系数为:,二班成绩的标准差系数为:,因为,所以一班平均成绩的代表性比二班大。,返回目录,5、是非标志总体的指标,为研究是非标志总体的数量特征,令,性别:男、女(非男)产品质量:合格、不合格,1 0,1 0,5、是非标志总体的指标(续1),具有某种标志表现的单位数所占的成数,不具有某种标志表现的单位数所占的成数
31、,指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。,成数,5、是非标志总体的指标(续2),平均数,标准差,方差,标准差系数,5、是非标志总体的指标(续3),【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。,5、是非标志总体的指标(续3),解:,返回目录,1、偏度,指分布数列的非对称程度和方向。,非对称的,偏斜的分布,对称的、高度适中的分布,既偏斜又低平的分布,(四)偏度和峰度,偏度(skewness):度量数据分布非对称程度及方向的指标。计算次数分布高峰的位置是否居中、偏左或偏右,使用偏度系数,简称偏度。
32、,动差法偏度的计算:,一阶中心矩为恒为零,偶数阶中心矩为正数,奇数阶中心矩可以反映分布偏度。,三阶中心矩有计量单位,不便于比较,故用具有相同单位的3相除,去掉单位,峰度(qurtosis):描述次数分布高峰的起伏状态的指标,也是度量数据分布集中程度的指标。,2、峰度,五、用Excel计算描述统计量,在本部分中,将展示如何用Excel来计算这些统计量。为了说明方便,假定已将50个数据输入到Excel工作表的A1:A50单元格中。下面给出用Excel计算这些数据描述统计量的具体步骤。,表1 分析用数据列表 117 122 124 129 139 107 117 130 122 125 108 13
33、1 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,第1步:选择“工具”下拉菜单。第2步:选择“数据分析”选项。,图1 选择“数据分析”功能,第3步:在分析工具中选择“描述统计”。第4步:当出现对话框时,在“输入区域”方框内键入A1:A50;在“输 出选项”中选择输出区域(在此选择“新工作表”);然后选择“汇总统计”(该选项给出全部描述统计量);最后 选择“确定”。,图2 参数设置,下面的附表是Excel输出的描述统计量计算结果。用红字显示的是本章中所介绍的描述统计量。,表2 结果列表及说明Excel2002 输出名称 Excel2002 输出结果 说明平均 122.98标准误差 1.135149006中值 123 中位数模式 122 众数标准偏差 8.026715596样本方差 64.42816327峰值-0.408713596偏斜度 9.94468E-05 偏度区域 32 极差最小值 107最大值 139求和 6149计数 50最大(1)139最小(1)107置信度(95.0%)2.281165949,返回本章目录,
链接地址:https://www.desk33.com/p-386386.html