欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > PPT文档下载  

    社会调查方法与统计.ppt

    • 资源ID:386391       资源大小:801.50KB        全文页数:44页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    社会调查方法与统计.ppt

    社会调查方法与统计,第九讲资料的统计分析,本讲内容安排,一、频数分布与频率分布二、集中趋势分析三、离散趋势分析,一、频数分布与频率分布,1.频数分布,频数分布(frequency distribution)是指一组数据中取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。频数分布表的作用一是简化资料,将调查所得到的一长串原始数据,以一个十分简洁的统计表反映出来。二是从频数分布表中,我们可以更清楚地了解调查数据的众多信息。,表 9-1 某班学生父亲职业的频数分布表,某班有20名学生,我们通过对他们的父亲的职业情况进行调查,得到下列结果:工人、工人、工人、工人、干部、干部、干部、干部、干部、干部、教师、教师、教师、商人、商人、商人、商人、商人、农民、农民。,2.频率分布,频率分布(percentages distribution)是一组数据中不同取值的频数相对于总数的比率分布情况,这种比率在社会调查中经常是以百分比的形式来表达。频率分布表与频数分布表频数表是不同类别在总体中的绝对数量分布,而频率分布表则是不同类别在总体中的相对数量分布(相对比重)。正是由于这一特点,频率分布表除具备频数分布表的优点外,还有一个十分重要的优点,这就是它十分方便地用于不同总体或不同类别之间的比较。因此,这种分布表的应用更为普遍。,表 9-2 某班学生父亲职业的频率分布表,某班有20名学生,我们通过对他们的父亲的职业情况进行调查,得到下列结果:工人、工人、工人、工人、干部、干部、干部、干部、干部、干部、教师、教师、教师、商人、商人、商人、商人、商人、农民、农民。,例题 1,某班有10名学生,其年龄如下:20岁、19岁、18岁、19岁、18岁、20岁、21岁、17岁、18岁、18岁。请做出关于该班学生的年龄分布的频数表和频率表。,表 9-3 某班学生年龄的频数分布,表 9-4 某班学生年龄的频率分布,二、集中趋势分析,集中趋势分析(Central Tendency Analysis)是指用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。常见的集中趋势分析平均数(均值)众数中位数,1.平均数,平均数(Mean)总体各单位数值之和除以总体单位数目所得之商。计算公式,例题 2,某班有10名学生,其年龄如下:20岁、21岁、19岁、19岁、20岁、20岁、21岁、22岁、18岁、20岁,求他们的平均年龄。,(1)单值分组数据的均值,如果是单值分组资料,那么,计算平均数时首先要将每一个变量值乘以所对应的频数f,得出各组的数值之和,然后将各组的数值之和全部相加,最后除以单位总数(即各组频数之和)。,例题 3,调查某年级150名学生的年龄,得到表 9-5 所示的结果,求平均年龄。,表 9-5 某年级学生的年龄分布,(2)组距分组数据的均值,组中值组中值=(组上限+组下限)2当组中值为小数时,通常采取四舍五入的办法将其化为整数后再计算。,例题 4,调查某大学100名学生勤工助学的收入,得到表9-6所示的资料,计算他们的平均收入。表 9-6 某大学100名学生勤工助学收入的分布,2.众数,众数(Mode)众数是一组数据中出现次数最多(即频数最高)的那个数值。众数的确定在单值分组资料中,最大频数对应的数值即众数。(在表9-3中,众数为18岁。)在组距分组资料中,最大频数对应的分组的组中值即众数。(在表9-6中,众数为350元。),3.中位数(Median),中位数(Median)的定义把一组数据按值的大小顺序排列起来,处于中央位置的那个数值就叫中位数。中位数的适用范围中位数所描述的是定序变量以上层次的变量。中位数的含义整个数据中,有一半数据的值在它之上(比它大),另一半数据的值在它之下(比它小)。中位数的位置(n+1)2n为数据个数,例题 5,调查5个学院的学生人数,按规模由小到大以此为200人、300人、500人、800人、1000人,求中位数。解:其中间位置为(5+1)2=3,即第三个学院所对应的数值500为中位数。,当数据为偶数个时,中位数的位置处于中间两个数值之间,而没有直接对应的数值。此时一般以中间这两个数值的平均数作为中位数。,例题 6,调查6个学院的学生人数,按规模由小到大以此为200人、300人、500人、800人、1000人、1200人,求中位数。解:中间位置为(6+1)2=3.5,即中间位置处在第三个和第四个学院之间,中位数所对应的数值为(500+800)2=650 人。,单值分组数据的中位数,当资料为单值分组数据时,也是先求出数据组的中间位置,然后再找出其对应值。以例题3 表9-5数据为例,例题 3,调查某年级150名学生的年龄,得到表 9-5 所示的结果,求平均年龄。,表 9-5 某年级学生的年龄分布,先由公式计算中间位置:(n+1)2=(150+1)2=75.5即中间位置落在第75个与第76个数值之间。为了找到这个数值,需要先列出累计频数。累计频数的计算既可以从上到下,也可以从下到上(见表9-7中的第三、第四两栏)。,表 9-7 例题3的累计频数,列出累计频数后,我们从上往下找(或者从下往上找),看看中间位置最先落在哪一累计频数内。在本例中,无论按哪种方式寻找,中间位置75.5总是最先落入人数为50的那一行。这一行对应的19岁即所求中位数。,4.平均数与中位数的比较,(1)平均数对数据总体的描述和反映,在一般情况下比中位数更加全面和准确。计算平均数时要求用到数据中所有的数值,而求中位数时只用到数值的相对位置,因而平均数比中位数利用了更多的有关数据的信息。(2)平均数非常容易受到极端值的变化的影响,而中位数则不会受到这种影响。当样本中数据值的分布是高度偏斜的,即在一个方向上有较多的极端个案,中位数一般总是比平均数更适合一些。,(3)对于抽样调查来说,平均数是一种比中位数更为稳定的量度,它随样本的变化比较小。即对于从同一总体中、采用同一方式抽出的、同样规模的不同样本来说,它们的平均数相互之间的差别,往往比它们的中位数相互之间的差别要小一些。(4)与中位数相比,平均数比较容易进行算术运算。这是因为,平均数所要求的是定距层次以上的变量,而中位数所要求的是定序层次以上的变量。,三、离散趋势分析,例题 7,某校3个系各选5名同学参加知识竞赛,他们的成绩分别为:中文系:78、79、80、81、82 平均数=80数学系:65、72、80、88、95 平均数=80英语系:35、78、89、98、100 平均数=80,离散趋势分析(Dispersion Tendency Analysis),离散趋势分析是指用一个特别的数值来反映一组数据相互之间的离散程度。它与集中趋势分析一起,分别从两个不同的侧面描述和揭示一组数据的分布情况,共同反映出资料分布的全面特征。常见的离散量数统计量有全距、标准差、异众比率、四分位差等。其中,标准差、异众比率、四分位差分别与平均数、众数、中位数相对应,判定和说明后三者代表性的大小。,1.全距(Range),定义全距又叫极差,它是一组数据中最大值与最小值之差。意义一组数据的全距越大,在一定程度上说明这组数据的离散量数越大,而集中量数统计量的代表性越低。以例题7为例,3个代表队成绩的全距分别为:中文系:8278=4(分)数学系:9565=30(分)英语系:10035=65(分),2.标准差(Standard Deviation),定义一组数据对其平均数的偏差平方的算术平均数的平方根。计算公式例题7中,S(中文系)=1.414(分)S(数学系)=10.8(分)S(英语系)=23.8(分),单值分组数据的标准差,例 6 调查200户家庭的规模,得到如 表 9-9所示资料,求其标准差。,表 9-9 200户家庭资料,3.异众比率(Variation Ratio),定义异众比率是指一组数据中非众数的次数相对于总体全部单位的比率。意义是指众数所不能代表的其他数值(即非众数的数值)在总体中的比重。因此,当异众比率越大,即众数所不能代表的其他数值在总体中的比重越大时,众数在总体中所占的比重自然就越小,这样,众数的代表性就越小。,异众比率的计算以表 9-5 的数据为例,表 9-5 某年级学生的年龄分布,4.四分位差(Inter-quartile Range),定义四分位差是先将一组数据按大小排列成序,然后将其四等分,去掉序列中最高的1/4和最低的1/4后,中间的一半数值之间的全距。四分位差的符号用Q表示。,例题 8,调查11位同学的年龄如下:17岁、18岁、18岁、19岁、19岁、19岁、20岁、20岁、21岁、21岁、22岁、22岁,求其四分位差。,5.离散系数(Coefficient of Variation),定义离散系数也称变差系数,它是标准差与平均差的比值。离散系数用百分比表示,记为CV。,例题 9,一项调查得到下列结果,某市人均月收入为920元,标准差为170元,人均住房面积7.5平方米,标准差1.8平方米。请比较该市人均收入和人均住房情况哪一个差异程度比较大。,例题 10,对广州和武汉两地居民生活质量调查发现,广州居民平均收入为6800元,标准差为1200元;武汉居民平均收入为3600元,标准差为800元。请问广州居民相互之间在收入上的差异程度,与武汉居民相互之间在收入上的差异程度哪一个更大一些?,THE END,

    注意事项

    本文(社会调查方法与统计.ppt)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开