欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    《统计学原理》教学案.docx

    • 资源ID:1699491       资源大小:117.70KB        全文页数:37页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《统计学原理》教学案.docx

    统计学原理教案第一章总论一、社会经济统计的研究对象1、统计的涵义统计一词在不同的场合可以有不同的涵义。统计有时指统计工作,即统计实践活动,是对社会经济现象的数量方面进展搜集、整理和分析的全过程:统计有时指统计资料,即通过统计工作过程所取得各项数据资料和与之相关的其他实际资料;统计有时指统计科学,即关认识客观现象数注特征和数珏关系的原理原则和方式方法的科学。统计的三种涵义是密切联系的。统计工作和统计资料是统计活动和统计成果的关系,统计学和统计工作是理论和实践的关系。2、社会经济统计学的研究对象社会经济统计学的研究对缭是社会经济现象总体的数量特征和数量关系,通过这些数量方面的研究反映社会经济现象开展变化的规律性。统计学和统计工作是理论和实践的关系,它们所要认识的研究对象是一致的.3.社会经济统计学研究对象的特点可概括为:社会性;总体性:变异性。二、统计工作过程及统计研究方法K统计工作过程统计工作过程所包括的环节有统计设计、统计调查、统计整理、统计分析、统计资料的提供与开发。2,统计研亢方法统计研究方法有大量:观察法、统计分组法、综合指标法、统计模型法、归纳推断法。三、国家统计的职能国家统计兼有信息职能、咨询职能、监视职能等:种职能.四、统计学的几个根本概念及相互关系1、统计总体与总体单位统计总体是根据统计研究的任务目的所确定的研究事物的全体,是客观存在的具有共同性质的个体所构成的整体。构成统计总体的个体单位称总体单位。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系。但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相比转化。统计总体同时具有大量性、同质性、变异性等特点。大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的根本要求:同脑性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件:变异性就是指总体中各总位至少有一个或一个以上变异标志,即至少有个不同标志表现的标志,作为所要研究问题的对象.变异性是统计研究的重点。2、标志与标志表现标志是说明总体单位所共同具有的属性和特征的名称。标志有品质标志和数量标志之分。品质标志说明总体单位:的属性特征,无法量化,如职工的性别、文化程度,企业的经济成份,产品品牌等。数珏标志说明总体单位的数址特征,能够量化,如职工的工龄、工资水平,企业的职工数、总产值、总产量、劳动生产率等。总体单位与统计标志是有区别的。总体单位是统计标志的直接承担者,是载体:统计标志依附于总体单位并说明总体附位的属性和特征。依附于某个总体单位的标志可以有多个1标志表现即标志特征在各单位的具体表现。如果说标志是统计所要调查的工程,那么标志表现是调查所得结果,标志的实际表达“标志表现仃品质标志表现和数量标志表现之分。品质标志表现只能用文字表述,因此不能转化为统计指标,但对其对应的单位进展总计时就形成统计指标.数量标志表现是一具体数值,也称标志值。就一个品质标志或数量标志而言,其具体表现可能多种多样,不能将标志与标志表现混为一谈。如对三个工人的月工资计算平均数,只能说是对三个标志表现或三个标志值(变量值)计算平均数,不能说对三个数量标志计算平均数,因为数量标志只有一个,即工人“月工资”。3、变异与变殳如果某一标志的具体表现在总体各单位一样,则称该标志为不变标志:如果某一标志的具体表现在各单位不尽一样,则称该标志为可变标志。可变标志的标志表现由种状态变到另种状态,统计上把这种现象或过程称变异。变异是一种普遍现象,有变异才有必要进展统计。变异有属性变异和数址变异之分.属性变异说明质的差异,数量变异说明量的差异。不变的数量标志称常量或参数。可变的数量标志和所有的统计指标称变量.变量的数值表现称变量值,即标志值或指标值“变量按其数值是否连续可分为连续性变量和离散性变量.连续性变量的数值是连续不断的,任意两个变量值之间可以做无数种分割,如工业总产值、商品俯传额、身高、体重等,既可用小数表示,也可用照数表示:离散变量的取值可日按定次序一列举,如工厂数、工人数、机器台数等,变量:值通常用整数表7Ja4、统计指标和指标体系统计指标是反映社会经济现象息体综合数量特征的科学概念或范畴。正确理解统计指标时应注意:统计指标反映现彖总体的数量特征:一个完整的统计指标应该由总体范困、时间、地点、指标数值和数值单位等内容构成。统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者的主要区别是:指标是说明总体特征的,标志是说明总体单位特征的:指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不定。数量标志具有可量性,品质标志不具有可量性。标志和指标的主要联系表现在:指标值往往由数量标志值汇总而来;在一定条件下,数量标志和指标存在着变换关系.统计指标按其反映的数任特点不同可分为数量指标和质量指标。数量指标是反映现象总规模水平或工作总量的指标,也称总量指标,般通过数量标志值直接汇总而来,用绝对数表示,指标数值均有单位:质量指标是反映现象总体相对水平或工作质量的统计指标,又分为相对指标和平均指标,分别用相对数和平均数表示,它们通常是由两个总量指标比照派生出来的,反映现缴之间内在联系和比照关系。数垃指标和质量指标的关系表现在:数量指标是计算质量指标的根基,质量指标往往是相应的数量指标进展比照的结果。统计指标体系是各种互相联系的指标群构成的整体,用以说明所研究的社会经济现象各方面互相依从和互相制约的关系。一个指标的作用总是有限的,它只能反映现象总体的某(而,只有使用指标体系才能反映现象总体全貌。统计指标体系大体上可分为根本统计指标体系和专题统计指标体系两大类。第二章统计调查一、统计调杳的根本任务和要求【、统计调查统计调查是按照预定的统计任务,运用科学的方法,有组织有方案地向客观实际搜集资料的过程。统计调查既是对现象总体认识的开场,也是进展资料整理和分析的根基环节.2、统计调查的根本任务统计谢查既是对现象总体认识的开场,也是进展资料整理和分析的根基环节。统计调查的根本任务是取得反映社会经济现象总体全部或局部单位以数字资料为主体的信息。3、统计调查的根本要求统计调查的根本要求是准确性和及时性,是衡星统计工作侦量的重要标志O二、统计调查方案统计调查方案是调查工作有方案、有组织、为系统进展的保证。统计调查方案应确定的内容有:调查目的,调查时象、调查工程、调查表、调查时间和调查时限、调杳的组织工作。1、调查目的施定调查目的是任何一项统计调查方案首先要解决的问题。不同的调查目的需要不同的调查资料,不同的调查资料又有不同的搜集方法.,调查目的明确r,搜集资料的范围和方法也就确定卜.来了。2,调杳对象调查对象即统计总体,是根据调查目的所确定的研究事物的全体统计总体这一概念在统计调查阶段称调查对象。在确定调杳对缭时,还必须确定调隹单位和报告单位。调杳单位也就是总体单位,它是谢查对象的组成要素,即调查对象所包含的具体单位。调查对软和调查单位的概念不是固定不变的,随着调查目的的不同二者可以互相变换。报告单位也称填报单位,也是调直对彖的组成要素。它是提交调查资料的单位,般是基层企事业组织。调查单位是调查资料的直接承担者,报告单位是调查资料的提交者.二者有时一致,有时不一致,如工业企业生产经营情况调查,每一工业企业既是调查单位,又是报告单位:工业企业职工收入状况调杳,每一职工是调查单位,每一工业企业是报告单位。3,调杳工程调查工程即依附了调查单位(总体单位)的统计标志,其标志表现就是统计调查所得的资料。确定调杳工程时,首先应注意所选择的工程能够取得确切资料,其次注意所选择的工程应有确切的涵义和统一解糅,另外要注意各工程之间的联系和衔接,便于核对和分析。4、调查表调杳表是用来表现调杳工程的表格,其目的是保证统计资料的标准化和标准化。调查表有单一表和一览表两种形式。单一表是一个谢杳单位填写一份表格,可以容纳较多的工程。览表是许多调查单位共同填写份表格,在调查工程不多时较为简便,且便于合计和核对过失。为了正确填写调查表,须附有填表说明和工程解释。5、调查时间和时限调查时间指调查资料所属时间。如果调查的是时期现象,调查时间是资料所反映的起讫时间:如果调查的是时点现©,调查时间是统一规定的标准时点.调杳时限是进展调杳工作的期限,包括搜集资料和报送资料的整个工作所需要的时问。如某管理局要求所属企业在1996年1月底上报95年工业总产值资料,则调查时间是年,调查时限是个月:乂如某管理局要求所属企业在96年1月K)日上报95年产成品库存资料,则调查时间是标准时间1995年12月31日,调查期限是10天。6、调杳的组织工作调查的组织工作包括明确调杳机构、调杳地点、选择调食的组织形式等问题。三、统计调查的种类1、统计调查按组织形式,可分为统计报表和专门调查。统计报表是国家统计系统和专业部门为了定期取得系统、全面的统计资料而采用的一种搜集资料的方式,目的在乎掌握经常变动的、对国民经济有重大意义的指标的统计资料。专门调杳是为了了解和研究某种情况或问题而专门组织的统计调查,包括抽样调查、普查、重点调查和典型调查等几种调查方法。2、统计调杳按研究总体的范用,可分为全面调杳和非全面调杳。全面倜查是对构成调查对象的所有单位进展逐一的、无一遗漏的调查,包括全面统计报表和普杳;非全面调杳是对调查对象中的一局部单位进展调佟,包括非全面统计报表、抽样谢查、重点调查和典型调查。3、统计调查按调查登记的时间是否连续,分为连续调查和非连续调查。连续调隹是指对研究对象的变化进展连续不断的登记,如工业企业总产值、产品产量、原材料消耗量等,在观察期内连续登记。连续调查所得资料是现象在段时间内的总显。不连续调查是指间隔段相当长的时间对研究对象某时刻的资料进展登记。如人口数、机器设备台数等资料短期内变化不大,没有必耍连续登记资料。不连续调查所得资料表达现象在某一瞬间所具有的水平。4、统计调查按搜集资料的方.法分为直接调杳、凭证调杳、派员调隹、问卷调包。直接调查又称直接观察,由调查人m到现场对调查单位直接查看、测量和计量;凭证调隹是以各种原始和核算凭证为调杳资料来源,依照统一的表格形式和要求,按照隶属关系,逐级向有关部门提供资料的方法:采访调查是通过指派谢查员对被调查者询问、来访,提出所要了解的问题,借以搜集资料:问卷调查是以问卷形式提问。此外,也有人根据调查工作时间的周期长短,将统计调查划分为经常性调查和一次性调查。所谓经常性调查是指调查周期在年以内的调查,间隔超过年的为次性调查.这种划分和调查对以没有关系,不要把经常性调查误以为是全面调查,也不要误以为经常性谢杳就是调查时期现象,而一次性调查就是调杳时点现象。四、统计调查方法常用的统计调查方法有统计报表、普查、抽样调查、重点调查、典型调查等,它们各有其特点。1991年全国统计工作会议提出要隹设以必要的周期性普杳为根基,经常性的抽样调杳为主体,同时辅之以选点调杳、科学推算和少量的全面报表综合运用的统计调查方法体系。I、统计报表统计报表是按国家统一规定的表式,统一的指标工程,统一的报送时间,自卜.而上逐级定期提供根本统计资料的调查方式方法。我国大多数统计报表要求调查对象全部单位填报,属于全而调查范畴,所以乂称全面统计报表。统计报表具有统一性、全面性、周期性、可辨性等特点。目前我国统计报表,是由国家统计报表、业务部门统计报表和地方统计报表组成,其中国家统计报表是统计报表体系的根本局部。2、普杳普杳是专门组织的不连续性全面调杳。主要调在一定时点状况的社会经济现彖的总量,搜集那些不能够或者不适宜用定期全面报友搜集的统计资料,以搞清重要的国情国力。普查的主要特点是不连续调查。普查的组织形式有两种:一是组织专门的普查机构,配符一定数量的普查人员,对调查单位直接进展登记:另种是利用普查单位的原始记录和核算资料,颁发一定的调查表格由调查单位自填上报.普查按资料汇总的特点分为般普查和快速普查。前者逐级上报资料,后者越过中间环节,由战层单位招资料直接报送给最高领导机关。普查和全面统计报表都属r-全面调查,但二者并不能互相代替.普查属r不连续调杳,调杳内容主要是反映国情国力方面的根本统计资料:而全面统汁报表属于连续调查,调查内容主要是需要经常掌握的各种统计资料。全面统计报我要经常填报,因此报表内容固定,调查工程较少:而普套是本门组织的诙性调性,在调查时可以包括更多的单位、分组更细、工程更多.因此,有些社会经济现象不可能也不需要进展经常调杳,但又需要掌握比照全面、详细的资料时,就可通过普查来解决。普查花费的人力、物力和时间较多,不宜经常组织,取得经常性的统计资料还需要独全面统计报表。3、抽样调查抽样调查是按随机原则从总体中选取一局部单位进展观察,用以推算总体数量的种非全面调查。抽样调查的特点:既是非全面调查,又要到达对总体数量特征的认识:按随机原则去抽取调查单位。抽样调隹具有经济性、时效性、准确性、灵活性等特点。抽样调查的作用:一是能够解决全面调查无法或难以解决的问题:二是可以卡卜充和订正全面调隹的结果,三是可用于生产过程中产品质量的检修和控制,四是可用于对总体的某种假设进展检验。抽样调查是非全面谢查中城完善、最有科学根据的方式方法。抽样调查的根本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。4、重点调查IR点调杳是专门组织的一种非全面调杳,它是对所要调查的全部单位选择一部份重点单位进展谢查。IR点调杳的关键是选择好重点单位。所谓盘点单位,是从标志量的方面而言的,尽管这些堆位在全部单位中只是一局部,但这些单位的某一主要标志量占总体单位标志总量的绝大比重。对这些单位进展调查,就可以了解调查对象的根本情况。重点调查中重点单位的选择着眼于标志证的比重,因而重点单位的选择具有客观性。当调隹目的是掌握现象的根本情况,而同部单位又能比照集中地反映所研究的工程和指标时,可用重点调查。重点调查可以定期进展,也可以不定期进展,重点调查实际上是范用比照小的全面调查,它的目的是反映现象总体的根本情况.抽样调查和重点调查都是专门组织的非全面调查,具有调查单位少,省时省力的特点,在选取调查单位时不受主观因素的影响,但二者之间有明显的区别:首先是调位单位的意义和取得方式不同,全点调吉是选择为数不多但标志量占总体标志总量绝大比重的单位进展调查:抽样调查中的样本雎位是按照随机原则从研究总体中抽取的、具有较高代表性。其次,二者研究目的不同。重点调查是为r/解现以总体的根本情况,但不能推断总体总技:抽样调查的目的在于以样本量来推断总体总量。再次,适用场合不同。盘点调杳适用于局部单位能比照集中地反映所研究的工程或指标的场合:抽样调查最适合于不能或很难进展全面调s.而乂需要全面数值的场合,在能进展全面调查的场合也有独到的作用。5、典型调查典型调查是根据调查的任务目的,对所研究的现象总体进展初步分析的根基上,有意识的选择假设干具有代表性的单位进展调查,借以认识事物开展变化的规律。典型调查的特点是深入细致的调查,既可以搜集数字资料,乂可以搜集不能用数字反映的实际情况:二是调查单位是有意识的选择出来的假设干有代表性的单位,它更多地取决于调隹者的主观判断和决策。典型调查和重点调查相比,前者调查单位的选择取决于调查者的主观判断,后者调直单位的选择具有客观性:前者在一定条件下可以用典型单位的量推断总体总忌,后打不具备用重点单位的量推断总体总量的条件。典型谢查在做总体数量上的推断时无法估计误差,推断结果只是一个近似值。抽样调查和重点调查、典型调查的根本区别就在于选取调杳单位的方法不同。五、各种调查方式的结合运用不同的统计谢查的方式方法,各有其特点和作用。在实际工作中,并非单用一种方式方法,而是多种方式方法的结合运用。这是因为:国民经济和社会开展情况复杂,国民经济门类众多,必须应用多种多样的统计调查方法,才能搜集到丰宫的统计资料:任何一种统计调隹方法,都有它的优越性与局限性,各有不同的实施条件,只用i种统计调直方怯,不能满足多种需要。第三章统计整理一、统计整理的概念和内容1,统计整理根据统计研究的任务与要求,对统计调查所搜集到的原始资料进展分组、汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。统计整理是统计调查的继续,是统计分析的前提和根基,在推个统计工作中发挥着承上启下的作用。2、统计整理的遨义通过统计调杳所取得的总体各单位的资料是零星的,分散的,只能说明总体单位的情况,而不能反映总体特征。统计整理对调查资料进展科学加工,使之系统化,成为说明总体特征的综合资料,实现了由反映总体单位特征的标志向反映总体综合数属特征的统计指标的转化,是从对社会经济现象个体量的观察到对社会经济现象总体量的认识的连接点,是人们对社会经济现象从感性认识到理性认识的过渡阶段。统计整理在整个统计工作中发挥着承上启下的作用。3、统计整理的方法统计整理的方法是分组、汇总和编表。分组是根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。统计分组是统计整理的关键。汇总是在统计分组的根战上,把总体单位各种标志的标志值汇总起来,汇总主要有手工汇总和电子计算机汇总。编表是把汇息的资料按一定的规则在表格上表现出来。4、统计整理的内容和步骤(1)确定应整理的指标和确定应分的组:(2)对各项指标进展汇总,确定各组和总体的单位数和标志总量:(3)用统计表现分组、汇总的结果。二、统计分组1、统计分组的遨义根据统计研究任务的要求和研究现象总体的内在特点,把现缴总体按某一标志划分为假设下性质不同但又有联系的几个局部称统计分组。总体的变异性是统计分组的客观依据。统计分组是总体内进展的一种定性分类,它把总体划分为个个性质不同的范国更小的总体。2、统计分组的种类统计分组按其任务和作用不同,分为类型分组、构造分组和分析分组。类型分组的目的是划分经济类型,构造分类的目的是研究同质总体的构成,分析分组的目的是研窕现型总体内部诸标志间的依从和制约关系.统计分组按分组标志的多少分为简单分组和发合分组。简单分组是将总体按一个标志进展分组,史合分组是将总体按两个或两个以上的标志重叠起来进展分组。统计分组按分组标志的性质分为品质分组和变量分组“品质分组是将总体按品质标志进展分组,如企业按经济成份、地理位置分组,职工按性别、文化程度分组等:变量分组是将总体按数量标志进展分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。3、分组体系与分组标志的选择分组体系统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和史合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进展次次简单分组后所形成的体系:纪合分组体系就是史合分组后形成的体系.分组标志的选择分组标志的选择是统计分组的关键。分组标志,即将同版总体区分为不同组的标准或依据“分组标志一旦选定,就必然突出总体在该标志下的性质差异,其他的差异看不见了。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。正确选择分组标志,必须根据统计研究的任务目的,抓住反映现缴本质区别和内在联系的标志作为分组标志。4、统计分组的方法(1)品质标志分组方法品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些豆杂的品质标志分组可根据统一规定的划分标准和分类目录进展。(2)数量标质分组方法按数域标志分组的目的并不是单纯确定各组在数量上的差异,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以卜.几个方面来说明:单项式分组和组距式分组对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变/值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组.也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可聘相邻组的组限重叠。连续变量由不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重咎。如以总产值、商品转售额、劳动生产率、工资等为标志进展分组,就只能是相邻组限重叠(内组距式分组。在相邻组组限盘段的组距式分组中,假设某单位的标志值正好等于相邻两组的上卜.限的数值时,一般把此值归并到作为卜限的那一组(适用于连续变量和离散变量)。组距式分组使资料的真实性受到定程度的损害。组距式分组的假定条件是:变珏在各组内的分布都是均匀的(即各组标志值呈线性变化).通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样,各组分配的规律性可以更容易显示出来.根据这个道理,如组距太小,分组过细,容易将.喝于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同组中,失去区分事物的界限,达不到正确反映客观事实的目的。因此,组距的大小、组数确实定应根据研究时您的经济内容和标志值的分散程度等因素,不可强求一致。等距分组和不等距分组等距分组是各组保持相等的组距,也就是说各组标志值的变动都限一样的范围。不等距分组即各组组距不相等的分组。统计分组时采用等距分组还是不等距分组,取决于研窕对象的性质特点.在标志值变动比照均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比照,也便于计算各项综合指标。在标志值变动很不均匀的情况卜.宜采用不等距分组。不等距分组有时更能说明现象的本质特征。组限和组中值组距两端的数值称组限。其中,怖组的起点数值称为卜.限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范用。各组标志值的平均数,各组标志数的平均数在统计分组后很难计篮:出来,就常以组中值近似代替。组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件一样)。一般情况下,组中值=(上限+下限)÷2对第一组是"多少以下",最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开门组组中值=上限-1/2邻组组距,缺上限开口组组中值=卜.限+1/2邻组组距。三、统计分布(分配数列)1、分配数列的概念、构成要素在统计分组的根基上,列出各组对应的单位数,形成总体单位数在各个组的分布,称统计分布,又称分配数列或次数分布。分配数列包括两个要素:总体按某标志所分的组和各组对应的单位数(频数)2、分配数列的类型分配数列包括品旗分配数列和变量分配数列,分别由品质标志分组和数量:标志分组形成。变量数列乂有单项式数列和组距式数列,分别由单项式分组和组距式分组形成.3、频数和频率统计分组后各组对应的单位数称频数,也叫次数:件组单位数占总体单位总数的比重称频率。各组的频率大丁O,所有组的频率总和等ri.在变量分配数列中,频数(频率)说明对应组标志值的作用程度。领数(频率)数值越大说明该组标志值对总体水平所起的作用也越大,反之,频数(频率)数值越小,说明该组标忐值对于总体水平所起的作用越小。组即数列中,影响各组次数分布的要索是组数、组距、组限和组中值有时为r更简便地概括总体各单位的分布特征,还需要编制累计频数数列和素计频率数列。累计有向上累计和向下累计的方法。向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,说明在这些数值以下所有数值所占的比重:向下累计是指将各组缴数和频率由变量值高的组向变量值低的组累计,说明在这些数值以上所有数值所占的比玳。分布数列)组别各组单位数比重1%频数或次数)(频率)品质数列一按品质标志分组形成的分配数列变量数列一按数量标志分组形成的分配数列变量数列的编制步骤(1) 将原始资料顺序排序,确定变量:值的变动范用:(2) 确定组数、组距、组限:(3) 汇总,计算各组单位数,各组单位数所占比Oi,以及各组的累计频数和累计频率等:(4) 编制统计表例如:某班级40名学生学习成绩分组资料按成绩分组学生人数比重(%)60以137.560-70615.070-801537.580-901230.09(1.1.oO410.0合计40I(X)例如:某车间40名工人完成生产方案百分数资料:90,65,100,102,100,104,112,120.124,98,11().11().12().120.114.I(X),109,119,123.107.110,99.132.135.107,107,109,102,102,101,110,109,107,103,103,102.102.102,104,104按完成方案百分数分组1%工人数比重(%)90以下I2.590-10037.5100-I1.O2255.0110-120717.5120-130512.5130-14025.0合计40100按完成方案百分数分组向上累计工人数向上累计比重(%)9()以下12.590-100410I(X)-I1.O2665110-1203382.5120-1303895130-1404()I(X)合计进展向下累计。按完成方案百分数分纯向下累计工人数向下累计比重(%)90以卜.4010090-1003997.5100-I1.O3690110-1201435120-130717.5130-14025合计4、次数分布特征现象总体的性质不同,其次数分布也不同。归纳起来主要有四种类型:钟型分布特征是“两头大,中间小",即靠近中间的变量值分布的次数多,靠;近两边的变量分布次数少,形假设古钟。U型分布其特征与钟型分布正相反,靠近中间的变收值分布的次数少,狂近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。如人口死亡现象按年龄分布便是如此.J型分布在社会经济现彖中,些统计总体分布曲线呈J型。洛伦兹分布洛伦兹曲线专门用以检定社会收入分配的平等程度。洛伦兹曲线拓展可运用于其他社会经济现象,研究总体各单位标志分布集中状况或平均性。洛伦兹曲线又称集中曲线,具运作的条件是:现象总体各组频率与相应的各组标忐总量的比J1.1.5、变量分出数列编制的步骤(3,3,5)将原始资料按其数值大小重新排列只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。确定全距全距是变量值中最大值和最小值的差数。确定全距,主要是确定变星:值的变动范围和变动幅度“如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。确定组距和组数前面已经介绍过组距数列有等距和不等距之分,应视研究对象的特点和研究目的而定。组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好是5或IO的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注遨组距的同质性,尤其是对带有根本性的侦量界限,绝不能混淆,否则就失去分组的意义。在等距分组条件下,存在以下关系:组数=全距/组距确定组限组限要根据变量的性质来确定。如果变增值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有卜.限和上限:反之,如果变再次,要有一个可承受的置信度。估计置信度又称估计推断的概率保证程度,这是估计的可靠性问题。由于抽样是随机抽样,统计量是随机变量,估计值所确定的估计区间也是随机的,在实际抽样中并不能保证被仙计的参数真值都落在允许误差的范围内这就产生要冒多大风险想念所作的估计。如果一种估计可信度很低,这就意味着所冒的风险很大,这咱估i也就没有什么价值。例如我们网意冒ISi的风险,这表示如果进展屡次重狂估计,则平均每100次估计将有10次是错误,90次估计正确。90%就称为置信度或称概率保证程度。在抽样估计中要求到达100%的置信度是难以做到的,但置信度小心估计结论的可靠性太低,又会影响估计本身的价值,所以在做估计的时候,也应该根据所研究问题的性质和工作的需要确定一个可承受的估计置信度。当然估计置信度的要求和准的度的要求应该结合起来考虑,估计的准确度很高而置信度很低或准确度很低而置信度很二、优良估计量的标准根据样本资料对未知的总体参数进展推断的方法叫参数估计。参数估计分为点估计(PointEstimation)和区间估计(InterVa1.EStimation).,点估计是用样本统计量的值直接作为总体参数的估计值,如用样本平均数代表总体平均数,用样本成数直接代表总体成数。区间估计是根据样本统计量的值结合抽样分布理论,以一定的概率保证程度对未知总体参数给出一个估计范围。由于点估计不是正确的就是错误的,所以只有点估计是不够的,实际工作中常常使用的是区间估计。不管是点估计还是区间估计,都有个估计量的选择问题。估计量就是用来估计总体参数的统计量.对同一总体参数,往往可以选择假设干个不同的样本统计地作为估计量,如估计总体兑术平均数,可以选择样本算术平均数、样本中位数等。这样,就有必要对各种估计量进展比照,从中确定最优的估计量。通常优良估计fi:的标准有:无偏性、有效性和一致性.1.无偏性(Unbiasedness)我们是选择某一个样本统计量来估计未知总体参数的,而样本统计量是一个随机变量.从总体中抽出所有可能的k个样本,就可以得到k个样本统计量的值。这些样本统计狂的值构成一个频数分布,如果该样本统计量的频数分布的期里值等于该统计量所要估计的总体参数,则这个样本统计量就是被估计总体参数的一个无偏估计量。例如,样本算术平均数就是总体算术平均数的无偏估计量,因为所有样本平均数的期望值等于总体平均数,即E(?)-X。而祥木方差$:/'就不是总体方差。2的无偏估计量,因为以样本单位数n作分母计匏的所有样本方差的期望值不等于总体期望值,即Et)wc;总体方差。2的无偏估计量是3. 一致性(Consistency)随着样本容量n的增大,假设某一样本统计量愈来愈接近了被估计的总体参数,则该估计M就是一个一致估计量,即随若样本容量的无限增加,样本统计量与被估计的总体参数之差的绝对值小于任意数的可能性趋于必然。例如,用样本算术平均数来估计总体算术平均数,就满足Iim布-冈YJ=I(6.9)所以样本平均数是总体算术平均数的致估计量,其中C为任意小的数。致性的含义是从极限的角度来说的,这条标准只有在样本容里较大时才能起作用,因此优良估计量的选择还应考虑无偏性和有效性两个标准,特别是在小样本情况下,一致性不适合作为评价估计量好坏的标准。在选择总体参数的估计用时,必须同时到达上述三个标准.可以证明,样本均值,、样本方差和s样本成数P分别是总体均值亍、总体方差。2和总体成数P的优良估计量。三、区间估计一般原理抽样分布中的正态分布再生定理和中心极限定理都说明,只要样本容量n足够大(n>30,但再生定理没有对样本容员n的要求),样本平均数的抽样分布就是正态分布或趋近丁正态分布.如图67所示。样本68.27%个数95.45%99.37%-i-t-Ex=X+2÷3x样本平均数图6-1样本平均数的抽样分都×2±2-Xxa÷2-x+2-a±2-X图6-2样本平均数r±2b:的分布图上式就是在定四信水平(COnfidenCePrObabi1.ity)(1.-a)(即概率保证程度)下总体均值的置信区间(ConfidenceInterva1.),其中彳一/叱为理信卜限,工+z/叱为置信上限。Z是正态分布的临界值,与置信水平互为函数。2ZJ值越大,置信区间包含总体参数的可能性就越大,即置信水平越高:相反ZJ22的取值越小,餐信区间包含总体参数的可能性就越小,即置信水平越低。Za和2置信水平(1.-a)的相互对应关系值可查标准正态概率分布表。置信水平(1-a)说明了区间估计的可靠性:其中的a称为显著性水平(1.eve1.OfConfidence),它说明了区间估计的不可靠性。例如,(1-a)=1-5%=95%.说明置信包含总体参数的可能性为5%。Zj*称为区件估计的极限误差,即区间估计的最大误差范围.综上所述,理信区间大小说明f区间估计的准确性,而置信水平上下说明J'区间估计的可靠性。在样本容量一定的条件下,区间估计的这两个根本要求往往是矛盾的。假设提高置信水平,则置信区间必然增大,区间估计的准确性必然降低:反之,假设提高区间估计的准确性,就必然要缩小置信区间,区间估计的可苑性必然降低,因此,在进展统汁推断时,要招估计的可靠性和准确性结合起来考虑。从总结出的区间估计公式可以看出,总体参数的置信区间主要决定丁:个因素,即样本统计员:的值7、样本统计室分布的标准差。;及与定的置信水平相对应的Z值。第五节一、抽样设计的根本原则抽样设计<-)类型物样类型抽样也称分层抽样,它先按一定标志对总体各单位进展分类,然后分别每类按随机原则抽取定单位构成样本。类型抽样的前提是对总体事先有定的认识,有辅助信息可供利用,这种信息和所研究的标志值大小有密切关系,可以作为分类的标志。通过分类把总体中标志值比照接近的单位归为一组,减少各组内的差异程度,再从各组抽取样木堆位就有更大的代表性,因而抽样误差也就相对减小了。在实际工作中广泛应用类型抽样方式。例如农产量抽样按地区分类,家计调查按国民经济部门分类,产品质员抽查按加工车床型号分类等等,都受到明显的效果。设总体由N个单位组成,把总体分为k组,使:N=N1.+N?+N-然后从每组的Ni中取m单位构成总容量为n的样本,即n=m+m+M由于k组是根据定标志划分的,各组单位数一般是不同的,假设何从N,中取n,呢通常是按比例取样的,即按各组单位数占总体单位数的比例来分配各组应抽样本单位数,单位数较多的组应该多取样,单位数较少的组则少取样,保持各组样本单位数与谷组堆位数之比都等于样本总容量与总体总位数之比。即

    注意事项

    本文(《统计学原理》教学案.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开