统计学——导论.ppt
统计学,统计规律,正常条件下新生婴儿的男女性别比为107:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系,参考教材:统计学贾俊平等编著 中国人民大学出版社 2007年第三版统计学原理黄良文主编 中国统计出版社 2000年6月版统计学徐国祥、刘汉良等编著 上海财经大学出版社2001年11月版统计学(第二版)袁卫、庞皓等主编 高等教育出版社 2005年8月概率论与数理统计教程茆诗松、程依明主编 高等教育出版社 概率论与数理统计 盛骤等 高等教育出版社,第一章 绪论,一、统计学概述二、统计学的产生与发展三、统计数据的类型四、统计中的几个基本概念,主要内容,目录,第一节 统计学概述,产生,一、统计学的涵义所谓统计,是人们认识客观世界总体数量变动关系和变动规律的活动的总称。它包含统计工作、统计资料和统计科学三个方面的含义。,企业每年产量和产值的“统计”某个电视节目收视率的“统计”股票价格指数的编制,了解一个国家或地区的面积、人口和人均GDP,正在学习统计,统计工作,统计资料,统计科学,统计包含三种涵义,两重关系1、统计工作:工作过程。资料收集、整理和分析。2、统计资料:工作成果。包括统计数据和分析报告。3、统计科学:研究如何搜集、整理、分析数据资料的一门方法论科学。,统计资料统计工作统计科学,工作与工作成果关系,实践与理论关系,统计研究的过程,实际问题,二、统计的特点和作用(一)统计的特点,统计作为人们认识客观世界总体数量变动关系和变动规律的活动总称,具有如下特点:1.数量性:用规模、水平、速度、结构和比例关系去描述和分析客观事物的数量表现、数量关系和数量变化,揭示事物的本质,反映事物发展的规律,推断事物发展的前景2.具体性:统计所研究的量是与客观事物具体内容相联系的量,是体现事物相互关系和发展变化的量,具有明显的时空特点和事物属性的特点。3.综合性:统计是通过对大量事物进行观察研究,或对一个事物的变化作多次观察研究,得出反映现象总体数量特征,或反映出事物的必然性结论,具有综合性的特点。,二、统计的特点和作用(一)统计的作用,1.统计是认识世界有力的武器:人们通过统计研究事物的量及其变化,去认识事物的质和事物发展的规律,或密切联系事物的质去研究事物的量2.统计是治国和管理的重要手段:大至国际政治经济形势的分析,国家的决策施政和管理,小至企业的业务经营和班组核算,从宏观到微观,统计已是无处不在。3.统计是科学研究的有效工具:通过统计,可以反映事物的现状揭示事物的内部构成,研究事物之间的相互关系,掌握事物运动的规律,比较事物的优劣,挖掘事物的发展潜力,预测事物发展的前景。三、统计的基本任务中华人民共和国统计法第一章第二条规定:“统计的基本任务是对经济社会发展情况进行统计调查、统计分析、提供统计资料好统计咨询意见,实行统计监督。”简言之,统计的基本任务是统计服务和统计监督。,四、统计学的研究对象统计学的研究对象:统计研究所要认识的客体,它决定着统计科学的研究领域以及相应的研究方法。一般来说,统计学的研究对象是客观事物的总体数量特征和数量关系,以反映其发展过程及规律性。,任何一个部门的统计工作都以与它相关的客观事物的数量方面作为自己的研究对象,通过调查、整理、分析,以数字为语言,用规模、水平、速度、结构和比例,去反映一定时间、地点条件下客观事物的数量表现、数量关系和数量变化,以达到认识事物的性质、掌握事物运动的规律和指导人们的社会实践的目的,发挥统计的整体功能。,五、统计学研究对象的特点(一)数量性(最基本的特点)(二)总体性(三)变异性(四)具体性,六、统计学的分科,(一)统计学的内容,1、描述统计,指搜集、整理、分析并提供统计资料的理论和方法。,主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。,2、推断统计,是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。,描述统计是推断统计的前提,推断统计是描述统计的发展。,(二)描述统计(descriptive statistics),研究数据收集、整理和描述的统计学分支 内容搜集数据整理数据展示数据描述性分析 目的描述数据特征找出数据的基本规律,(三)推断统计(inferential statistics),研究如何利用样本数据来推断总体特征的统计学分支内容参数估计假设检验目的对总体特征作出推断,(四)描述统计与推断统计的关系,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),(五)理论统计与应用统计,理论统计研究统计学的一般理论研究统计方法的数学原理应用统计研究统计学在各领域的具体应用,七、统计学的研究方法大数定理:指大量随机变量的平均结果具有稳定性的一系列定理的总称,也称大数定律或大数法则。由于大数定理的作用,大量随机现象的总体作用必然导致某种不依赖于个别随机现象的结果,呈现出事物发展变化的规律性。其意义有:1.大量性只有从大量现象的总体中,才能研究这些现象的规律性。2.代表性所研究对象总体包含的单位越多,平均数也就越能正确地反映这些现象的规律性。3.稳定性各单位的共同倾向(这些表现为主要的基本的因素)决定着平均数的水平,而单位对平均数的离差(这些表现为次要的、偶然的因素)则由于足够多数单位的汇总综合的结果,其离差相互抵消,代表性趋于稳定。,(一)大量观察法是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数理依据是:反映随机现象基本规律的大数定律。(普查、抽样调查、统计报表调查、重点调查等)皮尔逊实验,(二)实验设计实验的统计设计就是指设计实验的合理程序,使得收集得到的数据符合统计分析方法的要求,以便得出有效的客观的结论。,(三)统计描述a.分组法根据统计研究的目的和研究对象的特点,将总体各单位按照某一标志划分为不同性质的类型或组别。b.综合指标法是从数量方面对现象总体特征的概括说明。综合指标法,就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。c.统计模型法根据一定的经济理论和假设条件,用数字方法去模拟现实客观现象之间相互关系的一种研究方法。如回归分析法,结构方程(四)统计推断法是在一定置信程度(即可靠程度)下,根据样本资料的特征对总体特征作出估计和预测的方法。统计推断是现代统计学的基本方法。(抽检),(五)参数估计法是指当总体不知道时,需要通过样本数据计算样本统计量,并以此作为总体参数的估计量来估计总体参数的取值或取值区间。(六)假设检验法由于对总体的变化情况不了解,不妨先对总体的状况作某种假设,然后根据样本实际观察的资料对所作假设进行检验,来判断这种假设的真伪,以决定行动的取舍。,七、统计学的研究阶段1.统计设计在正式进行具体统计工作之前,根据统计研究对象的性质和研究目的,对统计工作各个方面和环节的通盘规划和安排。2.统计调查根据统计研究的任务和统计设计规定的调查方案的要求,运用科学的调查方法有组织、有计划地采集统计资料的过程。3.统计整理根据统计研究的目的,将统计调查所得的资料进行科学的分组、汇总、列表的加工处理过程。4.统计分析根据统计研究的目的,综合运用各种分析方法和统计指标,对加工整理后的资料和具体情况进行定性和定量的分析,并对未来趋势进行预测。,第二节 统计学的产生与发展,一、统计学的产生:统计是适应人类社会实践活动的需要而产生和发展起来的。原始社会后期:人类最初的一般计数活动蕴藏着统计萌芽;奴隶制国家产生:开始了人口、土地和财产的统计;封建社会时期:统计有了一定的发展,但由于封建经济的封闭割据和保守性,统计活动的范围受到了限制,统计方法也很不完善;资本主义时期:近代统计的发展是与资本主义的产生发展同步的,在17世纪至18世纪,随着欧洲资本主义的成长,人口、工业、农业的统计登记逐渐形成制度,“商业、工业、农业、海关、外贸、物价等方面的统计得到了很大的发展”。随着统计实践的发展,欧洲出现了一些统计理论著作,这些统计理论著作为统计学奠定了理论基础。统计学作为一门系统的科学,距今只有300多年的历史。,二、统计学的发展(经历了三个时期)(一)统计学的萌芽期(古典统计学)(17世纪中18世纪中)(二)统计学的近代时期(近代统计学)(18世纪末19世纪末)(三)统计学的现代期(现代统计学)(19世纪末至今),(一)统计学的萌芽期1、德国的记述学派(国势学派 国势学派认为统计学是关于国家显著事项的学问,主要通过对国家组织、人口、军队、领土、居民职业和资源财产等事项的记述对国情国力进行研究。他们在大学中开设“国势学”采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。代表人物是德国的康令(H.Coning,1606-1681)和阿亨瓦尔G.Achenwall,1719-1772)。1764年阿亨瓦尔首创“统计学”一词,该学派也提出了一些仍为统计学者采用的术语:如“显著事项”等。他们主要使用文字记述方法对国情国力进行研究,其学科内容偏重于事物质的解释而忽视量的分析,与现代统计学有较大差别。因此,有“统计学”之名而无统计学之实。,2、政治算术学派 主要代表人物:威廉配第(W.Petty)、约翰格朗特(J.Graunt)最早的统计学源于17世纪英国。威廉佩第在政治算术中写到:本书“不用比较级、最高级进行思辨或议论,而是用数字来表达自己想说的问题借以考察在自然中有可见的根据的原因。”政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。威廉配第对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较,证明英国实力;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。政治算术学派在统计发展史上的作用:在数量统计资料的基础上进行全面系统的总结,并从中提炼出理论原则。同时,政治算术学派第一次有意识地运用可度量的方法,力求把自己的论证建筑在具体的、有说服力的数字上面,依靠数量的观察来解释与说明社会经济生活。无“统计学”之名而有统计学之实。,(二)统计学的近代时期(18世纪末19世纪末)这一时期的统计学主要有数理统计学派和社会统计学派。人口统计学的发展及航海运输业的频繁,保险事业得到了进一步发展,而保险业的特点决定了它又促进了赌博数学和概率论的发展。概率论的产生和发展,用概率论来研究法律、政治、道德、经济等社会问题的现象越来越多。,(1)数理统计学派 主要代表人:拉普拉斯(P.S.Laplace)和凯特勒(A.Quetelet)数理统计学派始于19世纪中叶,该学派代表人物比利时统计学家凯特勒主张用研究自然科学的方法来研究社会现象,正式把概率论引入统计学,并最先用大数定律论证了社会生活中随机现象的规律性,还提出了误差理论和“平均数”思想。其代表作社会物理学等将概率论和统计方法引入社会经济方面的研究。凯特勒被称为近代统计学之父,他把统计学发展中的三个主要源泉,即德国的国势学派、英国的政治算术派和意大利、法国的古典概率派加以统一、改造并融合成具有近代意义的统计学,促使统计学向新的境界发展。认为统计学是一门通用的方法论科学。从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。英国生物学家高尔顿提出并阐述了“相关”的概念;皮尔逊提出了计算复相关和偏相关的方法。戈塞特建立了“小样本理论”,即所谓的“t分布”;费歇在样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。到20世纪中期,数理统计学的基本框架已经形成。数理统计学派成为英美等国统计学界的主流。,(2)社会统计学派主要代表人物为恩格尔(C.K.E.Engel)和梅尔(G.V.Mayr)社会统计学派始于19世纪末,创始人为德国的克尼(K.G.A.Knies)。他们认为,统计学是研究社会现象变动原因和规律性的实质性科学,其显著特点是强调对总体进行大量观察和分析,通过研究其内在联系来揭示社会现象的规律。统计方法应当包括社会统计调查中资料的搜集、整理,以及对其分析研究。同时,他们还认为,在社会统计中,全面调查,包括人口普查和工农业调查,居于重要地位;以概率论为根据的抽样调查,在一定的范围内具有实际意义和作用。1850年,克尼斯在独立科学的统计学一文中提出,统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学,他主张以“国家论”作为国势学的科学命名,而以“统计学”作为“政治算术”的科学命名。各国学者在社会经济统计指标的设定与计算、指数的编制、资料的收集与整理、统计调查的组织和实施、经济社会的数量分析和预测等方面做出的贡献已成为现代统计学的重要组成部分。例如,“恩格尔系数”,至今仍为人们广泛使用。国民收入和国内生产总值的核算方法被称为“20世纪最伟大的发明之一。”,20世纪20年代,数理统计理论与方法在欧美国家广泛得到应用,并形成了新的数理统计学派,如英国的戈赛特和费雪、波兰的尼曼等。20世纪30年代R费希尔的推断统计理论标志着现代数理统计学的确立。该学派提出了小样本理论、方差分析、假设检验理论、区间估计理论,并将其在各个领域。统计学的主流从描述统计学转向推断统计学。60年代以后统计学发展有三个明显的趋势:1、随着数学的发展,统计学依赖和吸收数学营养的程度越来越迅速;2、向其他学科领域渗透,或者说,以统计学为基础的边缘学科不断形成;3、随着数理统计的应用的日益广泛和深入,特别是借助电子计算机后,统计学所发挥的功效日益增强。,(三)统计学的现代时期(19世纪末至今),一、分类数据、顺序数据、数值型数据 按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。,第三节 统计数据的类型,数据的计量尺度,(一)定类尺度(Nominal scale),也称列名尺度或名义尺度或分类尺度计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有=或的数学特性,(二)定序尺度(Ordinal scale),也称顺序尺度对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有或的数学特性,(三)定距尺度(Interval scale),也称间隔尺度对事物的准确测度3.比定序尺度精确4.数据表现为“数值”5.没有绝对零点6.具有+或-的数学特性,(四)定比尺度(Ratio scale),也称比率尺度对事物的准确测度3.与定距尺度处于同一层次4.数据表现为“数值”5.有绝对零点6.具有 或 的数学特性,(五)四种计量尺度的比较,计量尺度,数学特性,“”表示该尺度所具有的特性,二、观测数据和实验数据 按照统计数据的收集方法,可以分为观测数据和实验数据。三、截面数据和时间序列数据 按照被描述的现象和时间的关系,可以将统计数据分为截面数据和时间序列数据。,一、统计总体与总体单位(一)统计总体与总体单位的定义 1、总体:就是根据一定目的确定的所要研究事物的全 体。它 是由客观存在的、具有某种共同性质的 许多个别事物构成的整体。统计总体的特点:(1)同质性(2)大量性(3)差异性统计总体根据总体所包括的个体数目可以分为有限总体和无限总体。,第四节 统计中的几个基本概念,2、总体单位定义:总体单位(简称单位或个体):是组成总体的各个个体。例如,研究全省的工业增加值,那么全省的工业企业是总体,每个工业企业是总体单位。,总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。总体既可以指客观事物本身,也可以是反映该事物某重要数量特征的一组数据的集合。该集合中的每个元素就是总体单位。总体和总体单位的概念也是相对而言,随着研究目的的不同,总体范围不同而相互变化。,(二)统计总体和总体单位的关系,例,总体=2,3,4,7,10,102,109,N,无限总体:含无限多个单位。有限总体:含有限个单位。,总体单位,二、样本与样本单位,定义:是从总体中抽取出来,作为代表这一总体的部分单位所构成的集合体。,样本单位必须取自总体内部,不许总体外部单位参加,特点,从一个总体中可抽取许多个样本,样本必须具有代表性,样本必须具有客观性,(一)样本的定义与特点,构成样本的每一个体称为样本单位构成样本的元素的数目称为样本容量,(二)总体与样本之间的关系,三、标志和指标,(一)标志1、定义 总体单位所具有的属性或特征称为标志。2、分类,(1)按表现形式分类,品质标志:表明单位属性方面的特征,只能用文字表示,例如,性别等,数量标志:表明单位数量方面的特征,可用数值表示,例如,年龄等。,(2)按有无差异分类,不变标志各单位具体表现相同,可变标志各单位具体表现不同,例 总体:一年级全体在校大学生。总体单位:每个一年级大学生。,(二)标志表现 各单位的属性或特征的具体表现。例:,(三)指标1、指标是说明总体特征的名称和数值的总称。一个完整的统计指标包括指标名称和指标数值两部分。国家统计局2010年1月21日在国务院新闻办发布数据,2009年中国国内生产总值为335353亿元,比上年增长87。GDP总值世界排名第三位。人均GDP为3678美元,世界排名第100位。2、特点:具体性:有具体对象、时间、地点、条件。综合性:说明总体特征是综合全部单位具体标志表现的结果。,3、分类,(1)按反映的数量特点不同分,数量指标,质量指标,(2)按数值形式不同分,绝对数指标,相对数指标,平均数指标,(3)按性质不同分类,正指标(销售收入、资金利税率),逆指标(犯罪率、不及格率),适度指标(恩格尔系数、基尼系数),(4)按推断统计的指标说明的对象不同分,参数,统计量,四、参数和统计量,一、参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示 二、统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母表示,在推断统计中:说明总体的指标也称参数,即是描述总体的量度。例如:中央电视台春节晚会收视率;人力资源经理的平均工资。说明样本的指标也称统计量,即样本的描述指标。例如:对500人作调查得到的春节联欢晚会的收视率。,(三)指标、参数与统计量的关系,指标,参数,统计量,总体,样本,(四)指标与标志的关系,联系:(1)一些数量标志汇总可以得到指标的数值;(2)数量标志与指标之间存在变换 关系。区别:(1)标志是说明总体单位特征的,而指标是说统 统计总体数量特征的;(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。,(五)指标体系,1、定义:具有内在联系的一系列指标构成的整体。基本统计指标体系:反映国民经济和社会发展基本情况。包括社会指标体系、经济指标体系、科技指标体系等。专题统计指标体系:针对某项社会经济问题的专项指标体系。,例:,产 销 率,劳动生产率,净产值率,成本利润率,工业企业经济效益指标体系,资金利润率,负 债 率,流动资金周转速度,五、变量和变量值,1、变量:可以取不同数值的量,可变的数量标志和统计指标都是变量。(广义的变量也包括可变的品质标志,称为定性变量),按影响因素不同划分,按数值形式不同划分,确定性变量,随机变量,离散型变量,连续型变量,2、变量值:即变量的具体数值,包括标志值和指标数值,社会经济现象中许多变量,既受确定性因素影响,又受随机性因素影响。要根据具体情况加以认定。,变量,确定性变量 离散型变量随机性变量 连续型变量,统计指标,标志,参数,统计量,可变数量标志,可变品质标志,6、推断:就是以样本信息为依据对总体的某些特 征作出预测和估计。,7、推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称置信度。,本 章 结 束!,