中级经济师[新]中级经济基础第二十三章 统计与数据科学含解析.docx
中级经济师新中级经济基础第二十三章统计与数据科学含解析一、单项选择题1.为了解我国经济活动总量的变动情况,收集国家统计局发布的国内生产总值(GDP)数据,利用统计图形展示GDP的变化,利用增长率计算GDP的基本走势,这是()。A.描述统计B.参数统计C.假设检验D.推断统计2.下列统计变量中,属于顺序变量的是()。A.注册员工数量B.员工受教育水平C.员工性别D.企业所属行业3.下列属于顺序变量的是()oA.性别B.产品等级C.产品产量D.年龄4.下列统计变量中,属于定量变量的是()。A.注册员工数量B.员工受教育水平C.员工性别D.企业所属行业5.下列关于数据的分类说法错误的是()。A.用1表示“男性”,2表示“女性”,这是分类数据B.对分类数据可以计算出各类别的频率C,数值型数据可以进行数学运算D.数据只能是数值6.统计数据按照收集方法不同,通过直接调查或测量而收集到的数据称为()。A.实验数据B.观测数据C.一手数据D.二手数据7 .下列统计数据中,属于实验数据的是()oA.货币发行量数据8 .价格数据C.灯泡使用寿命数据D.耕地面积数据8 .在社会经济领域,()是获得数据的主要方法,也是获得一手数据的重要方式。A.统计调查9 .科学实验C.观察D.测量10 为了说明现象的发展过程,了解社会现象在一段时期的总量需要进行()。A.连续调查B.不连续调查C.全面调查D.非全面调查10 .为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验选择10个有代表性的企业进行深入细致的调查。这类调查方法属于()。A.专家调查B.重点调查C.系统调查D.典型调查11 .以下各项中不属于抽样调查的特点的是()oA.时效性差B.经济性好C.适应面广D.准确性高12.能够根据样本结果推断总体数量特征的调查方式是()。A.重点调查B.抽样调查C.典型调查D.所有非全面调查13.为了及时了解全国城市零售物价的变动趋势,可以对全国的35个大中型城市的零售物价的变化进行调查,这种调查是()oA.典型调查B.重点调查C.抽样调查D.普查14.“数据科学”这个词已有60年历史,最早由()提出。A.庇古B.保罗萨缪尔森C.皮尔逊D.彼得诺尔15 .数据科学是一门通过()研究获取与数据相关的知识体系的学科。A.多样性B.系统性C.复杂性D.简单性16 .下列数据中,不属于非结构化数据的是(A.员工简历B.音频信息C.办公文档D.图像17 .大数据对处理速度也有极严格的要求,一般要在秒级时间范围内给出分析结果,超出这个时间数据就可能失去价值,大数据的处理要符合“()定律”。A. 1秒B. 2秒C. 3秒D4秒18 .关于大数据的特性,说法不正确的是()oA.大数据类型繁多,包括网络日志、音频、视频、图片、地理位置等各种结构化、半结构化和非结构化的数据B.大数据价值密度的高低与数据总量的大小成正比C.大数据对处理速度有极严格的要求,大数据的处理一般要符合“1秒定律”D.存储在数据库里,可以用二维表结构实现表达的数据是结构化数据19 .下列不属于监督学习中的分类方法的是()oA.逻辑斯特回归B.决策树C.随机森林D.基于密度的方法20 .把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低的是()oA.分类B.回归C.聚类分析D.降维21 .下列属于无监督学习的是()oA.决策树B.线性回归C.因子分析D.随机森林二、多项选择题22 .推断统计的内容包括()oA.数据特征的测度B.统计调查C.统计数据的整理和显示D.参数估计E.假设检验23.下列统计数据中,属于观测数据的有(A.CPI数据B.三次产业增加值C.新药疗效数据D.灯泡使用寿命数据E.电池使用寿命数据24.二手统计数据的来源可以有()oA.公开的出版物B.典型调查C.抽样调查D.普查E.国家统计局发布的数据报表25.一手数据的来源主要有()oA.科研论文B.公开出版物C.实验D.调查E.统计年鉴26.下列调查方式中,属于全面调查的有()。A.重点调查B.抽样调查C.典型调查D.普查E.全面统计报表27 .统计调查按调查对象范围不同可以分为()。A.全面调查B.非全面调查C,连续调查D.不连续调查E.随机调查28 .以下各项中,属于普查的特点的是()。A.普查一般需要规定统一的标准调查时间B.普查通常是一次性或周期性的C.普查的数据一般比较准确D.普查的使用范围比较窄E.普查的时效性比较强29 .统计调查的方式包括()。A.统计报表B.普查C.抽样调查D.重点调查E.随机调查30 .关于数据科学与大数据的内容,下列说法中错误的有()。A.数据科学的研究对象是数据B.大数据具有数据量大、数据多样性、价值密度高、数据的产生和处理速度快等特性C.数据挖掘的数据源必须是真实的、大量的、无噪声的D.数据科学是一门通过系统性研究获取与数据相关的知识体系的学科E.常见的数据挖掘方法可分为监督学习、无监督学习和半监督学习31.下列关于大数据的有关表述正确的有()A.大数据的起始计量单位是GB.TB或PBB.大数据类型多,包括各种结构化、半结构化和非结构化的数据C.大数据价值密度低D.大数据的处理要符合“1秒定律”E.大数据可以用常规软件工具进行捕捉、管理和处理32.关于大数据多样性的说法正确的有()。A.大数据包括半结构化数据B.大数据必须是结构规则、完整的数据C.大数据包括结构化数据D.大数据包括非结构化数据E.地理位置是大数据的一种类型33.下列关于数据挖掘的表述正确的有()。A.数据挖掘是指从大量的、完全的、有噪声的、清晰的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程B.数据挖掘以解决实际问题为出发点C.数据挖掘常用的算法可分为监督学习、无监督学习和半监督学习D.主成分分析法属于聚类方法E.无监督学习中有两大类典型任务:聚类和降维34 .国家统计局针对统计数据生产全过程,从下列哪些方面确定了统计数据的质量评价标准()oA.准确性B.及时性C.谨慎性D.可比性E.可获得性35 .关于统计质量评价标准的内容,说法正确的有()。A.真实性侧重于对基础数据质量的评价B.完整性侧重于对统计数据生产科学性的评价C.适用性侧重于对统计用户满意度的评价D.协调性侧重于对统计工作标准化、规范化程度的评价E.统计数据的质量评价标准有真实性、准确性、完整性、及时性、适用性、经济性、可比性、协调性和可获得性答案解析部分1 .【答案】A【解析】考查统计学。描述统计是研究数据收集、整理和描述的统计方法。其内容包括:1.如何取得所需要的数据;2.如何用图表或数学方法对数据进行整理和展示;3.如何描述数据的一般特征。推断统计是研究如何利用样本数据来推断总体特征的统计学方法,其内容包括参数估计和假设检验两大类。参数估计是利用样本信息推断总体特征;假设检验是利用样本信息判断对总体的假设是否成立。CD选项错误。B与本题考查内容无关,参数统计以特定的总体分布(如正态分布)为前提,对总体参数进行估计和检验的一类统计方法。故此题正确答案为Ao2 .【答案】B【解析】考查变量和数据。1、定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业的销售额是1000万元。2、分类数据指分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示“男性”,2表示“女性”。3、顺序数据指顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示“硕士及以上”,2表示“本科”,3表示“大专及以下”。A选项为定量变量或数量变量;C选项和D选项属于分类变量。故此题正确答案为B。【思路点拨】注意区分几个变量:变量的分类分类具体内容定里变里(数里变里)变里的取值是数里。如企肖售额、注册员工数定性分蜉里变里的取值是类别。如企业所属行业、员工性别变置酶变里变量的毁Ifi是态81日&睡。如员工受敦育水平3 .【答案】B【解析】考查变量和数据。1、定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业的销售额是1000万元。2、分类数据指分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示“男性”,2表示“女性”。3、顺序数据指顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示“硕士及以上”,2表示“本科”,3表示“大专及以下”。A选项性别是一个分类变量,CD选项产品产量和年龄都是数值型变量。故此题正确答案为B。4 .【答案】A【解析】考查变量和数据。当变量的取值是数量时,该变量被称为定量变量或数量变量,例如企业销售额、注册员工数量等。当变量的取值表现为类别时则被称为分类变量,比如企业所属行业。当变量的取值表现为类别且具有一定顺序时被称为顺序变量,比如员工受教育水平。A选项为定量变量或数量变量;B选项属于顺序变量。C选项和D选项属于分类变量。故此题正确答案为A。5 .【答案】D【解析】考查变量和数据。1、定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业的销售额是100O万元。2、分类数据指分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示“男性”,2表示“女性”。A选项正确。3、顺序数据指顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示“硕士及以上”,2表示“本科”,3表示“大专及以下”。对分类数据可以计算出各类别的频率,但对其进行加减乘除等数学运算是没有意义的。而数值型数据则可以进行数学运算,比如计算均值和方差等统计量。BC选项正确。数据根据需要可以是数值、文字或者图像等形式,D选项错误。故此题答案为D。【思路点拨】从取值上进行区分几个变量:当变量的取值是数量时,被称为定量变量或数量变量。比如企业销售额、注册员工数量等。当变量的取值表现为类别时,被称为分类变量,比如企业所属行业。当变量的取值表现为类别且具有一定顺序时,被称为顺序变量,比如员工受教育水平。分类变量和顺序变量统称为定性变量。6 .【答案】B【解析】考查观测数据和实验数据。观测数据:通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP.CPI、房价等。实验数据:通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数据。自然科学领域的数据大多都是实验数据。A选项不选。从使用者的角度,一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察、实验。二手数据来源于别人的调查或实验的数据,对使用者来说这是数据的间接来源。CD选项不选。故此题正确答案为B。7 .【答案】C【解析】本题考查观测数据和实验数据。新药疗效及新产品使用寿命属于实验数据。故本题正确答案为C。【思路点拨】从来源来区分观测数据和实验数据:观测数据也叫原始数据,是指直接获得的数据,没有对事物施加任何人为控制因素,纷乱无章,经过整理分析才能从中提取有用的信息。实验数据,是指通过实验中控制实验对象以及所处的实验环境收集到的数据。自然科学领域的数据大多都是实验数据。8 .【答案】A【解析】考查一手数据与二手数据。在社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式。BCD为一手数据的来源。故此题正确答案为A。【思路点拨】从使用者的角度看数据的来源,去区分一手数据和二手数据。一手数据(直接数据):来源于直接的调查和科学实验的数据二手数据(间接数据):来源于别人的调查或实验的数据9 .【答案】A【解析】考查统计调查的概念与分类。连续调查是为了观察现象在一定时期内的数量变化,它要求随着调查对象的发展变化,连续的进行调查登记。连续调查的资料可以说明现象的发展过程,目的是了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查是间隔一个相当长的时间(通常是一年以上)所做的调查,一般是为了对总体现象在一定时点上的状态进行研究。B选项错误。全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。C选项错误。非全面调查是对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查、典型调查等。D选项错误。故此题正确答案为A。10 .【答案】D【解析】考查统计调查的方式。典型调查是指有意识的选择若干具有典型意义的或有代表性的单位进行的调查。在统计活动中,运用典型调查的方法,一般说来主要不在于反映现象的总体数量特征,而在于了解与统计数字有关的生动的具体情况。专家调查法又称"德尔菲法"e围绕某一主题或问题,征询有关专家或权威人士的意见和看法的调查方法。A选项错误。重点调查是指从调查对象的全部单位中选择少数重点单位进行调查。重点调查所选择的重点单位虽只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况。B选项错误。系统调查指有系统地收集和分析现用信息系统的有关数据和资料,以找出系统的薄弱环节,并采取相应的改进措施。C选项错误。故此题正确答案为及11 .【答案】A【解析】考查统计调查的方式。抽样调查可以迅速、及时的获取所需要的信息。由于工作量小,调查的准备时间、调查时间、数据处理时间等都可以大大缩减,从而提高数据的时效性。BCD选项说法正确,A选项说法错误。题干反问错误选项,故此题答案为A。12 .【答案】B【解析】考查统计调查的方式。抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。重点调查是指从调查对象的全部单位中选择少数重点单位进行调查。重点调查所选择的重点单位虽只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况。A选项错误。典型调查:选择若干具有典型意义的或有代表性的单位进行的调查。C选项错误。D选项说法错误,且太过绝对。故此题正确答案为B。13 .【答案】B【解析】考查统计调查的方式。重点调查是指从调查对象的全部单位中选择少数重点单位进行调查。重点调查所选择的重点单位虽只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况。典型调查是指有意识的选择若干具有典型意义的或有代表性的单位进行的调查。在统计活动中,运用典型调查的方法,一般说来主要不在于反映现象的总体数量特征,而在与了解与统计数字有关的生动的具体情况,即与现象数量有关的社会条件及其相互联系,以便进行深入的统计分析,做到定性分析与定量分析相结合。A选项错误。抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。C选项错误。普查是为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查、农业普查等。D选项错误。故此题正确答案为B。14 .【答案】D【解析】本题考查数据科学。数据科学这个词最早由丹麦的计算机科学领域先驱“彼得诺尔”提出。故本题正确答案为Do最早提出转移支付概念的是著名经济学家庇古最常用的相关系数是Pearson(皮尔逊)相关系数。萨缪尔森的研究涉及经济理论的诸多领域,例如一般均衡论、福利经济学、国际贸易理论等。【解析】本题考查数据科学。数据科学是一门通过系统性研究获取与数据相关的知识体系的学科。B选项正确,ACD选项错误。【思路点拨】联系生活常识记忆关键词“系统”,数据处理离不开信息系统,所以一定是系统性,而不是其他关键词。故本题选择B选项。16 .【答案】A【解析】本题考查大数据的类型。大数据的类型包括:(1)结构化数据是指存储在数据库里,可以用二维表结构实现表达的数据。(2)非结构化数据是指数据结构不规则或不完整,没有预定义的数据,包括所有格式的办公文档、文本、图片、报表、图像、音频信息、视频信息等;(3)半结构化数据是介于完全结构化数据和完全非结构化数据之间的数据,具有一定的结构性,例如员工简历,有的简历只有教育情况,有的简历包括教育、婚姻、户籍、出入境等很多信息。A属于半结构化数据。本题为反选题,故本题答案为A。17 .【答案】A【解析】本题考查大数据。大数据的智能化和实时性要求越来越高,对处理速度也有极严格的要求,一般要在秒级时间范围内给出分析结果,超出这个时间数据就可能失去价值,即大数据的处理要符合“1秒定律”。A选项正确,BCD选项错误。故本题选择A选项。18 .【答案】B【解析】考查大数据。大数据具有“4V”特性:(1)数据量大(Volume)。(2)数据多样性(Variety)o大数据类型繁多,包括网络日志、音频、视频、图片、地理位置等各种结构化、半结构化和非结构化的数据。选项A说法正确。结构化数据,是指存储在数据库里,可以用二维表结构实现表达的数据;选项D说法正确。非结构化数据,是指数据结构不规则或不完整,没有预定义的数据,包括所有格式的办公文档、文本、图片、报表、图像、音频、视频等。半结构化数据,是介于完全结构化数据和完全非结构化数据之间的数据,具有一定的结构性,例如员工简历,有的简历只有教育情况,有的简历包括教育、婚姻、户籍、出入境情况等很多信息。(3)价值密度低(Value)o大数据价值密度的高低与数据总量的大小成反比。选项B说法不正确。(4)数据的产生和处理速度快(Velocity)。大数据的智能化和实时性要求越来越高,对处理速度也有极严格的要求,一般要在秒级时间范围内给出分析结果,超出这个时间数据就可能失去价值,即大数据的处理要符合“1秒定律”。选项C说法正确。本题为反选题,故答案为B。19 .【答案】D【解析】本题考查数据挖掘。监督学习中常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等。ABC选项正确。D不符合题意。本题为反选题,故本题选择D选项。【思路点拨】区分监督学习的分类方法和无监督学习的聚类方法,避免混淆。常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等常用的聚类方法包括基于划分的方法(例如k均值聚类算法)、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。20 .【答案】C【解析】本题考查数据挖掘。聚类就是把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低。C选项正确,ABD选项与题意无关。C正确。【思路点拨】注意区分这几个选项,避免混淆。分类:通过特征变量确定观测单位所属的类别,因变量是分类变量。回归:通过特征变量确定观测单位因变量的取值,因变量是定量变量。降维:也称为特征提取,指在不损失过多信息的前提下将N个相关的特征降为k个不相关的特征(其中k<N)使其具有更好的解释性。2L【答案】C【解析】本题考查数据挖掘。无监督学习中有两大类典型任务:聚类和降维。常用的聚类方法包括基于划分的方法(例如,k均值聚类算法)、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。常用的降维方法包括主成分分析法、因子分析法等。ABD不符合题意。本题答案为C。22 .【答案】D,E【解析】考查统计学。推断统计包括参数估计和假设检验。参数估计:利用样本信息推断总体特征;假设检验:利用样本信息判断对总体假设是否成立。ABC选项错误。故此题正确答案为DE。【思路点拨】统计学有两个分支:描述统计和推断统计。注意区分两个分支的内容。描述统计研究数据收集、整理和描述的统计方法。描述统计其内容包括:(1)如何取得所需要的数据;(2)如何用图表或数学方法对数据进行整理和展示;(3)如何描述数据的一般特征。23 .【答案】A,B【解析】考查观测数据和实验数据。统计数据,按其收集方法,可以分为观测数据和实验数据。通过直接调查或测量而收集到的数据,称为观测数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP.CPk房价等。通过在实验中控制实验对象以及其所处的实验环境收集到的数据,称为实验数据。自然科学领域的数据大多都是实验数据。如,一种新产品使用寿命的数据;一种新药疗效的数据。本题答案为AB。24 .【答案】A,E【解析】考查一手数据和二手数据。直接进行调查所获取的都是第一手的资料和数据。题中典型调查、抽样调查、普查的数据都是调查而来,因此是一手数据。BCD选项错误。AE是二手数据,是数据的间接来源。故此题正确答案为AE。25 .【答案】C,D【解析】考查一手数据和二手数据。直接的调查和科学实验,对使用者来说,这是数据的直接来源,称为直接数据或一手数据;一手数据的来源主要有两个:调查或观察;实验。在社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式。别人的调查或实验的数据,对使用者来说,这是数据的间接来源,称为间接数据或二手数据。ABE属于二手数据。本题答案为CD。26 .【答案】D,E【解析】本题考查全面调查的范围知识点全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。全面调查包括:统计报表和普查。AC项重点调查属于非全面调查,故不选:B项抽样调查不属于全面调查,是从调查对象的总体中抽取一部分单位作为样本进行调查,故不选;D项普查普查是专门组织的一次性全面调查,所以属于全面调查:E项全面统计报表要求调查对象中每一个单位都填报,所以属于全面调查。故此题正确答案为DE。【思路点拨】注意区分几个调查的不同。按调查对象的范围不同:1.全面调查:对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括:全面统计报表和普查(人口和经济普查)2.非全面调查:对调查对象中的一部分单位进行调查。包括:非全面统计报表、抽样调查、重点调查和典型调查按调查登记的时间是否连续:1.连续调查:观察总体现象在一定时期内的数量变化,说明现象的发展过程,目的是为了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等2.不连续调查:间隔相当长的时间(通常一年以上)所作的调查,为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等27 .【答案】A,B【解析】考查统计调查的概念与分类。统计调查按调查对象范围不同可以分为全面调查和非全面调查。统计调查按调查时间是否连续分为连续调查和不连续调查。CD选项错误。随机调查是指事先有调查动机,但没有具体的调查目的和计划的调查,是调查方式之一。E项不符合题意。故此题正确答案为AB。【思路点拨】统计调查和随机调查都属于调查的方式,统计调查是有计划有目的,随机调查没有具体计划目的。28 .【答案】A,B,C,D【解析】考查统计调查的方式。普查的特点:普查通常是一次性或周期性的;普查一般需要规定统一的标准调查时间,以免调查数据的重复或遗漏;普查的数据一般比较准确,规范化程度也较高:普查的使用范围比较窄。普查通常需要间隔很长的时间,因此其时效性并不是很强。E选项错误。故此题正确答案为ABCD。【思路点拨】统计调查的方式的特点1.统计报表按报送周期长短不同可分为日报、月报、季报、年报等;按报表内容和实施范围不同可分为国家的、部门的、地方的统计报表。2.普查普查通常是一次性的或者周期性的;普查一般要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性:普查数据一般比较准确,规范化程度较高:使用范围比较窄,只能调查基本及特定的现象。3.抽样调查经济性:(最显著的优点);时效性强:适应面广;准确性高:(工作量小,各环节可以做的更细致,登记性误差往往较小)。4.重点调查重点调查的适用范围很广,以较少的投入、较快的速度取得某些现象主要标志的基本情况或变动趋势。5.典型调查灵活机动、通过少数典型单位即可取得深入翔实的统计资料。29 .【答案】A,B,C,D【解析】考查统计调查的方式。常用的统计调查方式包括统计报表、普查、抽样调查、重点调查、典型调查。E与本题考查内容无关。故此题正确答案为ABCD。【思路点拨】随机调查是指事先有调查动机,但没有具体的调查目的和计划的调查,是调查方式之一。统计调查是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地收集数据信息资料的过程。调查过程有两个重要特征:首先,调查是一种有计划、有方法、有程序的活动;其次,调查的结果表现为收集到的数据。随机调查和统计调查不一样,不是等同关系,也不是包含关系。30 .【答案】B,C【解析】考查数据科学。数据科学(datascience)是一门通过系统性研究获取与数据相关的知识体系的学科。数据科学研究的是从“数据”整合成“信息”进而组织成“知识”的整个过程,包含对数据进行采集、存储、处理、分析、表现等一系列活动。选项D说法正确。数据科学的研究对象是数据。选项A说法正确。数据科学的研窕目标是获得洞察力和理解力,通过对数据的分析,来解释、预测、洞见和决策,为现实世界服务。数据科学涉及的范围非常广泛,例如统计学、计算机科学、可视化、人工智能、领域知识等。大数据具有“4V”特性:数据量大、数据多样性、价值密度低、数据的产生和处理速度快。选项B说法错误。数据挖掘的数据源必须是真实的、大量的、有噪声的。选项C说法错误。常见的数据挖掘方法可分为监督学习、无监督学习和半监督学习选项E说法正确。本题为反选题,故答案为BC。31 .【答案】B,C,D【解析】考核大数据的概念和特征。大数据具有“4V”特征,即数据量大、数据多样性、价值密度低、数据的产生和处理速度快。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。E选项错误;大数据的起始计量单位是PB(1024TB)、EB(约100万TB)或ZB,未来甚至会达到YB或BB。A选项错误。故本题正确选项为BCD。32 .【答案】A,C,D,E【解析】本题考查大数据。大数据类型繁多,包括网络日志、音频、视频、图片、地理位置等各种结构化、半结构化和非结构化的数据。非结构化数据是指数据结构不规则或不完整,没有预定义的数据。半结构化数据是介于完全结构化数据和完全非结构化数据之间的数据,具有一定的结构性。所以B错误。故本题正确答案为ACDE。【思路点拨】从举例上来理解并区分结构化、半结构化和非结构化的数据。结构化数据,简单说就是数据库。如企业ERP、财务系统;医疗HIS数据库;教育一卡通:政府行政审批;其他核心数据库等。非结构化数据,包括所有格式的办公文档、文本、图片、报表、图像、音频、视频。半结构化数据,如员工简历,有的简历只有教育情况,有的简历包括教育、婚姻、户籍、出入境情况等很多信息。33 .【答案】B,C,E【解析】本题考查数据挖掘。数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程,A项错误:聚类方法:基于划分的方法例如k均值聚类算法、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法;降维方法:主成分分析法、因子分析法,D项错误。故本题正确答案为BCE。34 .【答案】A,B,D,E【解析】本题考查统计质量评价标准国家统计局针对统计数据生产全过程,从九个方面,确定了统计数据的质量评价标准:真实性、准确性、完整性、及时性、适用性、经济性、可比性、协调性、可获得性。C不属于评价标准。本题答案为ABDE。【思路点拨】根据口诀“获得一整套经济适用房真比商品房及时准确好协调”进行记忆,拆解理解如下:获得一整套经济适用房真比商品房及时准确好协调。即:可获得性、完整性、经济性、适用性、真实性、可比性、及时性、准确性、协调性35 .【答案】A,C,E【解析】考查统计质量评价标准.国家统计局制定的国家统计质量保证框架(2021),针对统计数据生产全过程,从真实性、准确性、完整性、及时性、适用性、经济性、可比性、协调性和可获得性九个方面,确定了统计数据的质量评价标准。选项E说法正确。(1)真实性,要求统计源头数据必须符合统计调查对象的实际情况,确保统计数据有依据、可溯源。侧重于对基础数据质量的评价。选项A说法正确。(2)准确性,要求统计数据的误差必须控制在允许范围内,能够为形势判断、政策制定、宏观调控等提供可靠依据。侧重于对统计数据生产科学性的评价。(3)完整性,要求统计数据应当全面完整,统计范围不重不漏,统计口径完备无缺。侧重于对统计数据全面系统反映客观实际程度的评价。选项B说法不正确。(4)及时性,要求统计数据生产应当在符合统计科学规律的前提下,尽可能缩短从调查到公布的时间间隔。侧重于对统计数据生产效率的评价。(5)适用性,要求统计数据能够最大限度为用户所用,统计指标紧跟时代发展、切合统计需求。侧重于对统计用户满意度的评价。选项C说法正确。(6)经济性,要求统计数据生产应当尽可能降低成本,统计调查、行政记录、大数据等数据资源得到充分利用。侧重于对统计数据成本效益的评价。(7)可比性,要求统计数据应当连续、可比,不同时间、空间数据生产使用规范统一的统计标准和统计原则。侧重于对统计工作标准化、规范化程度的评价。(8)协调性,要求统计数据结构严谨、逻辑合理,各总量数据、结构数据相互之间高度匹配。侧重于对统计数据间逻辑关系的评价。选项D说法不正确。(9)可获得性,要求多渠道、多方式公布统计数据,同时公布相应的统计制度方法,加强数据解读,满足社会需求。侧重于对统计服务质量的评价。本题答案为ACE。