心理测量学知识——三级基础篇.ppt
心理测量学知识三级基础篇,2008,总体框架,心 理 测 量,基础篇,技能篇,心理测验概述,心理测验的技术分析,心理测验的编制与使用,智力测验,人格测验,心理与行为问题评估,应激及相关问题评估,心理与行为问题评估,测验结果的解释,特殊心理评估的实施,三级,二级,测验常模,测验信度,测验效度,项目分析,第一节 概述,2008,第一单元 测量与测量量表,一、测量定义 测量就是依据一定的法则用数字对事物加以确定。事物:测量对象的属性或特征(外显性、内隐性)数字:属性的量(数量的四个特征:区分性、序列性、等距性、可加性)法则:测量所依据的规则和方法(科学规则和科学原理)二、测量要素参照点:计算的起点(绝对参照点、相对参照点)单位:理想测量单位的条件(确定的意义、相等的价值)心理测量的单位既无统一单位,也不等距(智力发展)三、测量量表 在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。,三、测量量表,什么是随机现象,从数学的角度来研究社会和自然现象可以分为三类:确定现象:事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的,如1个标准大气压下水的沸点。研究这类现象的数学工具有数学分析、几何、代数、微分方程等。随机现象:事前不可预测的现象,即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定,如掷硬币,过十字路口遇红绿灯。研究这类现象的数学工具是概率论和统计。(事件结果不确定)模糊现象:事物本身的含义不确定的现象。如“健康”与“不健康”,“年青”与“年老”。研究这类现象的数学工具是模糊数学。(事物本身定义不确定)产生随机现象的原因:基本因素决定事物的必然规律,次要因素使事物呈现统计规律,如炮弹发射。心理现象会受一些主客观因素的影响而呈现随机性。,心理测验是在顺序量表的水平上进行的。选择题:测量量表的种类有哪几种水平?某种测验是那种水平的量表?心理测量往往是哪个水平的量表?,第二单元 心理测验的基本概念,一、心理测验的定义 理论基础:凡是客观存在的事物都有其数量。桑代克,1918 凡有其数量的事物都可以测量。麦柯尔,1939 定义:测量:测量就是依据一定的法则用数字对事物加以确定。心理测验:依据心理学理论,使用一定的操作程序,通过观察少数有代表性的行为,对心理特点作出推论和数量化分析的一种科学手段。实质:心理测验实质上是行为样本的客观和标准化的测量。阿娜斯塔西 标准化:是指测验编制、实施、记分以及测验分数解释程序的一致性。客观性:测验不受主观支配,其测量方法是可以重复的,测验的实施、记分和解释是客观的。行为样本:是指有代表性的样本,或者说根据某些条件所取得的标准样本。心理统计知识:总体、个体、样本,总体、个体、样本,总体:指具有某种特征的一类事物的全体,是某一类欲研究的对象的全体,总体的大小随所研究的问题而变。描述总体的统计指标叫参数。个体:构成总体的每个基本单元,又叫一个随机事件或样本点。样本:从总体中抽取的一部分个体,成为总体的一个样本,是样本点的某个集合。个体数目超过30的样本称为大样本,等于或小于30的样本称为小样本。描述样本的统计指标叫统计量。,二、心理测验的性质间接性相对性,1、高兴,每分钟17次,2、悲伤,每分钟9次,3、思考,每分钟20次,4、恐惧,每分钟64次,5、愤怒,每分钟40次,二、心理测量的性质间接性相对性客观性:心理测验的标准化 选择题:有哪几种性质?根据题目判断,该测验使用了心理测验的什么性质,第三单元 心理测验的分类,第四单元 纠正错误的测验观 一、错误的测验观 二、正确的测验观(辩证的观点)第五单元 心理测验在心理咨询中的应用 心理门诊中常用的测验:智力、人格、心理评定第六单元 心理测验的发展史,三个人名,四个发展,第二节 测验的常模,2008,如果你在一次语文统考中得了86分,那么你还想知道什么?1、与全班总人数100人进行比较。2、如果全省总人数是1,00,00呢?抽取有代表性的100人进行比较。70.6 77.5 82.0 90.5 81.0 85.5 71.0 80.0 92.5 77.0 88.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.0 89.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 66.5 81.5 75.0 84.0 90.0 80.0 86.0 84.5 68.5 71.0 86.0 81.5 79.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 78.0 66.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.0 77.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.5 73.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.0 94.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.5,第一单元 常模团体,一、常模团体的性质 界定:常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本,实质是一个有代表性的样本,形式:它用一个标准的、规范的分数表示出来,作用:以提供一个比较的基础。1936年,美国文学文摘杂志进行了一次最具雄心的测验:选票被寄给了从电话簿与车牌登记名单中挑选出来的1000万人。最后收到200万人以上的回应;结果显示有57的人支持共和党候选人兰登,而当时的在任总统罗斯福的支持率为43。实际投票结果:罗斯福以历史上最大的优势,61的得票率,获得第二届任期。,二、常模团体的条件(P336)构成有明确界定,具有好的代表性,大小合适 三、取样的方法(怎么取?取多少?)简单随机抽样系统抽样,又叫等距抽样分组抽样分层抽样,省重点 市重点 区(县)重点 普通10 20 30 40 200 300 400(比例分层抽样)250 250 250 250(非比例分层抽样),四、常模分数与常模原始分数:被试在接受测验后,根据测验的计分标准,对照被试的反应所计算出的测验分数。原始分数反映了被试答对题目的个数,但一般不能直接反映出被试之间的差异状况,不能刻划出被试相互比较后所处的地位,也不能说明被试在其他等值测验上应获得什么样的分值。导出分数:在原始分数的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,可以相互比较的分数。常用的导出分数有百分等级、标准分数、T分数等。常模分数:施测常模样本被试后,将原始分数转换出来的导出分数。常模:常模分数构成的分布。,第二单元 常模的类型,一、发展常模(年龄量表)根据处于某发展水平的人的平均表现所制成的量表就是发展常模。1、发展顺序量表2、智力年龄(心理年龄)3、年级当量(年龄量表),二、百分位常模 1、百分等级 百分等级是应用最广的导出分数,一个原始分数的百分等级是指在一个群体的测验中,得分低于这个分数的人数的比分比。明白公式5-1各字 母含义 运用公式计算 2、百分点 3、四分位数和十分位数,集中趋势的度量,集中趋势是指一组观察值的集中位置或平均水平,是一组数据的代表。常用的平均数是算术平均数。例:计算一下三组数据的算术平均数 7,7,8,8,8,9,9 4,5,7,8,9,11,12 1,4,7,8,9,12,15 8 一组数据只用集中趋势还不能全面反映情况,还必须有反映其变异性(整齐程度,或离中趋势)的度量。,离中趋势的度量,离中趋势实质上刻画了集中数量的代表程度。7,7,8,8,8,9,9 S2=0.57 S=0.76 4,5,7,8,9,11,12 S2=7.43 S=2.73 1,4,7,8,9,12,15 S2=18.86 S=4.34方差:也称变异数,均方,作为样本统计量常用S2表示,它是每个数据与该组数据平均数之差的平方的均值,即离均差平方的平均数。理解:每个数与平均数的差(离均差)表明了它与这组数据的中心的距离,把所有的这种差异加起来当然就会反应整组数据内的分散与聚合情况,当然由于离均差之和为零,这里采用离均差的平方来保留下每个数据与平均数间的差异。标准差:方差的平根,作为统计量用S或SD表示,三、标准分常模 标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。1、z分数(线性转换的标准分数),指出公式各字母的含义,z分数用来表示原分数在该组数据分布中的位置。如果原数小于平均数,则z分数为负数;如果原数大于平均数,其值为正;如果原数的值等于平均数,则z分数值为零。z分数性质1:一组数据中所有由原分数转换得出的z分数之和为零,即z分数的均值为0。z分数性质2:一组数据中各z分数的标准差为1。,z分数的应用 用于比较分属不同性质的观测值在各自数据分布中相对位置的高低。例 假设某考生在高考中,语文得110分,数学得125分。如果所有考生的语文平均分为90,标准差为10;数学平均分为100,标准差为15分。那么,相对而言这个考生哪方面能力更强?表示标准测验分数。用卷面得分去查该测验中已经编制好的一个得分转换表。常用的标准测验分数如:韦克期勒智商表示为:IQ=15Z+100,比纳-西蒙智商表示为:IQ=16Z+100;广东省高考中各科分数用的是T=100Z+500。Z=A+Bz A改变平均数去掉负数 B扩大标准差去掉小数 用于合成不同质的数据。异常数值的取舍:三个标准差原则。,正态分布,正态分布是自然界最常见的一种分布,例如测量的误差;炮弹弹落点的分布;人的生理特征:身高、体重等;心理特征:智商、心理健康状 况等;农作物的收获量;工厂产品的规格:直径、长度、宽度、高度等都近似服从正态分布。一般来说,若影响某一数量指标的随机因素很多,而每个因素所起的作用不太大,则这个指标很可能服从正态分布。,平均数为0,标准差为1的一组数据构成的正态分布称为标准正态分布。正负1个标准差之间,约包含总面积的68.26%(34.13*2)正负2个标准差之间,约包含总面积的95.44%(34.13+13.59)*2)正负3个标准差之间,约包含总面积的99.72%(34.13+13.59+2.14)*2),某标准分数的均值和标准差,四、智商及其意义1、1908年,比内-西蒙量表首先使用心理年龄。2、1916年,斯坦福大学推孟教授修订完成斯坦福-比内量表,引入比率智商。3、韦克斯勒最早在智力测验中使用离差智商的概念,离差智商平均数为100,标准差为15。4、1960修订的斯-比量表中,是用平均数为100,标准差为16的标准分数量表。,第三单元 常模分数的表示方法,一、转换表法二、剖面图法,第三节 测验的信度(P 348),2008,经典测量理论的基本假设,一、测量误差 1、测量误差含义:在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。2、测量误差的种类:随机误差:与测量目的无关、偶然因素引起的,既影响稳定性又影响准确性。系统误差:与测量目的无关、恒定而又规律的效应,只影响准确性,不影响稳定性。3、测量误差的来源 测量工具方面 测量对象方面 施测过程方面,二、经典测量理论的数学模型 1、真分数(True Score):反映被试某种心理特质真正水平的那个数值称作该特质的真分数。(实测的分数称作该特质的测量分数)2、经典测量理论的数学模型 经典测量理论假定,观察分数(记作X)与真分数(记作T)之间相差一个随机误差(记作E)被试观察分数的方差等于其真分数方差与误差分数方差之和。系统误差的变异包含在真分数的变异中。真分数的变异分为两部分,与测量目的有关变异()和与测量目的无关的变异()。因此,一次测验中,实测分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和测量误差所决定的。,第一单元 信度的概念,一、信度的定义 信度是指测量结果的稳定程度。即测量结果反映出系统变异的程度。所谓系统变异是指个体在心理特征方面的真实个体差异,高信度的测量很少受到随机因素或事件的干扰,能够准确无误地测量出人们的心理特征。识别公式5-9、5-10,不用计算 二、信度的指标 信度系数:真分数方差(系统变异)与实得分数方差(总变异)的比值。实际操作时,即同一被试样本所得的两组资料的相关。信度指数:真分数标准差与实得分数标准差的比值。信度系数的平方根就是信度指数。测量的标准误:同一测验对N个样本进行测量,N个样本平均数的标准差。信度越高,标准误越小;信度越低,标准误越大。,第二单元 信度评估的方法,一、重测信度(重测法)二、复本信度(等价法)三、内部一致性信度 1、分半信度 2、同质性信度四、评分者信度,第三单元 信度与测验分数的解释,一、解释真实分数与实得分数的相关二、确定信度可以接受的水平三、解释个人分数的意义四、比较不同测验分数的差异,第四单元 影响信度的因素,一、被试方面 1、单个被试的身心健康状况、应试动机、注意力、耐心、作答态度等影响心理特质的稳定性。2、样本团体内部水平的离散程度:异质,信度易高估,同质,信度易低估。3、样本团体的平均水平:对于某测验而言,团体的平均水平太高或太低导致样本团体相当于同质团体,因此容易低估测验的真正信度。二、测验长度 三、测验难度 四、时间间隔,提高测量信度的方法适当增加测验的长度。使测验中所有试题的难度接近正态分布,并控制在中等水平。努力提高测验试题的区分度。选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。主试严格执行施测过程,评分者严格按照标准给分,施测场地按测验手册的要求进行布置,减少无关因素的干扰。,第四节 测验的效度(P 348),2008,第一单元 效度的概念,一、效度的定义 效度是指所测量的与所要测量的心理特点之间符合的程度,反映了测量的准确性。被试观察分数的方差等于其真分数方差与误差分数方差之和。系统误差的变异包含在真分数的变异中。真分数的变异分为两部分,与测量目的有关变异()和与测量目的无关的变异()。因此,一次测验中,实测分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和测量误差所决定的。效度定义:有效方差与总方差的比率。,识别公式5-21,不用计算,二、效度的性质 1、相对性 2、连续性 三、信度和效度的关系 1、效度高,信度就高,但反之不一定。2、效度是受信度制约的。,第二单元 效度的评估方法,一、内容效度(逻辑效度)二、构想效度(构思效度、构念效度、建构效度、结构效度)三、效标效度,第三单元 效度的功能,一、预测误差 二、预测效标分数 三、预测效度指数,第四单元 影响效度的因素,一、测验本身的因素 二、测验实施中的干扰因素 三、样本团体的性质 四、效标的性质,提高测量效度的方法(控制随机误差,减小系统误差)精心编织量表,避免出现较大的系统误差。妥善组织测验,控制随机误差。创设标准的应试情境,让每个被试都能发挥正常的水平。选好正确的效标,定好恰当的效标测量,正确使用效度公式。,第五节 项目分析(P 368),2008,项目:测验的题目项目分析的目的:提高测验的信度和效度项目分析的途径 定性分析 定量分析:难度、区分度,第一单元 难度,一、定义 难度是指项目的难易程度,以通过率作为指标,通过率越低,难度越大。二、计算方法 1、二分法计分的项目 2、非二分法计分的项目 三、难度水平 1、项目的难度,取决于测验的目的、性质及项目的形式。2、测验的难度,通常要求满足测验分数呈正态分布。,第二单元 区分度,一、定义 区分度又叫鉴别力,是指测验项目对被试的心理特性的区分能力。良好的区分度能将不同水平的被试区分开来。二、计算方法 1、鉴别指数 2、相关法 三、区分度与难度的关系,第六节 测验编制的一般程序(P 373),2008,第一单元 测验的目标分析,一、测验的对象 二、测验的用途 三、测验的目标,第二单元 测题的编写,一、搜集资料 二、命题的一般原则 三、测题的编制要领,第三单元 测验的编排和组织,一、合成测验 二、预测与项目分析 三、信度和效度考察 四、常模制定 五、编写指导手册,第七节 心理测验的使用(P 382),2008,第七节 心理测验的使用,第一单元 主试的资格第二单元 测验的选择第三单元 测验前的准备及注意事项第四单元 测验实施的程序及要素第五单元 被试误差及控制方法第六单元 测验的评分第七单元 测验结果的报告,