心理咨询师之心理测量学.ppt
心理咨询师之心理测量学,基础考试理论满分为100分。其中心理测量基础约占10-13分。考试以单选和多项选择题为主。单选题约5-8分,多选约5分。,占三级分数:8分12分占二级分数:7分9分,4,一、什么是心理测量,考点,第一单元:心理测量与测量量表,二、,考点,三、测量量表,考点,三、,考点,8,第二单元:心理测量的基本概念,一、心理测量的定义 心理测量,就是依据心理学理论。使用一定的操作程序,通过观察人的少数有代表性的行为,对某些行为活动中的心理特点做出推论和数量化分析的一种科学手段。,心理测量是心理学应用中的一个重要的辅助工具。,考点,二、,1、因为我们无法直接测量人的心理活动,只能测量人的外显行为间接性2、测量结果必需根据一些参照比较来确定测量结果的意义相对性3、测验的标准化,如测验做的项目、评分、分数转换等标准 客观性,考点,考点,11,12,考点,13,考点,15,考点,帮助咨询师在心理咨询中了解来访者心理特性、行为问题及性质得到正确的评估和诊断,以便于提供适当的指导、帮助和行为矫正训练。,16,吴天敏修订的中国比内量表龚耀先等人修订的:韦氏成人智力量表(WAIS-RC)韦氏儿童智力量表(C-WISC)韦氏幼儿智力量表(C-WYC-SI)张厚粲主持修订的瑞文标准测验(SPM)李丹等修订的联合型瑞文测验(CRT),17,目前应用较多的有:艾森克人格问卷(EPQ),卡特尔16种人格因素问卷(16PF),以及明尼苏达多项人格调查表(MMPI)等,18,考点,主要包括:精神病评定量表 躁狂状态评定量表抑郁量表焦虑量表恐怖量表,19,冯特.,高尔顿爵士,考点,高尔登(F.Galton英国)提出人的气质和智能是按身体特点的不同而遗传的.设计了测量遗传差异的方法.这虽不是正式的心理测验,但可视为心理测验的开端.,(一)科学心理测验的产生与发展,21,卡特尔(J.M.Cattell美国)1890年在心理杂志上发表心理测验与测量(心理测验第一次出现在文献中),22,比内(A.Binet法国)极力主张用一种测验的方法去辨别和发现智力落后儿童。他1905年在心理学年报发表的诊断异常儿童的新方法是世界上第一个正式的心理测验。,考点,23,50关于测量正确的说法是()。A测量就是心理测量 B就是依据一定的法则用数字对事物加以确定 C就是用数字来描述事物的法则 D就是用一些题目或数字来描述事物的属性,58错误的测验观不包括()。A测验万能论 B测验无用论C心理测验即智力测验 D测验是辅助工具,单选:,25,77我们通常将学生的考试结果按名次排队,这些名次属于()变量。A命名 B顺序C等距 D等比,59不能把分数(),更不能仅仅根据一次测验的结果轻易下结论。一个人在任何一个测验上的分数,都是他的遗传特征、测验前的学习与经验以及测验情境的函数。A绝对化 B神化 C系统化 D泛化,26,106、按测验的方式分类,可将测验分为()A、操作测验 B、文字测验 C、个别测验 D、团体测验,27,58错误的测验观包括()。A测验万能论 B测验无用论C心理测验即智力测验 D测验是辅助工具,28,58下面属于测量要素有是()。A照点B数字C绝对零点D单位,第一单元 常模团体,常模是一种供比较的标准量数,标准化样本的分数分布,31,常模团体的定义:是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。,(一)常模团体的性质,1.群体的构成必须明确界定2.常模团体必须是所测群体的代表性样本3.样本的大小要适当4.标准化样组是一定时空的产物,考点,包括:确定一般总体、确定目标总体和确定样本。例如,UPI问卷调查 一般总体:大学生 目标总体:大学生心理健康 样本:如新生,35,样本大小要适当:全国性常模一般应有2000-3000人宜。,考点,三、常模的取样方法:,考点,四、常模分数与常模:,38,原始分数与导出分数的区别联系,标准分常模,百分位常模,智商及其意义,发展常模,40,一、发展常模,也叫年龄量表,个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。,41,(一).发展顺序量表(为最直观的发展常模)它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。瑞士心理学家皮亚杰的关于儿童认知过程的发展理论。,考点,基础年龄与在较高年龄水平的题目上获得的附加月份之和。将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。(考点)智龄计算:1.比内-西蒙量表中产生使用智力年龄概念 2.原始分数和年龄常模比较,考点,年级当量即年级量表。个体分数与年级常模比较年级量表的单位通常为10个月间隔。,总结:发展常模,发展顺序量表,以儿童发展顺序为标准,如:葛赛尔强调早期行为的发展有规律,来说明发展的规范性和行为变化的顺序性。,智力年龄,比内-西蒙量表中首先使用。以年龄段来确定智力水平的一种标准。,年级当量,年级量表,如考试测验。,也叫年龄量表,个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。,二、百分位常模,(一)百分等级,考点,个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低。,常模样本中低于这个分数的人数的百分比。,(二)百分点也叫百分位数。,考点,百分点是计算处于某一百分比例的人对应的测验分数是多少。,(三)四分位数和十分位数。,四分位数是将量表分成四等分如:25%十分位数也以此类推。,三、标准分常模,考点,各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。因此,标准差也是一种平均数。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。,50,考点,51,由测验直接得到的分数属于顺序数据,不能作进一步的运算,为了充分利用测验所得到的信息,就有必要对原始分进行某种处理,使之成为等距数据。,(一)线性转换的标准分数,X任一原始分数,为样本均数,SD为样本标准差。,例:,Z分数公式:,考点,53,z分数包含了比原始分更多的信息。比如,如果只知道某一学生考试得了87分,考试的题目的难度?学生的现有知识水平?以及评分标准都会影响到学生的得分?87可以说很高,也可以说很低;Z分数可以说明学生这次考试是低于平均分还是高于平均分以及在全班(或者总体)的一个什么位置。,54,Z=A+Bz,另:,公式:,考点,加一个常数 A 乘一个常数B。,常见的标准分有:,T分数、标准九分数、标准十分、标准二十分、离差智商(IQ),T分数:,T=50+10z,当以50为平均数,以10为标准差,求T分数:,公式:,考点,常态化标准分数,标准分数=平均分数+标准差XZ,离差智商,标准九分,标准十分,标准二十分,标准九分:量表是9个级的分数量表,以5为平均数,以2为标准的分数量表。,标准十分:平均数为5.5,标准差为1.5,标准二十分:平均数为10,标准差为3,5+2z,5.5+1.5z,10+3z,考点,离差智商:平均数为100,标准差为15,步骤,(二)非线性转换的标准分数,区别曲线性转换所求得的Z分数,四、智商及其意义,(一)比率智商:,比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。为了避免小数,将商数乘以100:,公式:,考点,1916年斯福坦大学推孟(Term an)教授,不足:比率智商不适合年龄较大的被试,且相同的比率智商在不同年龄也具有不同的意义。,(二)离差智商:,一种以年龄组为样本计算而得到的标准分数,是建立在统计学基础之上的。(P343),公式:,韦克斯勒,一、转换表法也叫常模表,某项测验的百分等级和T分数转换表,二、剖面图法,51系统抽样法的关键是计算()。A样本量 B总体 C随机数 D组距,64,52百分等级55的分数表示在常模样本中有55%的人比这个分数()。A低B相等C高 D以上都不正确,65,60Z=A+BZ式中Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉(),乘以一个常数是为了使单位变小从而去掉小数点。A整数 B小数 C负值 D分值,66,61标准十分,平均数为(),标准差为()。A6:2 B5.5:1.5 C6:1.5 D7:1.5,67,34以50为平均数、以10为标准差表示的标准分数叫()。A标准九分数BT分数 C离差智商 DZ分数,68,107百分位常模包括()。A百分等级 B百分点 C四分位数 D十分位数,69,105标准分数可以通过()得到。A线性转换 B非线性转换 C分析 D变化,71,第三节 测验的信度,第一节 信度的概念,考点,一、信度定义,被测在不同时间内用同一测验(或用另一相等的测验)重复测量。所得结果的一致程度。,即一个测验的稳定性、一致性。,73,信度只受随机误差的影响。随机误差越大,信度就越低。,X=T+E,测验实得分数(X)总是由真实分数(T)和误差(E)两部分构成的如上图公式。,二、信度的指标,75,信度系数:,信度是以信度系统为指标,它是一种相关系数常常是同一被试样本所得的两组资料的相关。即真分数方差与实分数的方差的比值。,76,测量标准误分数的变异量,测量的标准误与信度之间有互为消除的关系:信度越高,标准误越小;信度越低,标准误越大.,SE为测量的标准误,是所得分数的标准差。,考点,一、重测度-也叫稳定性系数 同一测验对同一组被试的先后两次测量之间的相关。,优点:在于能提供有关测验是否随时间而变异的资料,可作被试将来的行为依据缺点:易受练习和记忆的影响。,时间间隔,施测,再测,相关系数,考点,二、复本信度,优点:能够避免重测信度的一些问题。缺点:1.如果测量行为受影响,复本信度只能减少而不能完全消除。2.由于第二个测验只改变了题目内容,已经掌握的解题原则,可以很容易地迁移到同类问题。,考点,又称等值性系数,两个内容、结构相同的测验对同一组被试测量结果的相关,NEXT,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,BACK,三、内部一致性信度,主要反映的是题目之间的关系表示测验能够测量相同内容或物质的程度。,斯皮尔曼-布朗公式为检验公式。它的假设条件是两半测验分数的变异数相等。,考点,83,1、分半信度,一种测验形式,实施一次测验,在测验后按不同方式分为等值的两半,分别计算得分,示两个半分数的相关数。,2、同质性信度,也叫内部一致性,指测验内部所有题目间的一致性。,考点,四、评分者信度,(一)解释真实分数与实得分数的相关(二)确定信度可以接受的水平(三)解释个人分数的意义(四)比较不同测验分数的差异,86,信度的意义,(一)解释真实分数与实得分数的相关 信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异(总方差)中真分数造成的变异占百分之几。例如,rxx=0.90时,即实得分数中有90%的变异是真实分数造成的,误差造成的只占10%。rxx=1时,表示没有测量误差。值得注意的是,信度系数的分布是 0.001.00的正数范围,表示信度缺乏完全可信。,(二)确定信度可以接受的水平 1.当rxx0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70rxx0.85时,可用于团体比较;当rxx0.85时,才能用来鉴别或预测个人成绩或作为。2.新编的测验信度应过于原有的同类测验或相似测验.,(三)解释个人分数的意义 其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。,信度在评价两个不同测验的分数是否有明显差异时起着非常重要的作用。两个不同测验的分数:两个人不同分数的差别同一被试在两个测验上的差别。,时间间隔,一、样本特征-也叫被试的特征,考点,二、测验长度,注意事项:,以重测法或复本法求信度,两次测验相隔时间间隔时间越久,其他变因介入的可能性越大,受外界影响也越大,信度系数便越低。,三、测验难度,测验太难或太易难以测出个体差异,从而降低信度。,四、时间间隔,54同质性信度主要代表测验内部()间的一致性。A两半测验 B题目与分测验 C所有题目 D分测验,97,78.()是指同一被试在不同时间内用同一测验(或用另一套相同的测验)重复测验,所得结果的一致程度。A信度B效度 C难度 D区分度,98,59、信度只受()的影响 A、系统误差 B、随机误差 C、恒定效应 D、概化理论,99,35以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越()。A大 B低 C小 D不确定,100,102使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分之间的相关系数,叫(),又称()。A复本信度 B重测信度 C稳定性系数 D分半信度,102,1、测验本身的因素2、测验实施中的干扰因素3、样本团体的性质4、效标的性质,1、效度的通俗定义所测量的与所要测量的心理特点之间符合的程度,简单说是测量的准确性。,103,效度是科学测量工具最重要的必备条件。,考点,测量的效度除受随机误差影响外,还受系统误差影响。可信的测验未必有效,而有效的必定可信。信度是效度的必要条件。,104,105,1、相对性,性质,2、连续性,考点,1.效度具有相对性 任何测验的效度都是针对一定的目标而言。(指测量什么有效或没效)2.效度具有连续性 只有程度上的不同,没有“全有”或“全无”的区别。(有效度较高或较低)测验效度是测验结果的有效性程度,106,1、信度是效度的必要而非充分条件。信度高,效度就高。效度高,信度不一定高。2、效度是受信度制约的。评价效度的前提是信度一定要稳定。,108,第二单元 效度的评估方法,1、定义:指测验题目对欲测内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样,考点,明确概念;划定行为;查阅资料;方法:观察法与访谈法取样要有代表性同质问题(强调同质的量表与不必强调同质的量表),109,2、确定内容效度的方法,请专家看测验题目,专家判断法,统计分析法,经验法,以下面两种方法评价两者的一至性,通过实践来检验,考点,内容效度与所有效度一样,并非普遍适用。只有编制者与使用者定义的内容范围相同,编制者报告的内容效度对使用者才有意义。内容效度也有时间上的特定性。内容效度(专家的评价)与表面效度(外行对测验的检查)不同。,111,1、定义:指测验对理论上的构想或特质的测量程度。,又称:结构效度。,考点,即测验的结果是否能证实或解释某一心理理论的假设、术语或构思,解释的程度如何。,1、对测验本身的分析,2、测验间的相互比较,检验内法,同质性法,考点,3、效标效度研究发明,4、实验法和观察法,通过研究测验内部结构来界定理论构想,从也提供构思效度的证据。有时候分析被试者对题目的反应特点也可以作为构思效度的证据。,考点,通过分析几个测验间相互关系,找出其共同之处,进而推断这些测验测量的特质是什么,也可以确定这些测验构思效度如何。相容效度(成熟测验与研究测验的相关)是构思效度的一个证据。区分效度(测验此有效必然测验彼无效)是构思效度的又一个证据。因素分析法也是建立构思效度的常用方法。,检验一个测验的的效度效度也能推断出构思效度的指数。,观察实验前后分数的差异程度。,1、定义:什么是效标效度?,118,测验测个体在某种情境下行为表现的有效性程度,被预测的行为是检验测验效度的标准,简称效标,也叫实证效度。,指一个测验对处于特定情境中的个体的行为进行预测时的有效性。,考点,效标资料是否与测验同时获得,分为 同时效度:如智力测验以学业为效标 预测效度:职业测验以职业能力为效标,119,例如:高三模拟考试,果然能恰当地反应大学联考成绩,说明此模拟测验效度预测效度好。用大学入学成绩预测大学生的学习成绩用职业测验预测工作能力用人格测验预测哪种人容易得精神病等,第一.效标本身必须有效;第二.效标必须具有较高的信度,不随时间等因素而变化;第三.效标可以客观地加以测量,可用数据或等级来表示;第四.效标测量的方法简单,省时省力,经济实用。,121,考点,考点,总命中率与正命中率一般情况下完全一致,正命率高低常随划分测验分数成功与失败的临界分数的高低而变化。,二、预测效标分数常用的是Y对X的回归方程,可以从一个变量推估出另一个变量。三、预料效率指数 预测效标指数的大小表明使用测验比盲目猜测能减少多少误差,126,(一)测验本身的因素为了提高效度,要做到:1.测验材料必须对整个内容具有代表性;2.测题设计时应尽量避免容易引起误差的题型(如是非题);3.测题难度要适中,具有较高的区分度;4.测验长度要恰当,即要有一定的测题量;5.测题的排列按先易后难顺序。,1.主试的影响因素 主试不符合标准化要求的任何做法2.被试的影响因素 兴趣、动机、情绪、态度和健康状况等。,127,考点,1.样本团体的异质性 异质性越高,分数分布范围大,测验效度越高。,128,2.干涉变量 包括年龄、性别、教育水平、智力、动机、兴趣、职业等。,效标与测验分数之间是否呈线性关系(一次函数关系)是很重要的因素。效标测量本身的可靠性如何亦是值得考虑的问题。如果效标测量的信度不可靠,它与测验分数之间的关系也无可靠性可言。,129,考点,1、测验本身因素2、测验实施中的干扰因素(主试和被试)3、样本团体的性质(异质性和干涉变量)4、效标的性质,75()指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。A内容效度 B构想效度C效标效度 D区分效度,64()是检验测验分数能否有效地区分由效标所定义的团体的一种方法。A相关法 B区分法 C命中率法 D失误法,102效度具有相对性,因此在评鉴测验的效度时,必须考虑测验的()。A信度 B目的 C功能 D长度,103内容效度的评估方法包括()。A专家判断法 B双向细目表法 C统计分析法 D经验推测法,105构想效度的估计方法包括()。A对测验本身的分析 B测验间的相互比较 C效标效度的研究证明 D实验法和观察法证实,104影响效度的因素包括()。A主试者的影响因素 B测验本身C样本团体的性质D测验实施干扰因素,138,一、难度的定义:难度(Difficulty)就是指项目的难易程度。,139,考点,难度的指标通常以通过率表示 注:P为通过率;N为全体被试者人数;R为通过人数.P值与难度高低成反比,(1)二分法记分的项目二分法记分:选择题,通过记2分,错误记0分.一般可直接用通过率计算难度.(2)非二分记分的项目当测验项目不能用二分法记分时,可用下面的公式计算难度注:全体被试的平均分,X max为满分.,(一)、项目难度:P值直接于0或接近于1,越无法区分被试间能力的差异。相反,P值越接近于0.50,区别力越高。,考点,选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.500.20之间。,考点,第二单元 项目的区分度一、定义:项目区分度也叫鉴别力是指测验项目对被试的心理特性的区分能力。如果一个项目,实际水平高的被试能顺利通过,而实际水平低的被试不能通过,则认为该项目具有较高的区分度。,考点,二、计算方法,144,(1)鉴别指数步骤:1、按测验总分的高低排列答卷2、确定高分组与低分组,每一组取答卷总数的27%3、分别计算高分与低分组在该项目上的通过率或得分率。4、按公式估计出项目的鉴别指数,某一项目分数与效标或测验总分的相关作为该项目区分的指标,相关越高,表明项目越具有区分功能。,考点,假如样本中通过某一项目的人数比率为1.00或0,则说明高分组与低分组在通过率上不存在差异,因此D为0.假如项目通过率为0.50,则可能高分组的所有人都通过了,而低分组却无人通过,这样D的最大值可能到1.00,难度,区分度,考点,74为了使测验具有更大的区别力,应该选择难度在0.50左右的试题比较合适。各题难度在()之间。A0.500.10B0.500.20C0.500.30 D0.500.40,55项目的难易程度,用P表示。P值越(),难度越低。A大 B低C小 D接近于0,正偏态分布,负偏态分布,153,153,154,题目来源,156,考点,考点,79测验编排的一般原则()。A难度逐步上升,先易后难B将同类型的测题组合在一起C答案混合排列D依各种类型测题本身的特点编排题目与选项,103多选:测题常见的排列方式有()。A并列直进式 B公共汽车式 C混合螺旋式 D专列式,159,160,包含技术和道德两方面的要求:,考点,测验中个人隐私的保护,2、职业道德,非对个人或社会可能造成危害的情况下,均需保密。,考点,注意两个方面:所选测验必须符合测量的目的所选测验必须符合心理测量学的要求,162,163,1、指导语,164,考点,165,2、时限,3、测验的环境条件,167,一、原始分数的获得(三点要求)及时而清楚地记录反应情况。要有记分键。将被试的反应和记分键比较,对反应进行分类。,168,二、原始分数的转换导出分数:经过处理和对照参照标准得来的分数就是导出分数。发展分数、百分位数、标准分数等都是导出分数,169,一、分数综合分析1、分数范围化应把测验分数视为一个范围而不是一个确定的点。2、不能绝对化不能把分数绝对化,更不能仅仅根据一次测验的结果轻易下结论。一个人在任何一个测验上的分数,都受到他的遗传特征、测验前的学习与经验及测验情境的影响。,考点,3、确切解分数为了对测验分数作出确切的解释,只有常模资料是不够的,必须有测验的信、效度资料。4、分数比较对于来自不同测验的分数不能直接加以比较。为了使不同测验分数可以相互比较,可把两种测验的原始分数都换算成百分等级,以百分等级为中介,做出一个等价的原始分数表。或采用线性等值的方法,用相同的标准分数作等值的基础。,二、报告分数的具体建议1、分数保密性不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议2、解释通俗化避免使用太专业术语。,3、结果预期性要保证当事人知道这个测验测量或预测什么。4、明确比较要使当事人知道他是和什么团体在进行比较。,6、结果影响要考虑测验分数将给当事人带来什么心理影响。7、被试认同要让当事人积极参与测验分数的解释。,107.测验指导语一般由()组成。A.如何选择反应形式B.如何记录这些反应C.时间限制D.给例题,有时告知被试测验目的。,