资料-戴海崎心理与教育测量第4版知识点.docx
第1章心理与教育测量概论一、一般测量概述(一)测量及其种类1.测量的定义测量是指依据一定的法则使用量尺对事物的属性进行定量描述的过程。这一定义包含四个关键词:(1)”一定的法则、是指任何测量都要建立在某种科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。(2)“事物的属性”,是指所要测量的客体或事件的特定特征。(3)',量尺”,是指测量中所使用的度量工具。(4)“定量描述是指测量的结果总是对事物属性的量的确定。“数量”不仅指描述事物特征的符号,而且指一种有序的量。数量具有四个特性:区分性、序列性、等距性、可加性。2 .测量的精确度测量的精确度既与测量对象的性质有关,也同测量时所用的工具有关。(1)测量的精确度决定于测量对象本身的性质。可根据测量对象的性质把它分为三种类型:确定型、随机型、模糊型。(2)测量的精确度决定于测量工具(量尺)的精密性。尽可能使用精密的测量工具,是保证测量精确度的重要条件。3 .测量的分类根据测量对象的性质和特点,测量大致可分为以下四种类型:(1)物理测量:即对事物的物理特征的测量。(2)生理测量:即对机体例特征的测量。(3)社会测量:即对社会现象的测量。(4)心理测量:即对人的心理特征的测量。(二)测量的基本要素一个完善的测量数量必须具备两个基本要素,即测量的参照点和测量的单位。1 .测量的参照点(1)参照点的定义测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。(2)参照点的分类绝对参照点,即以绝对的零点作为测量的起点。相对参照点,即以人为确定的零点作为测量的起点。(3)参照点的常见使用情形最为理想的测量参照点当然是绝对参照点,因为它的意义最为明确。在人们难以找到绝对参照点的情况下,就必须改用相对参照点。这种情况是很常见的。2 .测量的单位理想的测量单位必须具备两个条件:(1)具有确定的意义,即对同一单位,所有人的理解都是相同的,不允许做出不同的解释。(2)具有相等的价值,即第一个单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。(三)测量的量表量表是指能够使事物的特征数量化的数字连续体。斯蒂文斯根据测量中使用的不同参照点和单位,区分出四种不同水平的测量量表:1 .称名量表称名量表只是用数字代表事物的成分或用数字对事物进行分类。称名量表又可细分为两种形式:一是命名量表;二是类别量表。适合对称名量表进行统计分析的统计方法有百分比、次数、众数和?检验。2 .顺序量表顺序量表中的数字与实数轴中的数值具有相同的顺序性,即不同的数字可表示测量对象的等级、大小和程度的差异,但它既没有相等距离的单位,也没有固定的测量原点。换言之,它既不表示事物特征的真正数量,也不表示绝对的数值,因此不能进行代数运算。适合于对顺序量表进行统计分析的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。3 .等距量表等距量表不仅能够指代事物的类别和等级,而且具有相等距离的测量单位。等距量表的数字是一个真正的数量,这个数量中各个部分的单位是相等的,因此就可以对其进行加减运算。等距量表没有绝对的零点,它的零点是人为假定的相对零点。适合于对等距量表进行统计分析的统计方法有平均数、标准差、积差相关系数、等级相关系数以及I检验和"佥验。4 .比率量表比率量表是最完善的测量量表,因为它除了具有类别、等级和等距的特征外,还具有绝对的零点或固定的原点。适合于对比率量表进行统计分析的统计方法除了与等距量表相同的之外,还有几何平均数、变异系数等。二、心理与教育测量的性质(一)心理与教育测量的定义心理与教育测量是指依据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。理解这一概念需要注意的是:L心理与教育测量依据的法则在相当程度上是一种理论,很难达到如同物理测量依据的法则那样普遍被研究者共同接受的科学水平。2心理与教育测量的对象是人的心理特质和教育成就。3 .心理与教育测量的量尺是由有关领域的专家经过长期的编制、试用、修订、完善而逐渐形成的标准化测验,它的编制是一项高度专门化的系统工作,要达到科学所要求的水平绝非易事。4 .心理与教育测量的目标虽然是对人的心理特质和教育成就进行定量分析,但这种定量分析的精确度远不及物理测量的精确度。(二)心理与教育测量的理论基础1 .两个著名的命题1918年,桑代克曾提出:“凡客观存在的事物都有其数量二1939年,麦柯尔进一步指出:“凡有其数量的事物都可以测量二这两个命题被公认为是心理与教育测量的理论基础。2 .心理与教育测量的必要性与可能性(1)人的心理特质和知识水平如同其他一切物理现象一样是有差异的,这种差异不仅包含质的方面,而且包含量的方面。因为有差异,所以有必要测定差异的数量,描述差异的程度。(2)心理特质和知识水平虽然不能直接测量,却必然要表现于人的外部行为之中,并调节着人的外部行为。因此,通过观测人的外部行为的差异,就有可能测量出人的心理特质和知识水平的差异。(3)心理与教育测量的准确性、可靠性和精确度如同其他一切测量技术一样是相对的,也同其他一切测量技术一样,必然随着科学技术的进步和发展而逐步提高。(三)心理与教育测量的量表从本质上讲,心理与教育测量的量表属于顺序量表。这是因为一方面教育测量和心理测量领域的参照点均为相对参照点,另一方面教育与心理测量的单位远没有其他测量的单位成熟和完善。在实际研究中,为了克服大量统计分析方法不能应用到顺序量表的分数上的缺陷,通常将顺序量表上得到的分数转化到等也巨量表上去解释。(四)心理与教育测量中的测验美国心理测量学家安娜斯塔西认为,“心理测验实质上是对行为样本的客观的和标准化的测量。''根据这一定义,编制一个测验应当具备下列四个基本条件:1 .行为样本测量学家对心理特质的测量取样做法是从人的大量行为中抽取与欲测量的心理特质直接相关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质和教育成就。那些可供实现行为抽样的所有行为的总体成为行为域,从该行为域中被抽取出来的、作为直接测量对象的行为样例就是行为样本。2 .标准化(1)标准化是编制测验的一个重要步骤,也是测验的重要条件。为了使接受测量的不同个人所获得的分数有比较的可能性,测验的条件必须对所有的个人都是相同的。(2)测验的标准化就悬测验的编制、实派记分以及测量分数的解释的程序的一致性。测验的标准化需要具备下列要件:测验内容的标准化、施测条件的标准化、评分规则的标准化、测验常模的标准化。3 .难度或应答率(1)在编制教育成就测验和各种形式的能力测验时,一个很重要的指标是确定项目的难度值。测验项目是按照其难度值由简单到复杂编排的,而项目难度是通过计算答对某一项目的被试人数比例来确定的。(2)编制诸如态度测验、兴趣测验、性格测验不存在难度问题,但存在对项目的应答率问题。4 .信度和效度(1)信度是指一个测验的可靠性,即用同一测验多次测量同一团体,所得结果之间的一致性程度。信度是衡量测验科学性的最基本的指标。(2)效度是指f测验的有效性,即一个测验在多大程度上能够测到它所要测量的心理特质。效度是衡量测验科学性的最重要的指标。三、心理与教育测验的种类及其功能(一)心理与教育测验的种类1 .基于测量对象的分类(1)智力测验:旨在测量个人的智力(一般认知能力)水平的高低。这是心理测量最早涉及的领域,也是目前发展得相对成熟的一种测验。国内外比较著名的智力测验有斯坦福-比内量表、韦克斯勒智力量表、瑞文推理测验等。(2)能力倾向测验:旨在测量个人潜在的才能,预测个人的能力发展倾向。能力倾向测验T可分为两种:一般能力倾向测验和做能力倾向测验。(3)成就测验:旨在测量个人在接受教育后的学业成就。成就测验有两种类型:学科成就测验和综合成就测验。(4)人格测验:旨在测量个人在诸如兴趣、态度、动机、气质、性格等方面的心理特征。人格测验又主要分为自陈人格问卷和投射测验。2 .基于测量方式的分类(1)个别测验个别测验是指同一主试在同一时间内只能测量一个被试的测验。优点a.主试可对被试的做题行为仔细观察,有机会获得测量分数之外的信息;b.主试与被试面对面交流的机会更多,容易与被试建立起融洽的合作关系;c.对于一些特殊被试(如幼儿、文盲),只能采用个别测量,以便主试代替被试记录其行为反应。缺点a.费时间,难以在短时间内收集大量的测量资料;b.测验手续比较复杂,需由具有较高水平的人担任主试。(2)团体测验团体测验是指同一主试在同ft间内能够测量许多被试的测验。团体测验可用于个别测量,但个别测验不能用于团体测量。优点:节省时间,可以在短期内收集到大量的测量数据。缺点:由于同一时间内接受测的被t赧多,不易有效地控制被试的行为,容易产生测量误差,从而影响测量的信度和效度。3 .基于测验内容表达和反应形式的分类(1)文字(纸笔)测验:是指有些测验的内容是通过文字的形式表现的,被试也用文字作答的测验,又称纸笔测验。具优点为实施起来比较方便,团体测验多采用此种方式编制。其缺点为容易受被试的文化背景的影响,从而降低测验的效度。(2)非文字(操作)测验:是指有些测验的内容是通过图形、仪器、工具、实物、模型等形式表现的,被试通过指认、手工操作向主试提供答案的测验。其优点为不受或很少受文化背景的影响,在“文化公平测验”时常采用这种方式。同时,也适用于测量学前儿童及文盲的心理特质。其缺点为非文字测验常局限于个别测量,在时间上不经济。有些测验(如“斯坦福比内量表2韦克斯勒智力量表”)既包含文字测验的项目,也包含非文字测验的项目。4 .基于测验功能的分类(1)成就测验与预测测验:成就测验的目的是测量个人在某一领域已经达到的实际成就。而预测测验的目的在于测量个人未来在某一方面获得成功的可能性。(2)难度测验与速度测验:难度测验的功能在于识别个人能够达到的最高水平。速度测验的功能在于识别个人做题的最快速度。(3)描述测验与诊断测验:描述测验的功能在于通过测量来描述某一特定群体在某一心理特质上的一般状况。诊断测验的功能是对个人的问题行为及其原因进行诊断。(二)心理与教育测验的价值和作用1 .理论研究功能收集研究资料、建立和检验理论假设以及实验分组。2 .实际应用功能人才选拔、人员安置、心理诊断、描述评价以及心理咨询等。四、心理与教育测量工作者的素质要求及道德准则(一)心理与教育测量工作者的素质要求L心理与教育测量工作者的知识结构(1)心理与教育测量工作者可分为两个不同的层次:专业研究工作者、实际应用工作者。(2)心理与教育测量工作者应当具备相应的基础知识和专业知识有:基5蜘识包括:普通心理学、发展理学、教育心理学等广泛的心理学基本知识;才噌的心理与教育统计学的基本知识;教育学的基本知识。在专业知识方面,除了精通人格理学、智力心理学、变态心理学、心理与教育测量的原理与技术等具有核心地位的专业知识外,还应根据自己的工作领域具备相应的其他专业知识。3 .对心理与教育测验的科学态度(1)心理测验方法既受到心理实验方法的影响,又是对实验方法的有益补充,尤其是在研究人的较为复杂和高级的心理现象(如智力和人格)中。(2)心理与教育测验无论在理论上还是在技术上都存在不少问题。心理与教育测量工作者要认识到:心理与教育测验是从事理学景育学研究的一种重要方法,也是解决实际应用问题的一种重要的辅助工具;充分考虑到目前的心理与教育测验的科学性还不够高,有待于在使用过程中进一步改进和完善。(3)测验起源于对个别差异的测量,但测验方法不是鉴别个别差异的唯一方法。(4)在运用测验解决实际问题时,使用者应当记住测量结果(分数)只是对人的智力和人格的相对估计,而不是一个十分精确的数值。(二)心理与教育测量工作者的职业规范和道德准则心理与教育测量工作者应自觉遵守中国心理学会发布的心理测验管理条例和心理测验工作者职业道德规范。1 .测验的保密和控制使用(1)对心理与教育测量工具需要保密,对测验的占有范围需要控制;(2)对测验的控制使用,是指并非所有的人都可以接触和使用测验,测验的使用者必须是经过专业训练和具有一定资格的人员。2 .测验中个人隐私的保护在测验工作中,尤其是人格测验工作中经常遇到的一个不可忽视的问题是侵犯受测者的个人隐私问题。为此,测验工作者应当采取适当的保护措施:(1)只有在必要的情况下,测验工作者才能询问个人的隐私,凡是与测验目的无关的方面就不应涉及;(2)保证为受测者保密,并在实际上为受测者严守秘密;(3)凡必须涉及个人隐私的测验应事先征得受测者本人或其他有关人员的同意。第2章心理与教育测量简史一、中国古代的心理与教育测量(一)能力测量1.孔子在教育实践中凭借自己的经验观察首先评定学生能力的个别差异,并将人的智力分成三个等级,即中上之人、中人和中下之人。2汉代学者董仲舒说过:“一手画方,一手画圆,莫能成。”这大概是世界上最早的心理(注意)测验。3.三国时期刘邵的人物志可以认为是一部研究能力(也包括性格)的专门著作。4.6世纪中叶,中国江南地区就流行着一种类似于现在的婴儿发展测验的“周岁试儿”习俗。5.盛行于清代的益智图(俗称七巧板)、九连环可以认为是最早的智力和创造力测验。(二)人格测量1.孔子提出了性格类型的观点,把人分成3种:狂者(以积极进取、敢作敢为为特征)、狷者(以拘谨胆怯、唯唯诺诺为特征)和中行者(介于狂者与狷者之间,不偏不倚)。2刘邵根据阴阳、五行(木、金、火、土、水)和形体(骨、筋、气、肌、血)的关系以及人的行为表现,把人的性格划分成12种类型。(三)教育测量1.世界上最早的教育测量出现于中国西周奴隶制时期。礼记学记记载,在西周的“国学”中已经建立了相当系统的教育测量制度。2汉代在考试制度、考试类型和考试功能方面都作了重要的发展。3.除了学校内部测量的自身发展以外,取士制度自汉以来的发展,客观上也对我国的古代乃至于西方的教育测量发展起到了促进作用。(四)对测验理论的最初探索1.大思想家孟子就指出了测量人类心理的必要性和可能性。他说:“权,然后知轻重;度,然后知长短。物皆然,心为甚。”2刘邵曾对人才鉴定的意义、可能、困难和方法作了系统的论述。刘邵认为,人才鉴定对于知人善任、振兴国家事业具有重要意义。3.中国古代社会的心理与教育测量思想的几个重要特点:描述性的,而非定量的;分类式的;注重对人作整体的鉴定和评价,并倾向于和人的道德品质联系起来;与教育中的因材施教及人才使用有着密切的联系,它一开始就具有强烈的应用性质。二、现代心理与教育测量在西方国家的产生和发展(-)现代心理与教育测量的起源1 .承认人的个别差异及其对个人行为的重要影响是开展心理与教育测量工作的基本前提。2 .促使产生心理与教育测量技术的最重要因素是社会发展的需要。(1)法国医生沈干开始训练智力落后儿童,并于1837年创办了第一所专门教育智力落后儿童的学校。他著作中的一些内容现已转化为能力操作测验的组成部分。(2)19世纪,出现了一些医院专门护理和医治精神病人,客观上要求确定鉴别各种心理疾病的统一标准。(3)随着工业技术的深刻变革,社会分工的日益精细,对劳动力能力的要求日益严格,社会上产生了对职业选拔和训练的需要,这也是促成心理与教育测验出现的因素。(二)心理与教育测量的早期探索1 .高尔顿(1)弗兰西斯高尔顿是英国优生学的创始人,他对现代心理与教育测量的产生起过直接推动作用。他提出人的能力是由遗传而来的,并设想不同人的能力水平的分布是正态的,其差异是可以测量的。(2)高尔顿在他的实验室里发明了许多测量仪器,如用于测量长度视觉辨别的高尔顿棒、用于测量听力的高尔顿笛,其中有些仪器到现在仍然有效。他还是应用评定量表、问卷法及自由联想法的先驱。(3)高尔顿在心理与教育测量史上最重要的贡献之一,是把统计方法应用到对个别差异资料的分析之中。他扩充了百分位法,创造了一种简单的计算相关系数的方法。其中后者被他的学生皮尔逊所继承和发展,创立了积差相关公式,成为当今测量学上应用最为广泛的统计工具之一。2 .卡特尔(1)卡特尔是美国心理学家,1890年在心理杂志发表心理测验与测量一文,首次提出了“心理测验”这个术语,并报道了他所编制的一套能力测验在大学生身上的应用结果。(2)卡特尔认为,心理学只有立足于实验与测量,才能达到如同自然科学的准确性;心理测验只有建立普遍的统一标准,并要与常模相匕瞰,才能充分地实现其科学价值和实用价值。这些观点都已成为测量学上的重要观念。3 .比内(1)比内1886年出版他的第一部著作推理心理学,1889年与亨利博尼在索那建立法国第一个心理实验室,1891年出版人格心理学一书,1895年创办法国心理学杂志心理学年报,同年与亨利联名发表文章,批评当时流行的测验偏重于简单感觉,不能测出真正的智力。(2)比内认为,测量比较复杂的心理功能,不必苛求精确度,因为这些功能的个别差异较大。1903年,比内的另一部著作智力的实验研究问世,提出了智力的定义,认为智力是高级心理过程,包括推理、判断以及动用已知知识解决新问题的能力。(3)比内与其助手西蒙合作完成了世界上第一个智力测验量表比内-西蒙智力量表。并于1905年,在心理学年报上发表的诊断异常儿童的新方法一文中介绍了该量表,史称1905年量表。(三)心理与教育测量运动的发展1 .智力测验的发展(1)美国斯坦福大学推孟于1916年修订完成斯坦福-比内量表。其中影响最为深远的变动是推孟采用了比率智商的概念来表示智力水平的高低。(2)随着智力测验的发展和统计学的进步,对智力本质及其结构的统计学研究应运而生。英国心理学家斯皮尔曼首先运用因素分析方法研究智力结构,提出智力结构的“二因素理论”,为编制新的智力测验奠定了理论基础。(3)20世纪30年代以后,英国心理学家瑞文针对斯皮尔曼的“G”因素相继编制了瑞文标准推理测验、瑞文彩色推理测验、瑞文高级推理测验。(4)从20世纪40年代末开始,美国心理学家韦克斯勒也相继编制了韦克斯勒儿童智力量表(1949)、韦克斯勒成人智力量表(1955)和韦克斯勒幼儿智力量表(1967)。韦克斯勒在智力测验方面的最重要贡献是:他舍弃了比率智商,而用离差智商代之,从而克服了比率智商的局限。嬲制的智力量表分为言语量表和操作量表两部分,不仅能够获得总体智力水平的信息,而且可以获得受测者智力优势的信息。2 .能力倾向测验的发展(1)从20年代开始,人们着手编制特殊能力测验。最初被称为“学业能力倾向测验”,后来进一步扩展,这些测验包括音乐、文书、机械和艺术等强调特殊能力的领域。(2)在编制成套能力倾向测验的过程中,因素分析方法起了重要的作用。3 .成就测验的发展(1)桑代克编制了第一个标准化的教育成就测验,他被公推为教育测量的鼻祖。(2)1923年,凯困、鲁奇和推孟合作编制了第一个成套成就测验斯坦福成就测验。该测验的一个显著特点是能够对不同学科的测验成绩进行比较。(3)20世纪30年代后期,在美国出现了跨州、跨区域乃至全国性的测验机构。如“大学入学考试委员会“(CEEB)、教育测验服务中心”(ETS)等。(4)成就测验不仅用于教育领域,而且被广泛地应用于工业企业的人事任用和政府公务员的选拔。4 .人格测验的发展人格测验涉及广泛的方面,如情绪、动机、兴趣、态度、气质、性格等。(1)最早进行人格测量的是克雷培林,他最早用自由联想法诊断精神病人。此后,自由联想技术一直是用来诊断人格障碍的一种方法。(2)20世纪初叶,出现了自陈人格问卷。1917年,美国心理学家武德沃斯用自陈问卷法编制了适用于诊断士兵神经症的个人资料调查表。美国的卡特尔编制帅卡特尔16种人格问卷二英国的艾森克编制成“艾森克人格因素问卷美国明尼苏达大学的哈撒韦和莫肯利编制成呻月尼苏达多相人格调查表二(3)人格测量的另一种重要的技术是投射测验。1910年,瑞士精神医学家罗夏克创立了罗夏克墨迹投射测验。哈罗尔在第二次世界大战期间编制了以团体方式实施的墨迹测验。霍兹曼也编制了墨迹测验,且有复本,每套由45张墨迹图组成。莫瑞和摩根编制的著名的主题统觉测验(TAT)也是投射测验的一种,其他如句子完成测验、情境对话测验、画人测验等也属于投射测验。(四)心理与教育测量的当代趋势心理与教育测量学界出现了一些新的动向,表现在以下三个方面:1 .由于信息加工心理学的兴起,测量学界倾向于将实验法和测验法相结合,产生了信息加工测验。2 .由于计算机技术的迅速发展,传统的纸笔测验逐渐被电脑程序测验所取代,从而大大提高了测验的效率。3-针对经典测量理论(即真分数理论)的某些缺陷,提出了一些新的测量理论,尤其是项目反应理论和概化理论。三、现代心理与教育测量在中国的发展(-)现代心理与教育测量在1949年以前的发展1 .20世纪20年代初心理与教育测量的发展(1)1917年,樊炳清首先向同仁介绍了比内-西蒙智力量表。(2)1918年,俞子夷编制的小学生毛笔书法量表可视为我国最早的新式教育测验。(3)192()年,廖世承和陈鹤琴在南京高等师范学校率先开设心理测验课程。1921年,廖、陈二人出版心理测验法。(4)1921年,费培杰将比内-西蒙智力量表译成中文。(5)1921年,中华教育改进社邀请美国测量学家麦柯尔来华讲学,并指导师生编制测验。2 .在智力测验方面(1)1924年,陆志韦根据中国南方的测验结果发表了订正比内-西蒙智力测验说明书。(2)1936年,陆志韦和吴天敏合作,将测验范围扩大到北方,作了第二次修订。(3)廖世承编制了团体智力测验,陈鹤琴编制了图形智力测验,刘湛恩编制了非文字智力测验,均有一定影响。2 .在人格测验方面(1)肖孝崂曾修订了武德沃斯个人资料记录表。(2)1935年,浙江的沈有乾用朋洛德人格问卷测量中国学生。(3)1937年,周先庚用瑟斯顿情绪稳定性测验测量中国学生。(4)1943年,林传鼎试用普莱西X-O测验测试青少年的情绪成熟度的发育。(5)1948年,刘范曾试用罗夏克墨迹测验。3 .在教育测验方面艾伟曾编制小学儿童各科学绩测验10多种。(二)现代心理与教育测量在1949年以后的发展4 .智力测验(1)龚耀先主持修订韦克斯勒成人智力量表,于1982年完成修订工作。(2)林传鼎、张厚粲主持修订韦克斯勒儿童智力量表,于198碑完成修订工作。(3)1982年,吴天敏对中国比内测验进行了第三次修订。(4)1986年,龚耀先主持修订了韦克斯勒幼儿智力量表。(5)1985年,张厚粲主持修订了瑞文标准推理测验。(6)1989年,李丹主持修订瑞文测验(联合型)。(7)1992年,戴忠恒修订了一般能力倾向测验。这些量表都是国际上著名的智力测验,修订后广泛用于智力问题的研究和因材施教、人才选拔、职业咨询、临床诊断等领域。此外,中国学者也编制了不少智力测验,如张厚粲、周容等编制的中国儿童发展量表等。(8)最近,国内研究者相继获得国外授权,重新对韦克斯勒儿童智力量表和成人智力量表的国修订版进行了大规模中文修订,形成了韦氏儿童智力量表第四版(WISC-IV)(中文版)和韦氏成人智力量表第四版(WAis-IV)(中文版)。5 .人格测验(1)修订和引进外来量表1982年,由宋维真主持修订明尼苏达多相人格调查表,于1985年完成修订工作。1981年,李绍衣等修订了卡特尔16种人格因素问卷,制定了辽宁省的常模,后于1988年由戴忠恒、祝德里主持制定出全国常模。1983年,龚耀先主持修订了艾森克人格问卷,同时陈仲庚也在北方作了修订。®在IIffi床心理学领域,也修订了多种涉及心理健康评估的量表,如张明园于1987年修订了生活事件量表。吴文源等于1990年修订了症状自评量表(SCL-90)等。(2)编制量表20世纪80年代末90年代初,中国心理学家在继续引进修订国外人格量表的同时,开始编制中国人自己的人格量表:1988年,洪德厚等编制了中国少年非智力个性特征问卷。1992年,宋维真等人在借鉴明尼苏达多相人格调查表的基础上,编制出心理健康测查表,1993年,他们同香港学者合作编制出中国人个性测量表。为了准确把握中国人的心理健康状况,促进人们的心理健康发展,近年来中国的心理学家致力于研发适合中国社会史敌际的心理健康素质测评工具,其中由天津师范大学0'理学家沈德立等人组织研发编制的青少年心理健康素质调查表和中国成人心理健康素质测评系统最为系统。6 .教育测验(1)1979年,林传鼎、张厚粲等人编制少年儿童学习能力测验,用于测量/J浮毕业生的普通能力。(2)1980年开始,在张厚粲的主持下,北京师范大学高考研究组对每年的高考试卷作了系统的统计分析,获得了有关试卷信度、效度、难度、区分度等有意义的信息。他们还对高考试卷评分的客观性、考试科目的合理设置及各科分数的合理组合作了研究。在此基础上对我国高考制度的进一步改革提出了一系列重要的意见和建议。(3)1984年,我国正式加入世界上最有影响力的“国际教育成就雨介协会”(IEA),并与“国际教育成就评价协会''合作,在我国进行了全国规模的教育测量抽样研究。(4)1986年,罗黎辉、施良方等对教育目标分类理论进行了研究,并将布卢姆的教育目标分类学系统地介绍到中国,产生了广泛而积极的影响。(5)20世纪80年代,张敏强、张厚粲对经典测量理论和项目反应理论在考试制度改革中的应用情况作了比较研究。(6)标准化考试理论与实践的研究、题库理论与技术的研究取得长足进展。(7)20世纪80年代以来,教育测量开始从单一的学生学绩测量,逐步向多侧面发展。教育测量类型也从过去1:匕较单一的终结性测量发展为诊断性测量、形成性测量等多类型的测量。7 .组织建设和人才培养(1)组织建设1984年,中国心理学会组建心理测验工作委员会,后来将其进一步扩建为心理测量专业委员会。该专业委员会定期组织召开全国性的学术会议。制定了心理测验管理条例和与之配套的心理测验工作者职业道德规范。教育学界也成立了教育统计与测量学会,开展有关工作。(2)人才培养继1980年北京师范大学心理系率先开设“心理测量,课程以来,各大学心理学系都已先后开设了“心理与教育测量”课程。一些大学招收硕士和博士研究生,为该学科培养高层次学术和应用人才。心理测量专业委员会以及一些大学还多次举办心理测量技术培训班,培养了一批应用型人才。8 .学科建设20世纪80年代以来,国内不仅发表了大量有关心理与教育测量的研究论文,而且出版了多种教材与专著。第3章经典测验理论的基本假设一、心理特质及其可测性假设(一)心理特质的含义心理特质是指表现在一个人身上的特有的相对稳定的行为方式。可以从以下几个方面来理解:1 .特质是一组具有内部相关的行为的概括,具有一定的抽象性。2 .特质是“一种一般的神经心理系统它可以综合不同的刺激,使人对这些刺激做出相同的反应二3 .特质是一个人身上比较稳定的特点。4 .一个人的精神面貌(人格)是由多种特质分多个层次有机组合而成的。不同的人往往具有不同的特质组合,即使其特质类型相同,其特质水平往往也会有高低之分(尽管水平的高低只具有相对意义)。5 .特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。(二)心理特质的可测性心理特质是一种客观存在,“凡客观存在的事物都有其数量”,“凡有数量的东西都可以测量二这就是经典测验理论(CTT)的心理特质的可测性假设。二、测量误差及其来源(一)测量误差的含义测量误差是指在测量过程中由那些与测量目的无关的变化因素所引起的一种不准确或不一致的测量效应。可以从两方面来进行理解:测量误差是由那些与测量目的无关的变因所致;测量误差表现为不准确或不一致两种方式。(二)测量误差的种类心理测量的误差有两种:即随机误差和系统误差。1.随机误差即是由与测量目的无关的偶然因素引起的、且不易控制的误差。它使多次测量产生了不一致的结果,其方向和大小的变化完全是随机的,只符合某种统计规律。2系统误差即是由与测量目的无关的变化因素引起的一种恒定而有规律的效应。这种误差稳定地存在于每一次测量之中,此时尽管多次测量的结果非常一致,但实测结果仍与真实数值有所差异,是不正确的。因此,系统误差只影响测量的准确性、不影响稳定性。而随机误差既影响稳定性又影响准确性。(三)测量误差的来源心理测量的误差来自三个方面:测量工具、被测对象和施测过程。1 .在测量工具方面心理测量工具通常是一套以测验(问卷)为核心的刺激反应系统(通常称作量表)。心理测量量表不稳定、没有真正测到研究者所要测的东西是测量工具造成误差的两种主要原因。2 .在被测对象方面造成测量误差的主要原因是受测者真正水平未得到正常发挥。一般地,受测者的某种心理特质水平是相对稳定的,但是他在接受测量时的生理和心理状态会影响其水平的正常发挥。3 .在施测过程方面产生测量误差的原因主要是一些偶然因素。三、真分数及其有关假设(一)真分数的含义反映被试某种心理特质真正水平的数值称作该特质的真分数(简称T分数)。实测的分数称作该特质的观察分数。当观察分数接近真分数时,就认为这次测量的误差较小。需要注意的是,真分数是一个在理论上构想出来的抽象概念,在实际测量中是很难得到的。(二)数学模型及其假设1 .经典测验理论(CTT)模型经典测验理论假定,观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记之为E)。即:X=T+民这就是CTT的数学模型。根据这一模型,可以引申出三个相关联的假设公理:(1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数,即:£(X)=T;(2)真分数和误差分数之间的相关为零,即:PET=O;(3)各平行测验上的误差分数之间相关为零,即:P陷=0其中,第(2)、第(3)条假设意在说明E是个随机误差,没有包含系统误差在内,第(1)条假设则在于说明E是个服从均值为零的正态分布的随机变量。2 .理解经典理论(CTT)模型及其假设(1)对CTT的这一数学模型及其假设公理,可以从以下三个方面进行理解:在问题的研究范围之内,反映个体某种心理特质水平的真分数是1艇不会变的,测量的任务就是估计这一真分数的大小;观察分数被假定等于真分数与误差分数之和;测量误差是完全随机的,并服从均值为零的正态分布。(2)平行测验:CTT认为,如果两个题目不同的测验测的是同一特质,并且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布都是一致的,则这两个测验可以被称作是彼此平行的测验。(3)根据CTT模型和假设,很容易推导出如下关系:¾=S+Sg即:在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和。真分数变异还可以分成两部分:与测量目的有关变异()和与测量目的无关的变异(S;),即:Sl=SX+S;即:s;=s;+s;+s;指在一次测验中,一个团体的实测分数之间的变异性是由与测量目的有关的变异数(S;)、稳定的但出自无关来源的变异数(S;)和测量误差的变异数()所决定的。