石大教育测量与评价教案03教育测验的编制与实施.docx
《石大教育测量与评价教案03教育测验的编制与实施.docx》由会员分享,可在线阅读,更多相关《石大教育测量与评价教案03教育测验的编制与实施.docx(12页珍藏版)》请在课桌文档上搜索。
1、第三章教育测验的编制与实施第一节测验目标的确定一、目标分类研究测验目标的确定是以教育目标分类理论为基础的。自20世纪50年代以来,许多学者提出了各种不同的教育目标分类理论。影响较大的主要有美国布卢姆、加涅、梅里尔,日本樨田取一等人。其中,以布卢姆的教育目标分类理论是开创性的,在国际上影响最大。(一)布卢姆等人的教育目标分类法美国布卢姆于1948年开始致力于教育目标的分类研究,1956年公布了认知领域的目标分类体系,他把教育目标分为认知领域、情感领域和运动技能领域。I二6.2依据外部证据认知领域6.1依据内在证据.5.3推导抽象关系I5.2制订计划或操作程序5.1讲行独特的交流4.3组织原理的分
2、析力.4.2关系分析4.1翌素分析应用3.1利用事实和概念解决新问题2.3推断(预测趋势和结果)2.2解释(说明、概括资料)2.1转化(用不同词汇表达、符号体系与其他体系转化、翻译)I_I1.3学科领域中的普遍原理和抽象概念的知识(原理和概念、理论和结构)知1.2处理具体事物方式方法的知识(惯例、趋势和顺序、分类与类别、准则、方法论)1.1具体的知识(术语的知识、具体事实的知识)这六个层次每层次内部又有若干级层次;层次之间有连续性,高层次目标是低层次目标的发展和延伸,高层次目标是在低层次目标的基础上发展起来的。教育的任务就在于帮助学生不断实现更高层次的认知目标。2、情感领域的教育目标分类继认知
3、领域的教育目标分类问世之后,克拉斯沃尔、布卢姆和马西亚于1964年完成了情感领域的教育目标分类。每个层次内部也分为若干层;五个层次之间具有连续性,由简单、具体的行为目标开始,逐步发展到较复杂、较抽象的行为目标,并通过价值的不断内化过程,最后形成性格。性格化5.2特征性格化5.1一般性定向组织4.2价值观念系统的组织4.1价值的观念化估价33承诺感3.2偏爱某种价值观念3.1接受某种价值观念2.3反应中的满意感反应2.2反应的意愿2.1反应中的默许13有控制或选择地接受接受1.2愿意接受1.1觉察3、动作技能领域的教育目标分类动作技能的发展和认知与情感的发展有密切关系。一方面,认知和情感的发展可
4、以促进动作技能的发展;另一方面,动作技能的发展对认知和情感领域的发展也有一定影响。哈罗、辛普森和基布勒等学者进行了深入研究,于1970年提出了动作技能领域的四级目标。4.4声音和手势协调43声音投射4.2音和词的结合4.1声音的产生动作技能领域言语彳亍为非语言交流动作3.3身体动作3.2手势3.1面部表情细微的协调动作2.5手足眼耳的结合动作2.4手足协调2.3手耳协调2.2手眼协调2.1手和手指协调胶体动作1.3两个或两个以上肢体的运动1.2下肢运动1.1上肢运动美国当代著名教育心理学家加涅于1977年在学习的条件一书的第三版中,把认知领域分为言语信息、智力技能和认知策略三类,其中智力技能再
5、分为辨别、概念、规则、高级规则四类;对技能领域不再分解;将态度领域再分为情感因素、认知因素和行为后果三类。他认为学习的结果,或者教学活动所追求的目标,就是形成学生的五种能力:智力技能、认知策略、言语信息、运动技能和态度。(三)樨田取一的教育目标分类法日本大阪大学的教授樨田取一提出了具有东方色彩的教育目标分类理论。他于1983年在教育评价一书中,较系统地阐述了他的思想。他提出三分类到达目标理论。包含三大目标:一是基础目标(达成目标),要求学生真正掌握规定的、具体的知识和能力;二是提高目标(向上目标),要求学生向一定目标提高和发展;三是体验目标,通过学生的某种行为变化,了解学生中筐的某种切身体验。
6、三类目标中都包含认知、情感和精神运动领域的一系列目标,并有具体到达度要求。这三类分类法的比较见P63o我国测验目标的分类较多借鉴布卢姆的教育目标分类。但必须指出,布卢姆的教育目标分为六类,并不是完美无缺的,也有实验证明布氏的六个类别中“分析”、“综合”是处于同一层次水平的类别。一些专家认为,布氏的“知识”“理解”“应用”的信度和效度都比较高,而“分析”“综合”“评估”三个层次的信度和效度都不明显。我国教育工作者在吸收布卢姆目标分类法合理部分的基础上创用的认知领域目标有五分法(知识、理解、应用、分析综合、创造)和四分法(识记、理解、简单应用、综合运用)。二、确定测验目标应注意的问题(一)深入分析
7、课程教学目标确定测验目标时,应在深入研究并弄清楚课程教学目标的基础上进行,做到测验的目标与教学目标或学习目标相一致。教学目标是指教学活动所预期达到的标准,它是进一步具体化的教育目的。教学目标是一个多层次的目标体系,各门课程可设计出总的教学目标(课程目标),根据课程教学目标,可设计出单元教学目标,根据单元教学目标,又可设计出课时教学目标,根据课时教学目标还可设计出知识点教学目标。行为目标是教学设计中一种更具体的、可观察的教学目标,亦称学习目标。“是对学习者通过教学以后将能做什么的一种明确的、具体的表述J主要描述学生通过学习以后预期产生的行为变化。美国泰勒是当今行为目标之父。1932年,他指出:通
8、过对课程内容的分析,可以确定以行为描述的目标,在行为目标的基础上编写试题是重要的。他也曾认为,一份好的测验,应该以一定的教育目标为指导,所以要首先找出课程目标,然后以行为将目标表达出来,即制订一系列预期达到的大目标,在每一大目标下又有可测量的行为目标。50年代中期,美国兴起程序教学运动。程序教材序列化过程,实际上就是在进行学习目标的分析工作。通过程序教材的设计,行为目标得到了较广泛的运用。1962年,马杰出版了程序教学目标编写一书,以程序教学课本的形式,系统地提出了使用行为术语陈述教学目标的理论和方法。至此以后,美国的行为目标教育大面积铺开。但当时存在两个问题,一是尽管教师掌握了编写的基本技巧
9、,但不知道编写的内容是什么;二是当教师编写好行为目标以后,不知道行为目标的作用何在。产生这两个问题的主要原因是当时尚未形成一个完整的目标教学设计模式。行为目标是目标教学系统的一个有机组成部分,不能脱离目标教学系统的整体,孤立地编写行为目标。行为目标的陈述是十分具体明确的,它具有可观察、可测量的性质。它令师生都清楚地知道通过教与学所要达到的行为上的变化,要说明产生行为的条件,指出评定行为的标准。一般情况下,行为目标应该包括:行为(如“能将文章中阐明事实与发表议论的句子进行分类”)、条件(如“提供一篇报纸上的文章”)、标准(如“至少85%的句子分得正确”)、对象(如“学生”)。(二)正确选择目标领
10、域及其类目这个问题实质上是对不同学科应确立什么样的测验目标的问题。是否所有学科的测验目标都包括认知、技能、态度三个目标领域和相同的目标类目?我们认为,应根据社会要求和学科课程的性质去确定,学科性质不同,着眼点也不同。学科课程,如语文、英语、数学等,应以认知领域为主,因为他们是人类为了将这些学科知识代代相传下去并发展后一代的心智才开设的,学习这些课程应达到掌握知识、强化记忆、发展思维力和想像力等认知方面的目的。但体育、舞蹈、劳作、技艺(手工)、家政等课程则应以动作技能领域为主,因为这些课程的基本内容是动作技能。任何社会对人的发展都有“态度”上的要求,学生学习任何学科都需要借助于情感、动机、意志等
11、非认知因素,即“态度”因素,它们对学生的知识掌握、技能形成、智力和能力发展,都起着“催化”作用,所以无论哪一学科的测验都应重视态度领域的目标。类目数的确定,常与最高测验目标的确定以及目标分类的粗细有关。测验目标要求越高,分类越细,类目就越多。反之,就越少。但一般以36类为宜。此外,还应根据课程教学大纲中确定的教学目标的内涵来确定测验目标领域和目标类层。教学目标内涵反映什么目标领域,我们就测验什么领域。即测验目标领域及其类层的高低,取决于教学大纲中教学目标内涵的规定性。由此可见,根据教学大纲中的教学目标去选择测验领域和设计类目层次,关键在于测验编制者对教学目标内涵理解的准确程度和透彻程度。(三)
12、正确理解各类目标之间的关系当我们在某一目标领域进行分类时,要充分考虑各类目标之间的叠层性或序层性。什么是叠层性?我们认为,在各类目标中,起基础作用的因素,由单一到多元,重叠递进,形成一定类别层次,这就是目标类目的叠层性。所谓基础因素,是指实现某一目标起基础作用的条件。如“理解”的“基础”因素是“知识”,“应用”的基础因素则是“知识”和“理解,由于基础因素不同,于是形成“知识”“理解”“应用”等不同的目标层次。布卢姆认为,教育目标分类,下一层是上一层的基础,上一层目标包含了下一层目标。因此,我们可以把分类表述为这么一种形式:属于A式的行为形成一类,属于AB式的行为形成另一类,而属于ABC式的行为
13、又可以形成一类。所谓序层性,指各类目标按一定的逻辑顺序排列,形成一定的类别层次。序层性与叠层性共同之处是:(1)前一类目标是后一类目标的基础,而后一类目标是前一类目标的必然发展和高层;(2)前一类目标较容易达到而后一类目标较难达到。区别是:序层性强调的是前一类目标内容对后一类目标“正迁移”作用,而后一类目标内容是前一类目标内容作用下的必然发展结果,往往显示一种的质的跳进;而叠层性强调的是,后一类目标的基础因素是前一类目标的基础因素的重复、累积和扩展,往往显示出量的叠加,是在某一种基础因素累积的同时还增加某些新的因素,在此基础上发生变化,从而形成新的更高一级的“类:一般说来,叠层性包含着序层性的
14、特点,序层性则不一定具有叠层性的性质。第二节测验题型的确定测验的编制是在确定测验目标、选定测验题型和分析测验内容的基础上进行的。测验题型的确定是测验编制的重要环节。一、题型的分类题型可分为两大类,一类是封闭式,一类是开放式。封闭式题型的答案是固定的,十分明确,评分客观、可靠。又可分为选择型和提供型。选择型的要求略低于提供型,前者只要求确认,而后者要求再现。选择型又包括是非题、配对题、选择题等,其中选择题又包括单项选择和多项选择。单项选择又分为正误式和比较式。提供型包括填空题、改错题、名词解释题、简答题。开放式题型正确答案的自由度比较大,由评卷者掌握,不能用机器阅卷。包括计算题、证明题、论述题、
15、写作题、设计题、翻译题等。题型体系如图P71页所示。二、较通用题型(一)是非题由一个陈述句构成,要求学生判断真或假,是或非,对或错等,答案只有两种可能。主要功能是测量学生判断陈述句子的正确性的能力。这些陈述句子包括事实、术语的定义、原理的表述等。是非题的优点是容易编写,适用于各学科测验,记分客观,取样范围大,但它不适合于测量较高层次的学习结果,学生答题猜测因素较大。(二)配对题这实际上是一种改选的选择题,是把一系列题干列成一列,把配备的选项列在另一列,即数个题干共同使用相同的几个选项,要求所有选项构成为每一题干的似真项。主要功能是测量学生对字词、事件、人物、地点、公式、原理等关系的识记能力和联
16、结能力。常用于测量和判断某些术语的意义,某些事件发生的时间、地点,人物所取得的成就,化学元素符号等记忆性知识。配对题在极短时间内能够测量大量相互关联的知识,也容易编制,但不适宜测量高层次认知水平。()选择题是由一个“题干”和几个“选项”所组成的试题,其功能是迷惑那些无法确定正确答案的考生,测量学生对问题的理解、再认、比较与辨别能力,以及思维的敏捷性和准确的判断力。-一般又分为单项选择题和多项选择题。单项选择题是一道试题中有几个可供选择的答案,要求考生只能从中选择一个答案。又分为正误式和比较式两种。正误式指一道试题中有几个答案,其中只有一个是正确的,其余都是错误的。比较式指一道试题中有几个答案,
17、要求考生通过比较而作出最佳答案的选择。多项选择题是一道试题有几个答案,要求考生作两项或两项以上的正确答案的选择。全选对才满分,否则不给分。选择题适合测试的内容较广,其组题方式灵活多变,可从不同角度对其进行分类,最常见的有8类:(1)辨识选择,常用于辨识字词的形音义、文化常识、公式定理、名词术语等;(2)阅读选择,前面给一段文字,后面提供备选答案,要求考生读后选出正确答案;(3)最佳选择,要求从几个备选答案中,通过比较,选择出最佳答案来;(4)图解选择,将文字材料画成几幅示意图,要求选出符合文字材料所显示的情景或关系的示意图;(5)归类选择:列出一组事物,并将事物分类,要求按一定标准选出归类正确
18、的项;(6)承接选择:给定一个或几个待续的句子然后列出几个承接句子,要求选出其中衔接恰当的承接句子。(7)排序选择:将几个事物列出几种排列顺序,要求选出排列顺序正确的项;(8)填空选择:在一句话中空缺一些字、词、句或标点,要求在备选几种答案中选出恰当的填补项。选择题评分客观、准确、省时。但编制费时较多,不大适宜测量学生的组织知识能力和表达能力。(四)填空题填空题的一般形式是提供一个留有空隙的不完整的陈述句子,要求考生将空缺的字、词、句补填上去。其主要功能是测量学生的记忆能力。常见的有:(1)补省填空,列出句子,要求将省略部分字词补出。(2)默写填空,只写出开头和结尾句,留下中间部分,要求默写出
19、来,或只以文字说明,指定默写的内容。(3)表格填空,将有关知识内容列成表格,要求按表格规定的项目关系填空。(4)排序填空,在一段课文中抽出若干句子,打乱次序,编上序号,要求将这些句子序号按顺序填在答案空格中。(5)语境填空,在一段文字中,空缺某些字句,要求根据上下文情境把空缺部分填写出来。填空题取样广泛,可提高效度,可避免学生乱猜,也容易编写,但容易造成学生死记硬背。(五)改错题指提供有错误的陈述句子,要求考生在句子错误部分的下面划线,并将正确答案写在线下面。主要功能是测量学生的判断能力、记忆能力和理解能力,试题容易编制,可避免学生乱猜,但如果没有对考生的改错做出必要的限定,则会造成正确答案没
20、有统一的情况。(六)名词解释题即提供重要的名词或概念,要求考生作出正确的解释。这种试题主要功能是测量学生对一些重要术语、概念的掌握情况。命题简单,但易造成死记硬背。(七)简答题是提供问题,要求考生对考题作出简要回答,常由一个直接问句或“不完全叙述句”构成。主要功能是测量考生对重要知识的记忆程度。适用于对一般知识层次学习结果的测量,有时也可测量考生解决问题的能力。优点是编写试题容易,不受猜测影响。缺点是不能测量较复杂学习结果和较高层次的知识水平。(八)计算题是在试题中提供计算条件,提出计算要求,要求考生计算结果,有时还要求作出解答。通常所求值、求解或化简作为目标,而且解答过程以计算为主。这种试题
21、的主要功能是测量考生解决问题的思维能力以及对运算技巧的掌握程度。评分客观准确,但编制较难。(九)论述题是向考生提出较为复杂的问题,要求作出分析、说明、解释、论证,或作出结论,或提出自己的观点和见解。其主要功能是测量考生组织知识、表达思维和分析问题、解决问题的能力。使考生有较多的独立思考,自由发挥的机会,但评分主观因素较多。第三节命题设计当确定了测验的目标与测验的题型以后,接着便是命题设计。一、命题双向细目表命题双向细目表是设计试卷的蓝图。它使命题工作避免盲目性而具有计划性,使命题者明确测验的目标,把握试题的比例与份量,提高命题的效率和质量,同时对于审查试题的效度也有重要指导意义。命题双向细目表
22、一般的包括两个维度表格。较常见的有:(1)反映测验内容与测验目标关系的双向细目表。(2)反映测验内容与测验目标、题型之间关系的双向细目表。(3)反映题型与难度、测验内容之间关系的双向细目表。(4)反映题型与难度、测验目标之间关系的双向细目表。具体详见教材P7880页。二、命题设计的改革探索近10年来,我国教育界为了提高测验命题的科学化、规范化水平,较普遍采用“命题双向细目表”去设计。但单纯采用“双向细目表”不足以解决试题的效度问题。首先,“双向细目表”中测验内容一般只反映教科书的知识点,而只以知识点作为测验内容,是不全面的,因为它不能代表全部教学内容。从理论上说,学科测验内容应代表或反映学科教
23、学的全部内容,然而根据教学大纲的要求,学科教学内容并不完全等同于教科书的知识。如学科教学内容中的技能训练、思想品德培养、情感智商(简称“EQ”)的培育等方面,教科书的知识就不能完全涵盖,虽然,在教学过程中,教师发挥主导作用,学生萌发主观能动性,均以教科书为依据,但并不限于教科书知识。可见教学内容具有超越教科书知识点的的特征。单纯从学生掌握教科书知识点的水平去衡量教学目标的达到程度,显然有局限性。其次,“双向细目表”设计的测验目标类层与学科教学大纲规定的教学目标类层不一致,即两者存在脱节现象。许多教育工作者在设计测验目标类层时,指导思想模糊,随意性大,常抛开既定教学目标,以为教学目标是一回事而测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 测量 评价 教案 03 测验 编制 实施

链接地址:https://www.desk33.com/p-344697.html