欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

理论教育测评优选九篇

时间:2023-08-28 16:36:26

理论教育测评

理论教育测评第1篇

英文名称:Educational Measurement and Evaluation

主管单位:

主办单位:湖南省教育考试院

出版周期:月刊

出版地址:湖南省长沙市

种:中文

本:大16开

国际刊号:1674-1536

国内刊号:43-1482/G4

邮发代号:42-353

发行范围:国内外统一发行

创刊时间:2008

期刊收录:

核心期刊:

期刊荣誉:

联系方式

理论教育测评第2篇

      卷首

        (1)学校转型的“冈徒困境”与路径选择 程晋宽

        考试与招生

        (4)综合评价体系构建中的高考改革探析 朱华山

        (12)高中课程与高考改革:文理分合抑或专业分化 冯生尧

        学校管理与发展

        (23)义务教育阶段留级制度之审思 陈惠英

        (28)关于教育督导督政问题的分析及建议 孙世杰

        小讲坛

        (32)教育评价的clpp模式 无

        学校管理与发展

        (33)县域中小学及幼儿教师教育科研水平的调查研究——以桂林市六个县为例 覃泽宇 文泽鸿 席广涛 苏玫

        课程与教学

        (38)小学生学习过程评价的人学基础 丁念金

        小讲坛

        (42)教育评价的应答模式 无

        课程与教学

        (43)上海市浦东新区初一学生科学探究能力的现状与改进建议 姚霞

        品德与心理

        (48)中学生的学业自我与人格特质的关系 赵小云 郭成

        (53)高中生时间洞察力与自我同一性的关系研究 宋婧

        随笔与感情

        (60)“放心去跳"——课堂教学需要开阔的空问 姚小霞

        (62)教师成长的路径——专业化与“去专业化" 唐小青 杨骐文

        (63)数学也是“德育"的好推手 朱明

理论教育测评第3篇

1.小学阶段的研究

如今,小升初已经取消了,基本上是按学区就近入学,仅在进入小学和小学毕业会组织一个简单的面试或笔试,这项举措在开始阶段的效果是不错的。不让孩子输在起跑线上,很多家长在孩子还未出生时就开始早教,对所谓的“名校”越来越关注,学生学习成绩优秀的学校就是“名校”,这就迫使学校和老师片面地追求高分数、高效率。

2.初中阶段的研究

初中阶段的招生虽然也是就近入学,但择“名校”现象使初中也面临“升学”的压力。学校不再对成绩进行直接的排序,但家长仍关注升入重点高中的学生人数和比例,以此作为选择所谓“名校”的依据。这是一种终结性评价,这样不利于学生、学校资源的平均分布,也使得一些学生由于转换到新的环境,需要调整很长一段时间。

3.高中阶段的研究

随着近几年高校自主招生比例的上升,许多重点高中有意识地培养学生的综合素质,但他们选择的对象比较窄,往往是在实验班、重点班中选择,绝大部分学生还是传统高考大军中的一员,对他们来说,素质教育只是一句空话。因此,老师和学校真正落实素质教育的就更少。

4.对教师的测量与评价

改革开放以前的学生需要下乡劳动,在劳动实践中学习了许多实用的技能。现在教育上级部门、家长、社会对教师的评价是,所带的班考了几个清华、北大?本科上线率多少?与同类学校相比怎么样?这种评价只重视教师教学的效果,或者说重视教师的教学能力,而不注重教师对学生综合能力的培养,更不注重老师采用什么样的方法,也不注重对于教师来说非常重要的、需要不断提升的专业素质。

二、学生的终身发展如何实现

1.过程与结果的辩证关系

过程与结果的辩证关系在很短的时间是显现不出来的,但是如果我们能坚持下去,每天进步一点点,在学习的低潮时想,这么困难的情况都能克服,那以后还有什么可怕的呢,在坚持到一定程度时,虽然量变引起质变的结果可能我们暂时不需要,但困难终归被你克服了,而即使失败了,谁能保证这不是一个新的开始,只要我们坚信,总有一天可以看到风雨之后的彩虹。

2.老师应落实好每一个“过程”

老师的作用在于,当学生遇到问题时,引导他们,让学生在混乱的思维中找到正确的方向。作为老师,我们要把握好教学的内容,注重让学生从“做中学”,亲身经历知识获得的过程,在实践中将所学知识得以应用并加深。由于这是一个知识逐渐在大脑中形成的过程,这个过程所需要的时间较长,而经历的时间越长,在大脑中停留的时间也就越长。

3.学生要做好每一个“过程”

过程是最重要的,孩子在学习和实践的过程中可以学会很多,可以掌握基本的生存技能,可以通过资料搜集了解相关知识的最新研究状况,家长们担心这种对过程的重视会影响学生的成绩,而想减少过程的时间。

许多优秀孩子们的成功,往往都在“不经意”间,他们的家长尽量创造更多的机会,让孩子自己选择要做什么,对于孩子的观点,大多数他们都会赞同。因为错误的尝试和选择也是学习的机会,这样孩子充分地发展了自己的潜力,表现出更多的快乐。别人的评价我们无法更改,但我们可以使他们看到我们变化的过程,结果怎样又有什么重要呢。

三、我国基础教育的定位

在国际化的舞台上,我们取得了骄人的成绩,多年的数理化奥赛金牌总数第一,“诺贝尔奖”上也终有突破。我国的基础教育定位应该是发展学生的能力,培养学生的创新思维。怎样让我国的基础教育真正地回归到培养学生的科学素养上,这就要我们注重学生良好研究习惯和兴趣的培养,注重创新思维的培养,这样我国在国际化舞台上的地位才会更高。

四、教师对基础教育评价的定位

我们应注重评价学生的可持续发展,注重培养学生的科学素养,这是一种发展性的评价,要用发展的眼光看待学生。要注重培养学生进一步探究的兴趣和热情,以及进入高一级学府的积极性,只有经过更深层次的不断培养,才能保证学生的可持续发展。我们不应将许多原应高一级学府所涉及的知识提前让学生掌握,这样的超前性接受知识对很多学生来说太难了。

希望有这么一天,我们评价机制很好地与社会发展结合了起来,共同为社会主义建设作出我们应有的贡献,为社会经济的腾飞贡献我们的一切。

理论教育测评第4篇

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起,60年代兴盛于西方世界并传入我国。这些学科虽然在我国大力已有20余年,但

的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生的潜在能力、发展倾向,如能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和研究教育现象中的数量关系的一门学科。它通过数据的和处理,准确地掌握教育

情况,为制定教育方针、政策提供依据,为开展教育科学研究,探索教育,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群的建议

教育评价学经过几十年的已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把学、教育统计学、教育测量学的纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

[1][5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2]参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4]参见许茂祖编著·《高等教育评估理论与》·铁道出版社·1997年版·第16--27页

[6]见刘尧著·《教育评价学》·中国文联出版社·2000年版·第7--23页

理论教育测评第5篇

[关键词]教师测评知识 有效教学 教育测量知识 教育评价知识

[中图分类号]G645 [文献标识码]A [文章编号]1005-5843(2013)05-0059-04

[作者简介]李丽菊,红河学院数学学院助理研究员(云南蒙自661100)

一、教师知识结构浅析

教师知识是指教师在处理某个特定事件中的知识整体,是构成教师实践行为的所有知识和洞察力。关于教师知识结构的认识,以舒曼尔(Shulman)为代表的学科取向观点认为,教师为使教学获得成功,需懂得该如何把现已掌握的知识转化为学生可理解或接受的表征形式。它从普通教学法知识出发,关注师生之间的交流,是教师所特有的教学内容和教学法的有机混合体,包括教师有关具体学科的特殊观念和学习难点的知识以及有关该学科的教学方式和教学策略的知识两个重要部分。在这种教师知识的共有特征基础上,舒尔曼将教师知识具体分为学科知识、一般教学法知识、课程知识、学科教学知识、学习者及其特点知识、教育背景知识、教育目标和价值观及其哲学和历史背景的知识等七类。另外,从教师教育视角看,我国师范教育普遍采纳“学科知识、教育科学知识和普通文化知识”三类课程知识模式,其基本的理论预设是“任何具有足够学科知识的人只要懂得普通教育理论和原则,就能够将这些理论和原则自觉运用到具体学科知识点和情境的教学中,提高教学实效”。然而,作为教育教学的行动基础,教师知识显然远远超越这种学术研究领域和教育实践领域的知识分类范畴。从实践教学质量看,如何保障有效性教学的知识应当是教师知识结构的核心构件。

“有效教学”论题是一个历久弥新的问题域,传统的有效教学模式认为,教学的有效性主要表现为:(1)在单位时间内,没有偏离地按照教学设计完成预定的教学方案,采取“课前准备-复习旧知-新授知识-随堂练习-布置作业”的程序化课堂教学模式;(2)在有限的学期内,粗放式地增加教学和学习投入,反复历练得分技能;(3)教学活动被简化为“刺激-反应”的机械模式,其中教师是课堂教学的独白者和教学刺激给予者,学生是教学知识的机械接受者和反应者;(4)考试分数是教育教学有效的质量标准和评价准则,课堂内教得多、学得快、考得好就是有效的教学;(5)学生作为教学产品被塑造的,可以按照同一规格批量生产。显然,这种传统模式是将有效教学简化为教学投入与产出的比率关系,并坚信只要教学效果(产出)满足社会期望,取得好的升学率,那么师生的任何繁杂投入都是值得的。这些运作模式使教师变成了传输知识的工具和工匠,学生成了无头脑的知识储备器。朱文辉针对上述传统线性有效教学模式进行了反思和批驳,指出有效教学的应然追求:课堂教学是在教学行为与教学境遇的各种复杂关系的互动中展开的,教师应该依据学生的学习心理过程来创造各种教育契机,通过主体间交互活动,对课堂中出现的问题、疑难、困惑等生成性资源进行创造性重组,并在资源的生成和利用中推进学生经验的建构和知识的生成;教学的根本使命应是基于具体知识的理解、生成及效用,激发学生学习的内在需要和兴趣,提升他们主动探索的欲望和能力,使知识学习的过程同时成为培养学生主体意识、创新精神和实践能力的过程;知识具有亲历性,教学应自觉弱化知识传递的旁观者逻辑,知识只有内化为学生自身的价值、态度、信念和技能,才能成为衡量学习效果的尺度。

综上所述,就实践价值而言,虽然教师知识分类为教师教育课程设置提供了理论基础,但这些知识的传授和掌握并不等于教学的有效实施。从有效教学的评判标准看,传统的有效教学强调教师完成教学任务,实现教学目标,学生取得好的考试成绩,学校升学率高,这些都达到了便为教学有效。而有效教学的应然追求论强调教学相长,知识共生,成功挖掘学生内在的学习潜力才是有效的,与前者相比其进步之处在于,强调有效教学是师生主体间的互动模态,应促进学生将知识生命化和个性化。二者共同之处均认为,有效教学应是教和学均有效,那么在教学实践中如何才能真正保证教学和学习有效呢?从教师要素看,教师测评知识是保障有效性教学的重要部分,起着教学监测和质量反馈的作用,它是教师职业化和专业化的根本标志,是有效教学的重要保障。

教师测评知识是教师对学校情境中的教育现象及其属性进行计量分析与价值判断中的知识整体。在教育教学活动的设计与实施中,如何科学地测量教育事项,公正地考评教育教学活动结果,以促进学生全面发展,改进教师教学行为,是监控教学过程及其效果评定的主要内容,也是保障有效教学的重要手段。只有使教育教学建立在科学测评程序上,及时诊断出教学实践中存在的差误,才能有效地调整教学策略,改进学习行为,提高教学和学习效率。因此,教师测评知识理应成为教师教育课程设置中的重要组成部分,就教育测评过程及其知识结构而言,教育测量知识与教育评价知识是教师测评知识整体的核心要素,也是教师必备的教育教学技能元素。鉴于此,本文尝试对教师测评知识的内涵进行探讨,期望为我国教师教育的课程设置与教学提供一些参考和启示。

二、教师测评知识解读

(一)教育测量知识

教育测量知识是关于教育现象及其属性进行计量分析和事实判断的知识整体,包括教育测量的基本理论知识和计量统计技术两个主要部分。从操作性定义看,教育测量知识是开展教育教学测量活动所需的一切相关知识,包括测什么的知识、怎么测的知识和如何分析的知识三个方面。从测量行为看,教育测量是根据一定的原理和法则,针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。

教育测量的基本理论知识是开展教育测量的理论基础和行动准则,包括教育测量的基本原理、资料收集、标准制定、质量评定、统计分析、结果运用等知识模块。首先,教育测量的基本原理主要包括测量目标制定、资料收集方法、测量标准构建、数据分析原理、结果解释原则等。其中制定测量目标及其标准的基本准绳是教学目标和学习目标的分解,教师职前教育课程中应通过课程媒介将设置科学的教学目标和学习目标的原理与方法有效地传递给学生。资料收集方法是教育测量的重要环节,教育资料可以大致区分为定性和定量两类,收集不同类型的资料在程序设计、计量测算、保存应用等方面存在较大差别。测量标准是计量分析的理论依据,是教育测量的具体行为准则和计量单元,教育测量总是将某些教育现象或观念化整为零,在具体的、客观的水平上进行分解和描述,使其变得可操作、可计量。数据分析原理是对收集的各种教育资料进行数理统计的技术和方法,以寻找教育现象之间的内在联系和统计联系,为教育评价服务,如测算考试题目的效度、难度、信度、区分度的方法与技术;结果解释原则主要是针对计量分析的结果进行意义解读和教育效果推论,其基本要求是客观而符合事实,不以偏概全。总体而言,教育测量的基本理论知识涉及确定合理参照点、制定科学测量单位、研制有效测量工具三方面的知识,只有这些知识同时具备,测量工作才能顺利开展,进而对教育现象及其属性进行量的规定和描述。

教育计量的技术与方法是教育测量的重要手段,是教师考评学生成绩、评判教学效果的必备工具。从教学过程看,它包括教学目标设定、学习准备状态探测、课程作业设计、学业测验编制和试卷质量分析、学习和教学效果测定等方面的技术和方法。从控制教育测量误差看,测验编制、试卷质量评定、测量数据分析等方面涉及的原理技术和统计方法是教育测量中的重要工具。测验编制属于研制有效测量工具的内容,是测量学生学习效果的重要媒介,编制测验是教师的一项重要教学能力,不可随意应付。好的测验编制应有考核目标、知识内容、分值比例、题型设计、参考答案、评分标准等内容,只有在这些方面作了标准处理,才能保证测验的有效性。试卷质量评定主要是测算试卷的效度、信度、难度、区分度,这些不同的质量指标有其独特的使用条件和计算办法,只有这些指标同时满足了测量学的要求,才能准确测出学生的学习水平。数据统计分析是技术性较强的工作,包括统计分析原理、分值计算方法、软件操作技术、结果分析描述等内容。因此,凡能通过计量分析的教育事项,均需要掌握有关的数据处理技术与方法,只有统计方法使用恰当,才能有效地对各种教育现象及其属性进行测量。

(二)教育评价知识

教育评价知识是指基于教育测量的结果,对各种教育现象及其属性进行价值判断的知识整体。它包括评价的理论基础、组织与实施程序、设计评价方案、结果的分析整合、心理调控技能、统计决断与推论等方面的知识,可以将这些知识概括为教育评价的基本原理和结果评判两大类别。从操作定义看,教育评价是指按照一定的教育目标,对所实施的教育活动的效果及其活动本身进行价值判断的过程,其实质是寻求教育活动的意义与作用。教育评价的理论基础主要是指教育评价中所倚重的指导思想和教育观念,其中国家的教育方针及其相应的教育规划纲要是教育评价的宏观指导思想和行动指南,各种教育教学理论是教育评价的具体行为准则,如王景英和梁红梅(2002)基于后现代主义强调教育评价的方法论中,要倡导反思、批判的思维模式;重新审视定性研究和模糊评判;要倡导多视角、多元化的方法论;要强调评价者与被评价者之间的对话;要淡化鉴定、分等功能,强调评价的研究和促进的功能。又如建构主义知识观的教育评价启示意义在于,强调“评价标准的多元化、评价目标和内容的多维性、评价过程的动态化、评价方法要定性与定量相结合、强调评价的真实性与情境性”。诸如此类论说无疑是教育评价的重要理论依据和方法指南,为此,在教育评价设计中,应在国家教育方针指导下,析取各种教育教学理论的合理因素作为行动依托。

此外,在教育评价活动中,组织与实施是教育评价的准备环节,包括人力、物力、财力和时间计划等方面的准备活动知识。评价方案的设计是教育评价的操作模式,决定着教育评价的质量和功能发挥,主要涉及指标体系构建技术、评价标准分解、确定指标权重方法等知识内容。结果的分析整合是在统计学原理的指导下,借助数学分析技术对测评结果进行计量和分数整合,在总体水平上理解某个分数量值的实际意义,评判教育活动的育人效果,以深入揭示教育结果的价值蕴涵。心理调控技能是关涉评价结果有效传达的知识,该技能的掌握有助于发挥教育评价的导向功能、激励功能和管理功能。统计决断与推论是对教育评价结果的数学分析和统计处理,将评定的教育事实进行意义解读和价值概化,如在教育行动研究或者教育实验中,对某些教育策略或者学习的效果检验及其外在效度判定,它属于教育评价的重要计量技术。总之,教育评价是一项复杂的系统工程,从确定评价的目的、分解既定教育培养目标、设计评价内容及其指标体系、采集和分析评价数据,到解释统计数据事实、利用评价结果等都是教育评价工作不可缺少的环节,完整的教育评价还应该包括反馈和相应的政策调整、教学方法改进措施以及元评价等,这些环节中的相关知识与技能均是教育评价知识的重要组成部分。其中数理计量技术和统计方法是教育测量与教育评价的共同知识成分,它们是目标导向式教育测评的核心知识内容,是教育测评的重要工具。

三、教师测评知识的实践价值

(一)有助于有效掌握学生的学习行为特性

任何教学设计都是以学生的学习准备状态为基础的,当然教育测评并非是掌握学生学习状态及其行为特性的唯一手段,但却是最为科学有效的途径。传统教学设计起始于教师的人生经验和学科知识,是一种“自上而下”式的教学观念和经验的反映,没有考虑学生的学习需求和接受能力,本着“没有教不好的学生,只有教不好的老师”的职业信念实施教学方案,认为传道、授业、解惑就是教师的应然角色,学生就是教学的雕琢品,是知识的容器。为了使教学高效,教师和学生必须在单位时间内完成更多教学任务和学习活动,是一种机械主义的课程教学模式。为扭转这种“高压低效、高分低能”的简单量化教育模式,教师必须具备教育测评的知识和技能。实践表明,有效的教学活动必须以学生的学习心理和行为为基础,而科学合理的教育测评则是了解学生学习心理和学习行为特性的有效手段。

(二)优化教师的教育教学行为

理论教育测评第6篇

关键词 专业技术课 体育 水平测试评定 理论课教学 教学设施

近些年来,随着学校体育教学改革的发展,各种先进的教学理念和教学方法都在体育专业技术课教学的过程中发挥了重要的作用,学校体育专业技术课教学的水平也得到了明显的提升。然而,在体育专业技术课的开展过程中却仍存在着一定的问题,因此,本文就针对体育专业技术课教学中的相关问题进行了简要的论述。

一、 体育专业技术课教学中存在的问题

(一) 在体育专业技术课的技术水平评定和测试方面存在一定的弊端

随着学校体育教学改革的深入和现代体育教育理念的推行,多数学校的体育教师都形成了自己独特的体育教学管理模式和管理体系。体育任课教师在对学生的体育专业技术课水平进行评定和测试时也有着不同的见解和操作方式,然而通过多年的一线教学实践和大量的资料分析,我们发现在针对学生进行体育专业技术课的技术水平评定和测试时现有的模式和操作方法仍存在一定的弊端。其主要表现在以下几个方面:首先,体育专业技术课的测试和技术评定开展的随意性较大;其次,学生对体育专业技术课技术测试和评定的认识不够,重视不足,积极性不高;第三,个别体育任课教师在进行体育专业技术课测试和评定的过程中不够严格;第四,针对同一个体育运动项目开展的测试和评定工作,不同的体育任课教师制定的技术评定标准不统一。这些问题的存在严重影响了体育专业技术课技术水平评定和测试的科学实施以及评定结果的客观性,达不到开展技术测试和评定的预期目的,影响了体育教学质量的提高。

(二)对体育专业技术理论课教学的关注不足,影响了教学质量的提高

学校是培养体育人才的重要阵地,高水平的体育人才不但要有良好的技术功底还要有与良好的技术功底相适应的完整的科学理论体系。然而,受我国传统的学校体育教学思想和教学观念的影响,很多体育任课教师在开展体育教学活动的过程中都存在着“轻理论,重实践”的现象,特别是在体育专业技术课教学的过程中,这种现象尤为明显。然而,对体育专业技术理论课教学关注的不足,不但不利于学生良好的知识结构和能力的形成,影响教学质量的提高,还会影响学生体育意识以及终身体育观的培养,为学生体育专业技术水平的提升制造潜在的障碍。

(三)学校的体育教学场地和体育教学器材不足,无法满足体育专业技术课的教学需求

调查发现,很多学校体育教学场地的建设工作和体育教学器材、设施的配套工作,都远远落后于图书馆、教学楼等基本教学条件的建设工作,以致学校现有的体育教学场地和体育教学器材不足,无法满足学校开展体育专业技术课教学的需求,影响了体育专业技术课的高效开展。而且,学校体育教学场地和教学器材的不足,还使得公共体育教学与体育专业技术课教学在场地和器材使用上的矛盾更加突出,教学场地的拥挤、人均活动面积的不足、教学器材的老化、磨损、不足,均已严重影响到学校体育教学工作的正常开展,使得学生的体育练习密度减小,体育课堂教学效果受到影响。

二、 提高体育专业技术课教学质量的几点措施

(一) 改革体育专业技术课技术水平评定和测试的模式

要解决体育专业技术课技术水平评定和测试中的一系列的问题,提高体育专业技术课测试和评定的科学性和客观性,必须针对体育专业技术课技术水平评定和测试的模式进行改革。

首先,学校在开展体育专业技术课技术水平评定和测试时,尽量保证进度统一。学校应根据本校的实际情况以及体育教学的计划和安排,把教学内容相近或相同的课时尽量安排在同一个教学单元进行教授,并尽可能的在同一时间点完成各项教学内容,进行专业技术课技术水平的评定和测试。

其次,学校在进行体育专业技术课技术水平评定和测试时,应统一制定评定标准及评定要求,尽量减少评定过程中的随意性。在制定评定标准和评定要求时,各体育任课教师可以根据学生的实际情况以及教学活动开展的实际情况,制定出相应的考核标准及评定要求,然后将所有的考核标准和评定要求,统一进行讨论和修改,并最终制定出一套科学的、统一的考核标准和评定要求。在考核标准和评定要求制定完成之后的实施过程中,也应安排相应的教师进行监督,便于考核标准和评定要求的切实落实。

第三,在进行体育专业技术课技术水平评定和测试时,评定和测试的时间应尽力统一。在某一教学单元的教学活动结束以后,相应的体育任课教师应尽可能的统一安排进行技术评定和测试,根据不同的体育教学项目设置不同的测试点,在某一时间段内统一针对学生开展评定和测试工作。

以上这几种方法,不但能保证体育专业技术课的技术水平评定和测试的规范、科学实施,提高了评定结果的客观性和准确性,还能有效的调动学生的学习积极性,大大提高体育课堂教学的质量。

(二)重视体育专业技术理论课教学,保证体育专业技术理论课教学的科学开展

理论教育测评第7篇

【摘 要】 本文基于教育哲学的角度,运用数学反证法证明:假设命题“教育评价≠事实判断(测量+非测量)+共同的心理建构”不成立,即所求证命题“教育评价=事实判断(测量+非测量)+共同的心理建构”是成立的。

【关键词】 教育评价;共同的心理建构;教育哲学;反证法

教育评价的本质归根结底是一种价值判断,是根据一定的标准,在系统而科学地收集和运用信息的基础上,对教育活动发展变化的过程和结果进行价值判断的过程,从而达到价值增值的目的。[1]对于教育评价观的说法,各方众说纷纭,其中笔者比较认可格朗兰德的教育评价观:教育评价=事实判断(测量+非测量)+价值判断,同时对此也有更新的想法,故在原有公式的基础上提出新式教育评价观:教育评价=事实判断(测量+非测量)+共同的心理建构。笔者提出的新式评价观有待于考证,在此运用数学反证法的判断方法来证明新式评价观的成立,其中命题支撑理论基于教育哲学的观点,从而达到自圆其说的目的。

反证法证明:教育评价=事实判断(测量+非测量)+共同的心理建构

一、反设命题:教育评价≠事实判断(测量+非测量)+共同的心理建构

反证法就是从否定命题的结论入手,并把对命题结论的否定作为推理的已知条件,进行正确的逻辑推理,使之得到与已知条件、已知公理、定理、法则或者已经证明为正确的命题等相矛盾,矛盾的原因是假设不成立,所以肯定了命题的结论,从而使命题获得了证明。因此,本文的假设命题是:教育评价≠事实判断(测量+非测量)+共同的心理建构。

二、相关理论推理归谬,导出矛盾

1、教育评价的基本内容

教育评价不仅要对教育活动当前的或已经达到的结果作出价值判断,还要对它的发展变化及评价对象潜在的价值作出判断,并注重评价过程的动态性、发展性和协商性。现代教育评价观是以教育哲学为基础,是强调以人为本、建构“共识”、动态协商的真实性的评价,是根据一定的标准,在系统、全面、科学地收集、整理、处理和分析、运用教育信息的基础上,对教育活动的过程和结果进行动态的共同的心理建构的过程,目的在于促进教育改革,提高教育质量。

现代教育评价的理念突出强调以人为本,注重发展,重视过程。教育评价中,以人为本的评价理念主要体现在强调对人的尊重、解放和发展,突出人在普及活动中的主体地位和作用,强调评价人的态度、情感等。其中,其哲学基础主要体现在:它是一种价值取向,强调尊重人、解放人、塑造人和依靠人;它是一种对人在社会发展中的主体作用与地位的肯定;更是一种思维方式,要关注人的普遍性、共性、人的个性与共同人性,要对人的生存和发展的命运确立其终极关怀,要关注人的生活世界……

现代教育评价还应遵循教育性、真实性、动态性、协商性、多元性和伦理性原则。其中笔者需要强调,真实性原则突出“准确”,指教育评价在占有客观性事实资料的基础上,对整个教育活动做出准确的价值判断;动态性原则突出“发展”,指教育评价应该成为一个活动的、持续的过程,以达到改进工作、提高学习水平的目的;协商性原则突出“共识”,指评价双方就评价主题协商、达成共识,形成一种平等交流的信任关系;多元化是指教育评价的内容、主体、方式方法及标准应该是多样性的。

2、“共同的心理建构”论证

教育评价的历史发展共经历了考评、测量、描述、判断和建构五大阶段,其中建构阶段的建构性评价是针对以前评价的不足提出来的,与以前的评价明显不同,它是一个社会政治过程,而非科学技术过程,其结果是有关评价对象及其意义的一个或多个理论框架,而且是利益相关者通过协商达成的,其中“共同心理建构”则是此评价阶段中的精髓“产品”,更体现哲学的人性中“以人为本”的思想。因此,建构阶段比以前的评价都更符合实际,更适应时代的发展。

首先,建构性评价中描述的“共同心理建构”。评价描述的不是客观事物、本真的状态,而是参与评价的所有人或团体关于评价对象的一种主观性认识。评价的结果强调参与评价有关的人的共同的看法,不单是评价者对评价对象的主观认识,所以评价活动发现的不是事实和评价者的价值判断,而是参与评价的所有人的共同的心理建构。其次,评价中存在着多元的价值判断。人们对某事物的评判往往是以自己的价值观念为基础的。实际上,由于参与评价的价值标准是不一样的,所以对同一教育现象就会有不同的价值判断,这就需要一股绳子聚集各方的力量即多元的价值判断。教育评价不是在多元的价值判断中选取某种代表性的或权威性的判断,而是在不同的价值体系之间进行协调,以缩小各方的价值分歧,进行“共同心理建构”。最后,评价中要关注以人为本。从教育哲学的“以人为本”出发,并将此作为一项工作原则,贯穿于评价过程的始终。前阶段的评价中也有“以人为本”的要求,如尊重评价对象尊严、隐私等,但在此的假设是,评价对象处于弱势地位,主要是出于对评价对象的保护。建构性评价提出将“以人为本”作为一项工作原则,主要是基于“全面参与”的意识提出的,所有的人都出于政治上的平等地位,所有参与评价的人都是作为平等的合作伙伴出现的。

在分析这种建构性评价的过程中,可引入“诠释辩证的循环圈”(hermeneutic dialectic cercle)这一理论。在这个循环圈中,第一,要尽可能的吸收各方见解;第二,要努力使资料收集工作具有相互影响性;第三,要在各有关方面充分阐述、解释的基础上,透过协商和分析,逐渐形成共识,即“共同心理建构”;第四,探究者和评价者必须注意的是,“诠释辩证的过程”是为了在不同的建构间建立起联系,是为了形成“共识”。[2]建构阶段教育评价是一种民主协商、主体参与的过程,而非评价者对评价对象的控制过程,并受多元主义价值观的支配,它把评价视为评价者和与评价有关的各方通过“协商”进行的共同的心理建构过程。此外,该评价具有较强的哲学理论基础,大量运用了当代教育哲学中的最新理念,如诠释学的“辩证循环”、人种学的“质性”方法、人类学以及后现代主义的“对话”等。建构性评价充分反映了当前社会生活中的民主气息和人文关怀,体现“以人为本”。

作为建构性评价的精髓――“共同心理建构”,可取代教育评价所谓的“价值判断”这一本质,因为共同的心理建构本身已包含价值判断,更加强调的是多元化的“以人为本”、“协商”及“共识”的价值判断,同时也强调教育评价的基本内容,如以人为本、注重发展过程的教育理念,以及真实性、动态性、协商性、多元性的评价原则,这不仅符合哲学的价值取向,丰富了原有评价观(如格朗兰德的评价公式),带来一种耳目一新的感觉,更顺应时代的发展要求。

因此,假设命题:“教育评价≠事实判断(测量+非测量)+共同的心理建构”与教育评价的基本内容和建构阶段中的评价理论是相互矛盾的。

三、反正法结论

通过反证法证明得出:假设命题“教育评价≠事实判断(测量+非测量)+共同的心理建构”不成立,即所求证命题“教育评价=事实判断(测量+非测量)+共同的心理建构”是成立的。

【注 释】

[1][2] 艳国.教育评价[M].北京:高等教育出版社,2007.3.1.43.

理论教育测评第8篇

一、当前学业成就测评所面临的技术难题

随着基础教育改革的不断深入,对学生学业成就的测评工作已经取得很大进展,但我们仍然无法忽视其中存在的问题:一是现行的学业成就测评仍然摆脱不了对学生进行排队的嫌疑,通过测评所挖掘的学生的信息仍然不够深,从而导致对学生的能力不能很好地诊断和指导[2];二是囿于测评技术的发展局限,现行的学业成就测评还是主要考查学生对知识的掌握程度,对学生能力的掌握还不够深;三是学业成就测量与评价的非标准化,导致了测评内容缺乏客观性。尽管我们打破了传统的材一统天下的局面,制定了一个共同的课程标准,但现行的考试制度还是抹不去学业成就测验内容选择的主观色彩;四是学科专家和心理测量学专家之间的联系不够紧密,导致学科专家在成就测评的实施过程中,缺乏心理测量学的理论指导,而心理测量学专家对学科知识和课程标准也吃不透;五是在我国现状下,大规模的学业成就测评的形式非常单一,主要采取纸笔的形式,这也导致人们对测评的客观性和公正性存有质疑。综合上述五个问题的出现,分析其根本原因,主要原因还是心理测量学的基本理论还没有完全融入到学业成就测量与评价的实践中去,所以,要解决学业成就测评面临的问题,还得从心理测量学的理论与技术的实施中寻找答案,加强心理测量学专家与学科专家之间的联系与交流,从而做到学业成就测评的客观、公正与公平,促进学生能力的发展。

二、学业成就测评的经典测量学基础

经典测量理论(Classical test theory,CTT)起始于20世纪中叶之前,其主要特点是以真值理论为基础,以信度、效度、难度和区分度为指标,它的基本假设是考生的分数并不是一个绝对的值,而是其真实能力或技能的反映与测量误差的和,所以称为真值理论。根据经典测量理论,人们逐步建立并完善了测验发展的标准化程序,通过标准化的程序提高所编制的测验的信度和效度。

自2001年国家教育部提出课程改革以来,教育心理学工作者和学科专家在新课程下学业成就测评工具的研发上,下了不少工夫。经典测量理论在学业成就测评中也得到了一定的应用。某地区初中数学成就测验在编制过程中,首先是依据初中数学课程标准,确定初中数学涉及4个领域的内容:数与代数、空间与图形、统计与概率以及综合应用。同时结合美国教育学家B.S.Bloom的教育目标分类法,选择记忆能力、理解能力、运算能力、推理能力、综合应用能力为教育目标,确定测量目标。根据教学内容和教学目标,制定了双向细目表,之后对该区的数学教学专家进行了访谈,确定了项目以及项目所占的权重,然后组成两套平行题本。根据题本通过小样本预试,用难度、区分度的指标来筛选题目,最后确定正式施测题本。采取分层整群抽样,进行施测收集数据,分析数据,从而根据数据分析的结果来评价学生学会了什么,对什么是了解、知道、理解、应用[3]。

在大规模的学业测评中,试题往往要全面覆盖基础教育的各个学科,测试题目非常多,如果要将这些题目让全部学生作答,测试的时间会大大超过学生所能承受的限度,这也是不可能实现的,矩阵取样技术化解了这个难题。将覆盖多个学科的所有题目按照一定原则分配到多套测验中,学生随机分配,每个学生只需完成一套测验中的试题,这样的设计叫做完全矩阵取样设计。采用这种设计解决了测验时长的问题,但是不同学生测试结果的比较又成了新的问题。针对这一问题,发展出不完全矩阵取样设计,就是每一个题本中都有一部分共同题,利用学生在共同题部分作答的情况,将学生在整个题本中的作答结构等值到同一个量尺上,就可以解决个体之间的比较问题。

即便如此,经典测量理论下的学业成就测验,采用总分指标来评价能力,对个体在总体中的相对位置进行排序,不能指出被试具体掌握了哪些内容,更无法诊断其题目作答错误的原因,仍然摆脱不了还只是对学生知识点考查的怪圈,在注重能力培养的素质教育背景下,它缺乏对学生能力的掌握;用难度与区分度的指标来分析学生的反应,保留了一些反映学生能力的题目;在实际的教学过程中,教师一般也都是自出题目,对题目的难度和区分度只做一个主观的估计,同时,它也缺乏避免曝光的理论技术指导,从而造成学业成就测验的标准化程度很低;另外,如果涉及到语文成就测验时,主观题目的设计以及结果的分析又会面临统计学的难题。

三、学业成就测评的现代测量学指导

基于经典测量理论下成就测验只能测查知识点的致命缺点,教育与心理学工作者围绕经典测量理论的一些问题展开了讨论,促进了测量理论的新发展,注重表现学生能力的项目反应理论(Itemresponse theory,IRT)产生了,该理论起始于20世纪60年代,其特点是:采用严格的数学模型来反映不同能力水平的测试者对测试题目的反应模式。项目反应理论相对于经典测量理论来说取得了巨大的进步,但也并非没有缺点[4],它的3个基本假设非常严格——(1)单一维度假设,即假定测验的所有题目只测查同一种能力或潜在特质。但实际上,很少有测验只测查单一的能力或特质。(2)局部独立性假设,即当控制所测量的能力或特质之后,被试在不同题目上的反应是相互独立的。换一句话讲,就是被试对题目的反应只受该题目所测的能力的影响。(3)单调递增假设,即被试对题目正确反应的概率随其能力水平的增加而单调递增。这3条非常严格的假设,使其应用受到很大的限制。

从20世纪90年代至今,围绕项目反应理论产生了很多新的研究和新的动向,如:多维项目反应理论(Multi-dimensional IRT,MIRT)、非参数项目反应理论(Non-parametric IRT,NIRT)等。多维项目反应理论为成就测验中所涉及的每个维度引入能力和项目区分度参数,进而模拟测验题目和被试之间的交互作用,它是一个非线性的用来表征题目参数、被试的多维潜在能力以及其正确作答概率之间关系的数学函数,通过这个模型,我们可以对被试的多个特质进行分别推断。换一句话说,利用多维项目反应模型能同时估计被试在多个维度上的能力参数,并且考虑各能力维度之间的关系,因此,如果测验数据是多维的,则多维模型就能更有效地估计被试及项目参数。这使我们能更深入地了解被试,结合多方面的信息,为对被试的评估或诊断提供帮助。在实际应用中,一个总的学业成就测验可以分为多个子测验,如果子测验测量了不同的内容领域或认知技能,则这些项目就有可能代表了不同的维度,这时,对每个项目能够正确作答所需要的内容领域或认知技能进行分析是非常必要的,在传统测验中一个知识点的考查可能涉及到对多个能力的考查,用经典测量理论的假设,一个题目对应一个能力,这显然是有很大的误差。另外,多维项目反应理论能够提供项目在每个能力维度上的区分度参数,可以据此来选择对多维能力差异具有敏感性的项目。在教育中,课堂上学科教师给学生出的小测验比比皆是,这种测验不仅题目少,而且受测的对象也仅仅是本班的学生,即样本小,这时,非参数项目反应理论就给我们提供了模型,这至少削弱了我们对经典测验中样本分布正态和在参数项目反应理论中关于特质分布正态假设的依赖。

四、学业成就测评的认知诊断技术前沿

认知诊断理论(Cognitively diagnostic theory)非常值得我们关注。随着认知心理学的发展,关于知识与技能的认知理论为我们研发成就测验工具提供了理论基础。认知诊断理论就是以现代测量学为基础,结合认知科学对学习理论的研究与发现,采用更精致的数学模型,来研究如下问题,(1)学生在答题时,经历哪些认知过程?(2)这些认知过程如何发展?以及能力高的学生与能力低的学生在这些方面有哪些差异?认知诊断可以通过学生对试题的作答反应,推论出其认知过程与知识结构的可能状态。

在学业成就测评中,经典测量理论和项目反应理论,都是根据理论中的一些指标来筛选题目,将学生按顺序排列在特定能力(或特质)的连续体上。这并不能给学生或教师有用的诊断信息,不能帮助学生或教师理解需要学习或教学的知识与技能。而运用认知诊断理论,我们能更深入地理解隐含在考生总分背后其认知技能之间的差异。这为我们深入挖掘受测者信息提供了一个有力的工具。

认知诊断理论中比较有代表性的有Mislevy的以概率为基础的推理(the probability based inference)、Corbett和Anderson等人的学生思维模拟(student modeling)、Britton和Tidwell的认知结构诊断(cognitive structure testing)以及Tatsuoka的规则空间模型(rule space model)[5]。Tatsuoka的规则空间模型最初是用来诊断小学生在解决四则运算问题时答对或者答错的原因,进而发现学生使用错误的规则来解题,因此会产生系统化的错误,这种系统化的错误,他们称之为“失误”。该模型的方法包括两个阶段[6]:第一阶段是抽取某个领域的认知特征并根据这些认知特征确定潜在的知识结构;第二个阶段是把学生的反应模式划分到所确定的各个知识结构中去,并且计算被试的属性掌握概率。在构建规则空间的过程中使用了项目反应理论中参数估计的方法,所以严格来讲,规则空间模型的建构方法是项目反应理论的继承与发展。用规则空间模型的方法编制成就测验时,通过可达到矩阵的距离来澄清各属性之间的关系,使得矩阵中的项目属性关系清晰且符合逻辑。同时,由于属性间的逻辑关系很清晰,所以在项目的反应上就能很清楚地知道学生掌握了哪些属性,或者未掌握哪些属性,或者是因为失误而造成的反应错误,这样就能给教师和学生提供更深层的信息,从而进行补救性的教学[7]。

在实际工作中开展认知诊断测评,需要进行一系列的系统化工作:(1)确定诊断目标。必须明确要诊断的具体学科内容,如小学数学分数诊断,中学语文句法诊断等。(2)确定诊断目标所涉及的认知属性及属性间的阶层关系。这项工作需要认知心理学家、学科专家和教育测量学专家共同完成。(3)根据已经确定的属性和属性层级关系选择适当的模型,如规则空间模型就是一种。(4)预测验与正式测验,获取模型参数。(5)诊断结果报告和有针对性的补救教学措施的制作。

认知诊断测评技术的发展使形成性评价的实施得以可能。在课程改革的背景下,教育的主题是关心人的发展,全面提高人的素养,同样,学业测评的功能也就从过去关注结果的评价逐渐转向注重过程的评价,强调通过评价改进教学活动,促进学生发展。“为了学习的评价”(Assessment for Learning,AFL)理念就应运而生,其核心目的是促进学生的学习,同时,该理念还提出了教育政策制定者过于强调大尺度教育评价对教育的影响而忽视了课堂上的评价。事实上,过程性评价是课堂上应该选择的最有效的评价方式,因为,在课堂教学活动过程中,为了促进教学活动而不是鉴定学生能力,教师和学生需要共同对学习过程进行监控和评价。这样,教学活动得到及时反馈,教师可以根据评价结果来调整教学;同时,学生得到学业评价的反馈,也提高了学业监控能力。

五、学业测评技术的理论发展与反思

通过心理测量理论的历史发展这条主线,对其在学业成就测评中的应用进行回顾,体现了测量理论在学业成就测评中的意义与价值,同时,这也体现了学业成就测评的测量学取向。从经典测量理论下学业成就测验对知识的测查,到项目反应理论下学业成就测验对能力的静态刻画,再到认知诊断理论下学业成就测验对能力的动态诊断,从而使教育者从反应行为的面纱下揭开能力的形成过程,对学生能力能进行更好的诊断、评价以及实施补救性的个性化教学。从学业成就测评的测量学取向的发展来看,随着认知科学、教学研究和心理统计学的发展,以认知理论为基础的新的测量方法和测验设计方法也会得到进一步发展,从而更好地指导学业成就的测评工作。

在对测评理论发展趋势的展望下,我们也应该有所反思。传统的学业测评中,更多地强调对学生学业水平和能力的衡量,但是认知诊断技术的发展趋势告诉我们,对学业的测评不仅仅是为了对学生进行考量,更应该是对教师改进教学质量提供信息,为教育质量的提高提供信息。另外,增值性评价的提出,提倡学生本身的纵向比较,更关注学生个体的发展与提高,使教育更人性化。这也更顺应了《基础教育课程改革纲要(试行)》中指出的,改革课程评价过分强调甄别和选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能。

参考文献

[1] Lewis R Aiken.心理测验与考试——能力和行为表现的测量.张厚粲,译.北京:中国工业出版社,2002.

[2] 辛涛.新课程背景下的学业评价:测量理论的价值.北京师范大学学报(社科版),2006.

[3] 柴彩霞.7~9年级数学成就测验的初步编制.湖南师范大学,2005.

[4] 辛涛.项目反应理论研究的新进展.中国考试,2005(7).

[5] 余娜,辛涛.规则空间模型的简介与述评.中国考试,2007(9).

理论教育测评第9篇

一、教育评价新视角―PISA

1.PISA简介

PISA(学生能力国际评价)是经济合作与发展组织(OECD)于1997年发起的为OECD成员国协作监控教育成效的评价项目。PISA应用现代教育测量理论测试发达国家和地区义务教育结束阶段15岁学生在阅读、数学、科学领域的发展水平,配套调查问卷,进而评价各参与国家和地区的教育成效,进行国际比较,是世界上颇具影响的国际教育评价项目之一。

2.测试项目

PISA在2000年首次开始评价,其后每三年进行一次,根据评价年命名,每次测试的重点不同,评价的主要领域包括阅读、数学和科学素养,2012年又增加财经素养的测试。PISA2000的评价重点是阅读素养,PISA2003的评价重点是数学素养,PISA2006的评价重点是科学素养,随后依次轮回,PISA2015评价的重点又回到科学素养。

PISA是建立在终身学习的动态模型基础上的测试,分别从个体学习者、教学、学校及教育体制四个层面进行分析。同时从社会、文化、经济以及教育因素等方面考查学生和学校的特征。

PISA评价是前瞻性的,测量的是15岁青少年对于迎接现今高科技和知识社会的挑战的准备情况。PISA关注年轻人运用知识技能处理现实生活的挑战能力,而不仅是考查他们对学校特定课程的掌握程度。其测量的目标是发展常规的、可靠的及与政策相关的学生成就指标,从而达到提升国家教育体制的质量、公正性和效率的评价目标。PISA评价关注四个子目标的实现:学习成果的质量、学习成果的等价性和学习机会的均等性、教育过程的有效性和效率,以及教育对社会经济的影响。对政策制定者而言,能够通过对比自己国家和其他国家教育系统的成就表现,总结已有政策的经验,改善教育体制,并基于PISA提供的指标更好地评价和监控教育体制的效力与发展。

3.测试形式

2015年以前,PISA测试主要是纸笔测验,每个学生需要用两个小时的时间来完成测验,测验题目既包括多项选择题,又包括大量的开放性题目。测验题目通过单元的形式编排为题组,每个单元创设了一个真实的生活情景。

PISA除测验之外,还包括了学生问卷和学校问卷,目的是收集有关社会、文化、经济和教育因素的指标,这些指标与学生的成就相联系。

2015年,按照国际实施规范,PISA测试改为学生在计算机上完成。

二、对房山区参加PISA中国独立研究的思考

1.区域的社会经济背景

房山区位于北京西南,历史悠久,人文璀璨,是首都传统的农业和资源大区。目前有近百万人口,全日制在校生近10万人。

近些年,随着“一区一城”的建设,城市化改造在加快,教育发展也在提速。但教育发展能否适应城市化建设的需要?怎样评价基础教育改革方向?一直是我们在研究并努力回答的难题。

2.如何评价教育综合质量

近年来,房山区教育系统全体同志破解了教育体制、机制、资金以及政策等发展难题,推进了波浪壮阔的教育改革,使教育综合实力有了大幅度提高。目前以中考和高考为代表的教育质量只是结果性评价,而且评价内容和形式相对单一,表现在当下的教育质量与孩子们未来成长需要的能力是否一致?现在培养的学生能否引领未来区域的社会经济发展?这一直是世界性的难题。但我们按照教育规律思考,学校发育、学生发展、教育管理都应该是可以被测量、可以被评价的。问题的关键是要找到一个既能描述孩子们的能力和思维发展水平,又能够真实比对不同区域直接的差距的客观的“标尺”;并能够借此改进教师的专业发展、课程的设置,指导教育综合改革的方向。为此,我们进行了大量的教育评价研究,并引入了PISA测试。

3.理解PISA并达成共识

2008年,初次接触PISA,有的人不以为然,有的人甚至反对,毕竟参与PISA测试的一部分15岁的学生,还在参加初三最紧张的备考,学校领导顾虑是否会影响学校的正常教学秩序,家长、学生和教师都担心PISA是否会影响学生的中考成绩,升学的高利害关系确实是一个绕不开的话题。考虑到由OECD举办的PISA,拥有世界顶级的教育、测量和评价专家,几十个国家和地区参加,科学性毋庸置疑,测试方向代表了考试改革的发展方向,能从国际视角评价房山教育发展现状,站在未来发展的人才需要,指导我们深化课程改革和教学管理,完善考试评价研究,拉动区域教育质量的提升。所以,将对学生的影响和学校的教学影响降低到最小,我们做了大量的工作,说服了学校、教师和家长。事实证明,参与2009和2012年的PISA中国独立研究,不仅没有影响学生的中考质量,很多学生还对这种测试形式和内容表达了浓厚的兴趣。测试质量分析报告在房山区教育发展策略制定与执行中得到了充分重视,并在教科研部门实施了多项研究。

三、跟进PISA采取的系列举措和收获

1.成立考试评价研究办公室,推进PISA研究

为了组织参与PISA测试及其后期结论研究和成果转化推广,房山区教委在考试中心成立了考试评价研究办公室,任命了专项负责同志,并引进研究人员,在教委领导下专门从事考试评价日常工作。这一个创新的机构对教育评价研究的推进起到了关键性作用。现阶段很多全区教育工作依赖该中心具体推进,诸如组织参与PISA2015测试及结果研究和成果转化;参与区级大型考试的组考、阅卷、数据分析;开展考试评价技术的培训,促进考试评价与教学的融合,充分利用考试分析数据,提高课堂教学实效;探索按照增值评价理念进行考试结果与背景分析相结合的评价方法等。

2.及时普及PISA结论,改进管理

拿到2009年的测试分析报告,区教委请了PISA评价专家给区教委的行政领导和评价研究项目组同志做了解读和应用指导,并通过他们,在全区教师中培训预热,普及评价理念,应用测试结论,改进课堂教学,完善课程设置,改进了教育管理和评价办法。参与2012测试后,测试分析报告被纳入全区教育系统党政正职的培训,启动了科学素养提升研究。广泛的培训使教育工作者认识到,以PISA评价理论为引领的考试评价研究,确实能影响教学管理,深化课程改革,而干部、教师的接受,使区级很多教学改革项目得以顺利推进。

3.充分研究PISA结论,改进教育教学

基于PISA测试的理念和房山区测试结论,自2010年起,针对全体学生的“阅读能力培养”“数学思维训练”“科学素养提升”三大教学实验项目陆续启动,已经形成了固定的研究团队,制订了研究方案,都有了阶段性收获。

三个项目的开发和实践研究,基本上是跨地域、跨学校、跨学段、跨学科的实施,研究结论到学校落地方式,更是“摸石头过河”。三个项目最长的已经四年多,项目组负责人带着大家进行了艰苦的探索,很多领域是自发开展,主动找办法、想思路,乐在其中,收获颇丰。

4.坚持参与PISA,推进考试评价研究

第一,制定大型考试管理流程。学习PISA流程管理,制定“区级大型考试管理流程”,涉及命题、制卷、组考、阅卷、分析(命题质量、教学管理改进)等环节。特别是研究命题蓝图、编制双向细目表、规范数据分析报告表述结构等,提升了命题的规范。第二,研发了区级考试质量分析平台。提升了命题能力之后,依据教研人员分析试卷所需要的数据支撑和学校改进教学管理所需要的数据报告,对原有的考试数据统计系统进行了升级,与“工大智源”公司合作,按照实际需要开发了“考试质量分析平台”。第三,尝试开展增值评价研究。借鉴PISA测试手段―能力测试与问卷调查相结合,对学生进行诊断。2011年9月开始,对初一新生尝试进行增值评价研究。一是开展了数学、英语的学科测试,采用了无纸化网络阅卷,方便精细分析,确保了测试结果的信度。二是开展了调查问卷,聘请教育评价专家设计涉及“学习环境、兴趣爱好、意志品质、认知能力”等方面问题。项目组完成的初一学生整体的多维度分析报告,反映了房山不同区域小学毕业学生的教育差距,房山与同步测试区域的学生对比,在学科知识和能力的均衡程度等领域,都掌握了第一手的研究数据。结合调查问卷,研究学生学业成就与非智力因素的影响关系,从而为更加全面地制定区域针对性教学规划提供参考,为改进家庭教育提供数据支持。第四,修订中小学阶段质量标准。反思PISA整个测评过程,体会和学习其先进的测评理念和测评技术,认真研究测试分析报告的框架和导向,从更宽的视野告诉学校本学段学生综合发展指标要素和阶段标准,淡化结果的功利性,充分发挥教育过程的对照和矫正,聚焦学生发展,实现正确导向,更有利于学校形成正确的教育质量观。学校的教育何其复杂,培训学校理解测评理念和测评技术,基于参照维度和标准,学校会选择适合自己学生成长的教育方式和过程。所以我们下大力气修订原来的“中小学生阶段性质量标准”,目前已经下发,并向全区中小学做了使用推广。第五,师生在参与PISA中的教学相长是最大的收获。回顾参与PISA测试的收获,总体来说,参与其中的学生成长和教师进步应该是该项目的最大收获。首先,从学生层面看,从总体水平分析,PISA2012测试报告显示,房山区数学、阅读、科学素养的学生平均成绩较PISA2009均有所提高,且增幅较大,说明学生的可持续发展潜力有了提升。通过问卷反映的学生负担过重问题,引起了更多人的关注,在学校层面推进的减负增效工作进展顺利。现在,学生们有了更多的机会走出课堂,参加到课后素质提升工程中,学校组织的课外综合实践活动也越来越得到家长的认可和学生的喜欢。其次,考试评价项目的实施,唤醒了一批教师的专业成长。因为考试评价的复杂性和PISA测试的综合性,为推进这些工作,直接成立的项目就有十多个,参加研究的部门从行政到教研、科研,从考试评价项目组到基层骨干,从区域整体到实验学校,陆续参与的核心组成员过百,聘请的专家有几十人。更主要的是部分同志参与了PISA测试组织、试卷评阅、试题分析和测试结果应用的分析研究。这些同志迅速成长为我区教育评价的核心骨干,并将学到的评价理念和技术应用于我区教育评价研究。这种上下联动、理论与学校一线教学的反复实践,积累了大量资源,催生了更多的研究课题,吸引了大批的学科骨干、教科研人员的极大兴趣,激活了很多教师的研究热情。行政和学校管理人员的参与,同样影响着教育教学管理制度的制定和教与学模式的

改进。

四、未来的思考