欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

教育测量与评价论文优选九篇

时间:2023-04-19 16:54:44

教育测量与评价论文

教育测量与评价论文第1篇

关键词 教育测验 教育测量 教育评价

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

[6] 见刘尧著·《教育评价学》·中国文联出版社·2000年版·第 7--23页

教育测量与评价论文第2篇

[关键词]教师测评知识 有效教学 教育测量知识 教育评价知识

[中图分类号]G645 [文献标识码]A [文章编号]1005-5843(2013)05-0059-04

[作者简介]李丽菊,红河学院数学学院助理研究员(云南蒙自661100)

一、教师知识结构浅析

教师知识是指教师在处理某个特定事件中的知识整体,是构成教师实践行为的所有知识和洞察力。关于教师知识结构的认识,以舒曼尔(Shulman)为代表的学科取向观点认为,教师为使教学获得成功,需懂得该如何把现已掌握的知识转化为学生可理解或接受的表征形式。它从普通教学法知识出发,关注师生之间的交流,是教师所特有的教学内容和教学法的有机混合体,包括教师有关具体学科的特殊观念和学习难点的知识以及有关该学科的教学方式和教学策略的知识两个重要部分。在这种教师知识的共有特征基础上,舒尔曼将教师知识具体分为学科知识、一般教学法知识、课程知识、学科教学知识、学习者及其特点知识、教育背景知识、教育目标和价值观及其哲学和历史背景的知识等七类。另外,从教师教育视角看,我国师范教育普遍采纳“学科知识、教育科学知识和普通文化知识”三类课程知识模式,其基本的理论预设是“任何具有足够学科知识的人只要懂得普通教育理论和原则,就能够将这些理论和原则自觉运用到具体学科知识点和情境的教学中,提高教学实效”。然而,作为教育教学的行动基础,教师知识显然远远超越这种学术研究领域和教育实践领域的知识分类范畴。从实践教学质量看,如何保障有效性教学的知识应当是教师知识结构的核心构件。

“有效教学”论题是一个历久弥新的问题域,传统的有效教学模式认为,教学的有效性主要表现为:(1)在单位时间内,没有偏离地按照教学设计完成预定的教学方案,采取“课前准备-复习旧知-新授知识-随堂练习-布置作业”的程序化课堂教学模式;(2)在有限的学期内,粗放式地增加教学和学习投入,反复历练得分技能;(3)教学活动被简化为“刺激-反应”的机械模式,其中教师是课堂教学的独白者和教学刺激给予者,学生是教学知识的机械接受者和反应者;(4)考试分数是教育教学有效的质量标准和评价准则,课堂内教得多、学得快、考得好就是有效的教学;(5)学生作为教学产品被塑造的,可以按照同一规格批量生产。显然,这种传统模式是将有效教学简化为教学投入与产出的比率关系,并坚信只要教学效果(产出)满足社会期望,取得好的升学率,那么师生的任何繁杂投入都是值得的。这些运作模式使教师变成了传输知识的工具和工匠,学生成了无头脑的知识储备器。朱文辉针对上述传统线性有效教学模式进行了反思和批驳,指出有效教学的应然追求:课堂教学是在教学行为与教学境遇的各种复杂关系的互动中展开的,教师应该依据学生的学习心理过程来创造各种教育契机,通过主体间交互活动,对课堂中出现的问题、疑难、困惑等生成性资源进行创造性重组,并在资源的生成和利用中推进学生经验的建构和知识的生成;教学的根本使命应是基于具体知识的理解、生成及效用,激发学生学习的内在需要和兴趣,提升他们主动探索的欲望和能力,使知识学习的过程同时成为培养学生主体意识、创新精神和实践能力的过程;知识具有亲历性,教学应自觉弱化知识传递的旁观者逻辑,知识只有内化为学生自身的价值、态度、信念和技能,才能成为衡量学习效果的尺度。

综上所述,就实践价值而言,虽然教师知识分类为教师教育课程设置提供了理论基础,但这些知识的传授和掌握并不等于教学的有效实施。从有效教学的评判标准看,传统的有效教学强调教师完成教学任务,实现教学目标,学生取得好的考试成绩,学校升学率高,这些都达到了便为教学有效。而有效教学的应然追求论强调教学相长,知识共生,成功挖掘学生内在的学习潜力才是有效的,与前者相比其进步之处在于,强调有效教学是师生主体间的互动模态,应促进学生将知识生命化和个性化。二者共同之处均认为,有效教学应是教和学均有效,那么在教学实践中如何才能真正保证教学和学习有效呢?从教师要素看,教师测评知识是保障有效性教学的重要部分,起着教学监测和质量反馈的作用,它是教师职业化和专业化的根本标志,是有效教学的重要保障。

教师测评知识是教师对学校情境中的教育现象及其属性进行计量分析与价值判断中的知识整体。在教育教学活动的设计与实施中,如何科学地测量教育事项,公正地考评教育教学活动结果,以促进学生全面发展,改进教师教学行为,是监控教学过程及其效果评定的主要内容,也是保障有效教学的重要手段。只有使教育教学建立在科学测评程序上,及时诊断出教学实践中存在的差误,才能有效地调整教学策略,改进学习行为,提高教学和学习效率。因此,教师测评知识理应成为教师教育课程设置中的重要组成部分,就教育测评过程及其知识结构而言,教育测量知识与教育评价知识是教师测评知识整体的核心要素,也是教师必备的教育教学技能元素。鉴于此,本文尝试对教师测评知识的内涵进行探讨,期望为我国教师教育的课程设置与教学提供一些参考和启示。

二、教师测评知识解读

(一)教育测量知识

教育测量知识是关于教育现象及其属性进行计量分析和事实判断的知识整体,包括教育测量的基本理论知识和计量统计技术两个主要部分。从操作性定义看,教育测量知识是开展教育教学测量活动所需的一切相关知识,包括测什么的知识、怎么测的知识和如何分析的知识三个方面。从测量行为看,教育测量是根据一定的原理和法则,针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。

教育测量的基本理论知识是开展教育测量的理论基础和行动准则,包括教育测量的基本原理、资料收集、标准制定、质量评定、统计分析、结果运用等知识模块。首先,教育测量的基本原理主要包括测量目标制定、资料收集方法、测量标准构建、数据分析原理、结果解释原则等。其中制定测量目标及其标准的基本准绳是教学目标和学习目标的分解,教师职前教育课程中应通过课程媒介将设置科学的教学目标和学习目标的原理与方法有效地传递给学生。资料收集方法是教育测量的重要环节,教育资料可以大致区分为定性和定量两类,收集不同类型的资料在程序设计、计量测算、保存应用等方面存在较大差别。测量标准是计量分析的理论依据,是教育测量的具体行为准则和计量单元,教育测量总是将某些教育现象或观念化整为零,在具体的、客观的水平上进行分解和描述,使其变得可操作、可计量。数据分析原理是对收集的各种教育资料进行数理统计的技术和方法,以寻找教育现象之间的内在联系和统计联系,为教育评价服务,如测算考试题目的效度、难度、信度、区分度的方法与技术;结果解释原则主要是针对计量分析的结果进行意义解读和教育效果推论,其基本要求是客观而符合事实,不以偏概全。总体而言,教育测量的基本理论知识涉及确定合理参照点、制定科学测量单位、研制有效测量工具三方面的知识,只有这些知识同时具备,测量工作才能顺利开展,进而对教育现象及其属性进行量的规定和描述。

教育计量的技术与方法是教育测量的重要手段,是教师考评学生成绩、评判教学效果的必备工具。从教学过程看,它包括教学目标设定、学习准备状态探测、课程作业设计、学业测验编制和试卷质量分析、学习和教学效果测定等方面的技术和方法。从控制教育测量误差看,测验编制、试卷质量评定、测量数据分析等方面涉及的原理技术和统计方法是教育测量中的重要工具。测验编制属于研制有效测量工具的内容,是测量学生学习效果的重要媒介,编制测验是教师的一项重要教学能力,不可随意应付。好的测验编制应有考核目标、知识内容、分值比例、题型设计、参考答案、评分标准等内容,只有在这些方面作了标准处理,才能保证测验的有效性。试卷质量评定主要是测算试卷的效度、信度、难度、区分度,这些不同的质量指标有其独特的使用条件和计算办法,只有这些指标同时满足了测量学的要求,才能准确测出学生的学习水平。数据统计分析是技术性较强的工作,包括统计分析原理、分值计算方法、软件操作技术、结果分析描述等内容。因此,凡能通过计量分析的教育事项,均需要掌握有关的数据处理技术与方法,只有统计方法使用恰当,才能有效地对各种教育现象及其属性进行测量。

(二)教育评价知识

教育评价知识是指基于教育测量的结果,对各种教育现象及其属性进行价值判断的知识整体。它包括评价的理论基础、组织与实施程序、设计评价方案、结果的分析整合、心理调控技能、统计决断与推论等方面的知识,可以将这些知识概括为教育评价的基本原理和结果评判两大类别。从操作定义看,教育评价是指按照一定的教育目标,对所实施的教育活动的效果及其活动本身进行价值判断的过程,其实质是寻求教育活动的意义与作用。教育评价的理论基础主要是指教育评价中所倚重的指导思想和教育观念,其中国家的教育方针及其相应的教育规划纲要是教育评价的宏观指导思想和行动指南,各种教育教学理论是教育评价的具体行为准则,如王景英和梁红梅(2002)基于后现代主义强调教育评价的方法论中,要倡导反思、批判的思维模式;重新审视定性研究和模糊评判;要倡导多视角、多元化的方法论;要强调评价者与被评价者之间的对话;要淡化鉴定、分等功能,强调评价的研究和促进的功能。又如建构主义知识观的教育评价启示意义在于,强调“评价标准的多元化、评价目标和内容的多维性、评价过程的动态化、评价方法要定性与定量相结合、强调评价的真实性与情境性”。诸如此类论说无疑是教育评价的重要理论依据和方法指南,为此,在教育评价设计中,应在国家教育方针指导下,析取各种教育教学理论的合理因素作为行动依托。

此外,在教育评价活动中,组织与实施是教育评价的准备环节,包括人力、物力、财力和时间计划等方面的准备活动知识。评价方案的设计是教育评价的操作模式,决定着教育评价的质量和功能发挥,主要涉及指标体系构建技术、评价标准分解、确定指标权重方法等知识内容。结果的分析整合是在统计学原理的指导下,借助数学分析技术对测评结果进行计量和分数整合,在总体水平上理解某个分数量值的实际意义,评判教育活动的育人效果,以深入揭示教育结果的价值蕴涵。心理调控技能是关涉评价结果有效传达的知识,该技能的掌握有助于发挥教育评价的导向功能、激励功能和管理功能。统计决断与推论是对教育评价结果的数学分析和统计处理,将评定的教育事实进行意义解读和价值概化,如在教育行动研究或者教育实验中,对某些教育策略或者学习的效果检验及其外在效度判定,它属于教育评价的重要计量技术。总之,教育评价是一项复杂的系统工程,从确定评价的目的、分解既定教育培养目标、设计评价内容及其指标体系、采集和分析评价数据,到解释统计数据事实、利用评价结果等都是教育评价工作不可缺少的环节,完整的教育评价还应该包括反馈和相应的政策调整、教学方法改进措施以及元评价等,这些环节中的相关知识与技能均是教育评价知识的重要组成部分。其中数理计量技术和统计方法是教育测量与教育评价的共同知识成分,它们是目标导向式教育测评的核心知识内容,是教育测评的重要工具。

三、教师测评知识的实践价值

(一)有助于有效掌握学生的学习行为特性

任何教学设计都是以学生的学习准备状态为基础的,当然教育测评并非是掌握学生学习状态及其行为特性的唯一手段,但却是最为科学有效的途径。传统教学设计起始于教师的人生经验和学科知识,是一种“自上而下”式的教学观念和经验的反映,没有考虑学生的学习需求和接受能力,本着“没有教不好的学生,只有教不好的老师”的职业信念实施教学方案,认为传道、授业、解惑就是教师的应然角色,学生就是教学的雕琢品,是知识的容器。为了使教学高效,教师和学生必须在单位时间内完成更多教学任务和学习活动,是一种机械主义的课程教学模式。为扭转这种“高压低效、高分低能”的简单量化教育模式,教师必须具备教育测评的知识和技能。实践表明,有效的教学活动必须以学生的学习心理和行为为基础,而科学合理的教育测评则是了解学生学习心理和学习行为特性的有效手段。

(二)优化教师的教育教学行为

教育测量与评价论文第3篇

关键词:高校思想政治理论课; 教育教学测评; 新趋势

中图分类号: G642 文献标识码:A 文章编号:1672-9749(2010)06-0001-02

对高校思想政治理论课教育教学质量开展测评工作十分重要。在上一轮全国范围内开展的高校本科教学评估中,思想政治理论课曾纳入了评估范围,但探索建立一个独立的经常性的思想政治理论课教育教学质量监测体系,对于不断推进教育教学质量提高便显得非常必要。

一、贯彻《国家中长期教育改革和发展规划纲要(2010-2020年)》,高校思想政治理论课应当带头构建教育教学质量测评的长效机制

《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称《纲要》)指明了今后十年教育工作的两大重点任务是促进公平、提高质量。而其中改革教育质量评价制度和人才评价制度,是深化改革新的切入点和政策措施的亮点之一。在贯彻《纲要》时,改革高校思想政治理论课教育教学质量评价制度具有特别重要的意义。这是因为,有无马克思主义的思想理论教育,这是社会主义高等教育与资本主义高等教育本质区别的重要标志;保证思想政治理论课的教育质量,对于提高大学生的思想政治素质,保证其全面发展,巩固马克思主义在意识形态领域里的指导地位,都显得意义非凡。因此,高校思想政治理论课应率先构建教育教学质量监测的长效机制。

对于“高校思想政治理论课测评体系研究”的课题,教育部曾多次作为哲学社会科学一般课题进行过招标,但尚未取得突破性的进展。一些高校也进行过探索,如:改革考试考核办法,开展高校思想政治理论课质量保障体系研究,开展多方面的满意度测评,开展社会主义核心价值观培育质性研究等等,取得了一定成绩和经验。今后,各地各高校仍需发展多样化质量测评,同心协力促进思想政治理论课教育教学质量和水平的不断提高。但是,在吸取这些经验的基础上,研制一个既能深入教学内容,又能经常有效操作;既全面测评又突出重点;既能主要在网上操作,又易于在全国推开的质量监测工具,就成为思想政治理论课教育教学测评改革创新的紧迫任务。

二、思想政治理论课教育教学测评改革创新要跟踪国内外高等教育质量测评的前沿

首先,对我国2003-2008年开展的本科教学工作水平评估要有一个正确的认识。当时高校扩招后普遍存在资源投入跟不上、条件差距较大等问题,本科教学工作水平评估派专家组进校,在全面测评中重过程、条件、资源改善等的评估,达到了“以评促建”的目的。但由于要评优,客观上重等级奖罚,因此,许多高校突击应付,有的甚至作假,评估指标也不一定能完全说明高校教育质量。这种投入过大,周期较长的评估办法,沿用的可能性已受到质疑。在提高质量成为今后十年重点工作的历史阶段,要使“发展性评价”的理念、目的落实到高校思想政治理论课教育教学测评中去,势必要另辟蹊径。

同时,纵观国际高等教育质量测评现状,以学生学习效果为高校育人质量的基点和监测的起点,已成为国际高等教育测评发展的新趋势。国外高等教育评价理论大体上经历了四个发展阶段:以测量为标志的第一代测量阶段(1900-1930)、以描述为标志的第二代泰勒模式阶段(1930-1940)、以判断为标志的第三代价值判断阶段(1940-1970)和由枯巴、林肯确立的以发展性与建构性评价为标志的第四代评价理论。上世纪80年代以来,在第四代教育评价理论的基础上,逐步克服了过去存在的评价内容片面性、评价方法单一性、评价主体的偏离等不足,形成了更为科学的评价理念和模式。许多专家经过深入研究,指出“教育资源与教育质量之间的相关关系比较薄弱,对于高校资源条件的要求还不足以保证其教育质量,而对高等院校的评估应该重视与教育质量有更直接关系的学生学习效果”[1]。很多国家的教育评价研究都得出了类似的结论,如英国高等教育质量保障局于2001年公布的适用于全国的学位标准,在阐述各级学位的质量和水准时,几乎用了一半篇幅列举各级学位持有人应有的学习产出。[2]美国以法律条款对学生的学习成就加以规定,要求评估者从两方面把握高校的绩效责任:一是高校所确立的对学生学习效果的期望水准,二是该水准已经实现的证据。[3]欧盟高等教育质量保障协会制定的《欧洲地区高等教育质量保障准则与标准》第三项“对学生的评价”也指出,“要突出对学生学习产出的测量”,“要为高校提供教学成效和学生支持等方面有价值的信息”[4]。可见,越来越多国家的高等教育评价均聚焦于学生的学习效果,这对于我国高等教育质量评价无疑具有重要的启迪和借鉴意义。

国内基础教育评价也正在借鉴国外教育评价的先进经验,把学生看作是教育质量的最终体现者,因而把学生学习效果的评价作为教育评价的核心。教育部基础教育质量监测中心从2007年成立以来,已对数学、语文、外语等科目的教育质量开展了评价监测。国内外教育评价理论和实践的发展趋势都启示,以学生的学习效果为逻辑起点,构建高校思想政治理论课教育教学评价新理念和质量监测新方案,不仅是必要的,而且也是可行的。

三、“高校思想政治理论课教育教学质量监测体系”研究的基本思路

首先,从理念上坚持“发展性评价”并实现“三个转向”。即从重过程评价向重结果评价转向;从重教师、条件测评向重学生学习效果测评转向;从面面俱到向重点突破转向。因为一定的资源条件占有,并不一定与学习效果和质量成正比。

其次,从研制思想政治理论课四门必修课的教育教学质量监测工具入手。每门课三套测试卷(需具有同等效度、信度),每套测试卷包含四个模块的测试内容:一是基本情况(便于分类统计处理);二是对该课程后知识的掌握、能力的提高情况(运用考试学理论和方法);三是对该课程的情感、态度、价值观的进步情况(运用心理测量理论和方法);四是对二、三的进步情况作归因分析的题目(运用社会调查原理与方法)。

再次,监测工具研制中做到“三个突出”。高校思想政治理论课与中学思想品德、思想政治课不同,未编写课程标准和教学大纲,在测评中如何明确测试目标和观察点?唯有吃透教材,突出各门课程的核心内容、重要观点和要求。四门课程除测试知识掌握的试题各不相同外,在测试能力、情感、态度、价值观的题目中形式雷同怎么办?要把握区分度,突出各门课程教学的特殊要求。在归因分析中,思想政治理论课与语文、数学、外语等课显著不同,学生的进步同时也受到社会、家庭和大众传媒、网络的影响,如何判断与思想政治理论课教学的相关度?在分析题设计中唯有努力突出该课教育教学的影响因子,才有可能得出正确结论。

最后,思想政治理论课教育教学质量监测工具的优越性。按上述思路取得突破,将具有以下优越性:一是主要在网上操作,测试题多用选择题,测能力的题也努力作到主观试题客观化,因此运行成本低而效率高;二是地方教育主管部门、高校教师可方便灵活地经常使用;三是跟踪测评、动态发展,还有利于作纵向分析、横向比较;四是有利于及时掌握学生学习效果,发现问题,及时改进工作,领导教师由被动转为主动,一般不会出现逆反心理而采取应付态度。

当然,思想政治理论课教育教学质量监测工具的研制,是以普通高校为使用者来设计的。其他高校使用时则需结合实际变通使用并对测试题作相应调整。

测试卷中的题目内容应当根据形势的发展、教学内容的与时俱进,作出相应调整。因此,如全面推广和经常使用,势必要求建立题库,设立专门机构。是建立中介机构、协会,还是委托某个高校、机构来抓思想政治理论课教育质量监测工作,这需要从我国实际出发来确定。同时,如果在面上主要运用思想政治理论课教育教学质量监测工具,也不排斥各地各高校采用多种多样的直接测评、间接测评手段和办法。总之,只要是有利于收集学生学习效果的各种信息、证据的办法都可以用。这样,才能更好地实现测评方式的多样化、评价主体的多元化、评价内容的丰富性,才能更好地通过测评促进师生的进步和发展。

参考文献

[1]魏红,钟秉林.重视学生学习效果,改善教育评估效能――国际高等教育评估发展新趋势及其启示[J].中国高教研究,2009(10):16-19.

教育测量与评价论文第4篇

关键词:构建 德育测评 理论探析

《中国普通高校德育大纲》指出:“德育考评是高校德育工作的重要环节,是实现高校德育目标的必要保证。”目前,高校的德育评价工作面临新的挑战,如何适应新形势,进一步加强和改进大学生德育评价工作,特别是制定科学有效的大学生德育测评体系是我们需要深入思考的重要课题。

一、大学生德育测评体系构建的理论基础

1.哲学方法论基础:系统论。

系统论为大学生德育素质测评指标体系的创建提供了方法论。系统论原理讲究事物的整体性、有序性和动态原则。整体思想是系统论的核心。按照整体思想的观点,大学生的思想政治、品德的知、情、意、信、行这五项心理要素特征相互联系、相互作用,是知行协调统一的整体。在创建这个测评指标体系时,坚持知行统一评价;有序性要求我们既要反映测评的诸多要素,又不能等同对待,因为相对而言大学生“行”的状况更能反映其思想政治素质的水平,所以我们更应赋予大学生“行”的评价较大比重;动态性要求我们要紧扣时展的要求,从学生的实际情况和发展来把握测评指标体系的调整速度,从而体现测评指标体系的针对性。

2.心理学基础:“知、情、意、信、行”的发展规律。

心理学研究表明:学生思想道德的形成要经历“知、情、意、信、行”,由简单到复杂,由量变到质变循环往复过程,表现为认知产生思想,思想支配行为,行为改造外界并形成新认识和新思想,产生新行为,进一步改造外界。可见,学生的一言一行投射出学生的所思所想。因此,从理论上讲,对学生德育进行测评是完全科学的。尽管大学生的思想、政治、品德素质是精神性的、变动性的东西,但借助于测评技术,能使我们较客观地认识德育现象与规律,认识大学生真实的思想、政治、品德、个性及行为面貌。

3.教育学基础:多元智力理论。

多元智力理论认为人的智力有语言智力、数理智力、空间智力、动觉智力、节奏智力、人际智力和内省智力等几种,它们通常以复杂的方式综合运作。根据多元智力理论,大学生德育素质的测评不应偏重于某个单项测评结果对学生进行分类、排名次,或者贴标签,而应该采用多元评价结果的方式,体系的设置应涉及对学生的“两课”学习情况和学生思想、政治、品德的实践情况进行全方位的综合测评。

二、大学生德育测评体系构建的基本原则

构建大学生德育素质评价体系,必须遵循以下基本原则:

1.科学性原则:指构建的测评指标体系要全面完整、层次分明、要求明确,能反映大学生思想、政治、品德素质的本质及各个方面,即不仅要测评大学生对思想政治品德理论知识的掌握情况,更要突出测评大学生对思想、政治、道德的情感、信念和行为等方面的发展情况。即测评目的要从传统评价的“预测”、“控制”、“选拔”转移到“发展”上来,即从选拔适合教育的学生转到创造适合学生的教育。同时测评指标自身的概念的表达也要科学而严密,其量化和取值尽可能科学、合理,它所体现的要求要符合大学生德育水平及其发展规律,使测评结果有较强的权威性和可比性。

2.导向性原则:所谓导向,就是指导大学生的品德朝着社会所期望的方向发展。大学生德育素质评价体系了体现社会对大学生的要求,评价指标体系的评价内容和各项指标的权重赋值以及评价结果的合理运用,对大学生会具有明显的导向作用。品德测评的根本目的不是对学生的德性进行终极性的诊断、甄别与分类,而是注重个体在测评过程中的积极体验,强化自我意识,以调动测评对象的积极性,帮助学生树立成功的信心,自觉趋近德育目标,促进学生更好地全面发展。

3.层次性原则:指测评指标体系的创建要从实际出发,针对学生的不同类型、不同年级和个体差异来进行创建。人的发展是有差异的,这种差异可以体现在年龄、知识、能力、性格、兴趣、行为表现等多方面。所以我们研究创建的测评指标体系只有是多种层次的,才能准确地反映出大学生每个个体在不同年级、不同方面的发展水平,才能使每个大学生都能发现自己的长处,增强自信。

4.主体性原则:大学生德育测评的目的是为了实现大学生更好的发展,大学生应当成为测评的主人。以往评价主体多为教师和评价小组,主要是他评,大学生处于被评价者的地位,导致评价缺乏大学生的坦诚参与,从而使评价的调节、激励、改进功能不能得到很好的发挥。要充分发挥大学生在德育测评中的主体作用,让大学生参与评价自己并给予一定比例记分,增强其参与意识,引导大学生自觉重视测评过程和结果,并充分发挥自我教育功能,从而自觉调整思想和行为。

5.实用性原则:一方面是指测评指标体系要从大学生的实际出发制定,各项指标都可以进行实际观察、测定或测评,便于高校操作实行,给出符合评价对象实际情况的评价、指标分值;另一方面是指测评指标体系的创建要与社会用人机制和社会需求接轨,为社会所接受。使其既能满足大学生了解自身的思想、政治、品德素质状况,有目的地提高自身素质,适应个人未来职业设计的需要,同时也能满足社会对大学生素质的多层次、多维度的选拔需要。

三、大学生德育测评体系构建的现实意义

1.有利于大学生充分发挥自我评价和自我教育管理功能,不断提高自身德育素质。

从高校德育主体与客体、内因与外因的关系看,任何一个道德目标的达成,最终都是自我教育的结果。心理学原理说明,自我教育离不开自我评价,正确地认识自我,客观、正确地评价自我,就能量力而行,为确立合适的理想自我并实现理想自我而不懈努力。建立德育测评体系就是把德育目标、德育内容以定性和定量的形式明确规定,用制度细化大学生思想行为准则,有利于大学生比照这些标准,明确应当做什么,怎么做,随时进行自我“测”、“量”,对测评项目进行价值上的判断分析,对自己品德发展水平作出评价,进而调整自己的行为表现,自觉趋近德育目标,从而形成正确的思想与行为。总之,大学生德育测评体系的构建为大学生对照体系进行自我测评提供了可能,有利于大学生正确认识自己优点和缺点,不断提高自我评价、自我教育能力,促使大学生按照德育目标不断提高自身德育素质。

2.有助于落实德育地位,促进高校德育工作的发展。

构建大学生德育素质测评体系,是把大学生思想道德素质评估由软变硬、由虚变实的重要措施,是掌握和激励大学生思想道德素质的有效制度。长期以来,高校德育首位的地位还没有落实。这其中一个重要原因就是缺乏科学完整的高校德育评价体系,尤其是缺乏科学、全面的大学生德育素质的评价体系。可见,只有构建大学生德育素质测评体系并实施测评,才能够使德育看得见、摸得着,实在可行,真正实现“德育为首,诸育并举”;同时,建立测评体系对大学生德育素质进行科学评价是高校德育工作的实体内容之一,既可以为“两课”教师提供反馈信息,增强“两课”教学的针对性、实效性,从而较好地解决以往“两课”教学“虚多实少”,又可以将大学生德育管理目标细化分解,使其具体化、可操作化,把德育教育与日常管理相结合,从而增强德育实效。另外,测评体系的建立通过充分发挥大学生自我评价、自我教育和管理的作用,从而有助于学生政工干部从一些日常的德育活动中解放出来,加强研究德育的动态发展,整体把握德育过程,促使高校德育工作的科学化和系统化,实现德育的良性循环和质量的提高。

3.有利于实现对大学生综合素质的测评,全面提高高等教育的质量。

高等教育数量扩张迫切需要通过建立健全系统的、科学的、高效的质量保障与评价机制,大力加强高等教育的全面质量管理。随着我国高等教育从精英阶段向大众化阶段的过渡,一些不利因素影响到我国的高等教育质量。如高等学校连续几年扩大招生,使得大学生生均教育经费、生均占有图书资料的数量、教学实验(实习)的条件等硬件资源减少,以及相应师资的数量和质量等软件资源不足,另外毛入学率的提高而带来生源质量相对下降等等。而不断提高大学生的素质尤其是提高大学生的思想、政治、品德素质质量是关系到高等教育能否培养出德才兼备的社会主义现代化的合格建设者和接班人的重大问题,因而,构建科学、合理、全面的大学生德育素质测评体系,就为确保高等教育的质量的提高提供了明确的德育标准,有利于消除大学生综合素质测评过程中普遍存在的“一手软,一手硬”现象,也将为大学生科学文化素质测评体系的构建和完善提供重要的参考和借鉴,从而真正实现对大学生综合素质的科学测评,满足社会选拔人才的需要,确保高校全面提高高等教育的质量,为社会培养德才兼备的人才。

参考文献:

[1]邓艳葵.构建新型的大学生德育测评指标体系探析[J].广西社会科学,2002,(2).

[2]林雷.高校学生思想品德行为量化测评浅探[J].南京人口管理干部学院学报,2001,(6).

[3]王健敏.学生品德测评系统的改革与探索[J].课程・教材・教法,2002,(l).

[4]张辉.大学生思想、政治、品德素质测试指标体系的研究.东北师范大学硕士学位论文,2003,(10).

[5]李上文.大学生道德养成教育的基木途径[J].学校党建与思想教育,2003,(1).

教育测量与评价论文第5篇

[关键词]旅游;培养方案;质量评估

[中图分类号]F59

[文献标识码]A

[文章编号]1002―5006(2011)04―0082―08

1 引言

随着旅游产业的发展,世界范围内的接待、旅游、休闲课程(即HTLPs:hospitality,tourism,leisureprograms)也迅速发展起来。中国的旅游教育始于20世纪70年代末80年代初,与中国的旅游业同时起步。蓬勃发展的旅游产业和国家政策吸引大量院校开始兴办旅游专业。中国旅游教育逐渐形成从上至下的包括博士、硕士、本科、高职和中职教育的金字塔体系。2009年,开设旅游课程的院校高达1733所,其中852所提供旅游高等教育课程,881所是中等旅游职业学校,旅游专业在校生达到952400人。然而,旅游院校和旅游专业学生数量上的增长却带来了教育质量控制方面的问题。要保证旅游教育质量的提高和旅游专业学生的竞争力,把教育评价或认证引入旅游专业培养方案的评价,具有十分重要的意义。

高等教育的复杂性及其多维本质使得教育质量的评价十分困难和复杂,因此学界对教育质量的实证性调查研究成果很少。国外的研究主要是把全面质量管理(TQM)理论(如美国波多里奇国家质量奖,即MBNQA:the Malcom Baldridge NationalQuality Award)引入高等教育领域。米兹卡茨(Mizikaci)认为,只有修正全面质量管理的维度才能满足教育课程管理的需要。此外,传统的教育评价模型,如背景、输入、过程、成果(CIPP:context,input,process,product)评价、目标游离评价和应答评价需要进一步的提炼,方能适应高等教育课程质量评价的需要。高等教育质量评价模型的开发需要运用全新的视野,结合质量管理理论和相关教育理论,来适应现代语境下高等教育的发展。因此,无论是外部评价还是内部评价,有效的理论和实证工具就显得十分重要。

自我评价是高等教育质量保障体系的重要方面。作为旅游培养方案的内部利益相关者,旅游专业教师应该能够评价他们自己的培养方案,也可以充当同行评价者的角色,在既定的标准上评价其他院校的旅游专业培养方案。从测评角度看,专业教师熟悉相关课程,能够评价课程的质量,并能验证测量工具的有效性。以往的研究大量调查了旅游专业学生、行政管理人员等旅游教育利益相关者的观点,但是作为利益相关者的旅游专业教师却被大大忽视了。因此,调查旅游专业教师对给定的旅游专业培养方案的认知及其质量评估所持的基本观点,对测量、监控、确认和提高旅游高等院校的教学水平和学术水平具有重要意义。

本项研究的目的是要开发和验证旅游本科培养方案质量测评工具,并审视旅游本科院校旅游专业教师所评价的旅游本科培养方案质量各个维度的相对重要性。通过整合TQM理论和CIPP理论,确定旅游专业培养方案质量评价的维度;通过界定和验证旅游教育的多维本质,为审视每一个质量标准的相对重要性提供学术的注解和视角;同时也可以为旅游本科院校以及外部的质量保证机构提供一个有效的旅游本科培养方案质量评估工具。

2 旅游本科培养方案质量评估理论模型

2.1 相关概念界定

质量。质量是“反映实体(产品过程或活动等)满足明确和隐含的需要的能力的特性总和(IS08402:1994)”,质量是“一组固有特性满足要求的程度(IS09000:2000)”,这是国际标准化组织(ISO)众多质量概念中最为流行的定义。本文以IS09000质量定义为基础来构建旅游本科培养方案质量的维度,即认同旅游教育质量的多维特征。

教育质量标准。本文采用霍顿(Houghton)的定义:教育质量标准是培养单位或培养方案对教育哲学(理念)、行政管理体系、师资队伍、学生全体、教学资源和专业特性等方面的基本陈述(essential statements)。这一定义是国际教育界比较认同的教育质量标准的可操作性概念。

教育质量维度。在国际上,旅游教育质量研究通常使用dimension一词,即本文中的维度。维度是一个判断、说明、评价和确定一事物的多方位、多角度和多层次的条件和概念。旅游教育质量维度是评价主体评价旅游教育质量的空间范围和视角方位。

教育质量指标。西方学界主要通过界定、确认和验证教育质量指标来反映教育质量维度,并就“教育质量指标是描述教育运行预期结果和教育系统具体特征的具体陈述(concrete statements)”这一界定基本达成共识。

2.2 文献综述

文献梳理表明,国外主要是通过构建开发程序(construct development procedures),以构建三级维度(一级维度,即标准;二级维度,即用来反映和观测教育质量标准的维度;三级维度是教育质量指标,即具体的测试语句)的研究路径来开发培养方案质量评估模型。教育质量的多维特征表明,教育质量的评价需要进行两级构建。关(Kwan)和瓦尔克(Walker)的研究证实,通过两级构建(包括the higher-order construct和the second-order construct),可以确认教育质量每一维度的相对重要性。阿尔图尔基(Al-Turki)和杜发(Duffaa)运用CIPP模型对典型学术部门绩效测量(performance measures)进行两级构建,开发出了学术部门绩效测量模型。

林永柏总结国内外教育质量概念的流变、发展和演变过程,并对各个教育质量概念的描述维度做出了准确归纳。林的研究认为,无论怎样认识教育质量,都需要清晰界定教育质量的标准和诸多维度以及每一维度所对应的指标。诸如评价和认证类的质量测评应该根据有效的、相关的、可测量的和可操作的标准和指标来实施。

从质量评价发展演变角度看,CIPP模型对教育质量评价产生重要影响,被广泛应用于课程质量评价。CIPP模型运用系统研究方法,实施背景、输入、过程、成果4大要素评价以及反馈评价,让政策制定者理解教育现象中的过程与结果。在商业领域,MBNQA模型被广泛认为是一个有效的商业质量管理模型。2004年,基于MBNQA基础的教育标准建立,包括7大维度:领导;战略管理;学生、利益相关

第二步:工具构建。研究小组运用先导测试(pilot test)和专家验证来进一步修正和确认工具中的测试语句,以便进一步评估和纯化量表。结合旅游本科培养方案质量指标所生成的80个项目,通过先导测试再次纯化量表。量表项目(即测试语句)采用李克特5级量表,计分方式以“很不同意”、“不同意”、“一般”、“比较同意”、“很同意”分别赋值1、2、3、4、5分。2009年10月,65名本科院校旅游专业教师为量表的80个项目打分。在这一阶段,要完成两个任务:根据回收问卷的回答情况,把没有回答或感觉难以回答的问题项目加以删除;对保留的项目进行项目总体(itemIto-total)相关分析(相关系数值大于0.3)和内部一致性分析(Cronbach’sα值大于0.7)。通过先导测试,筛选了量表中的项目,把80个项目缩减为68个,形成旅游本科培养方案质量初级评价工具。

第三步:计量属性评价。把收集的样本进行两次EFA(探索性因素)分析。运用EFA分析检验量表的信度和效度,对旅游本科专业培养方案质量评估模型进行初步验证。

4 实证研究

4.1 问卷调查与样本收集

样本数据来源于35所旅游本科院校的旅游管理专业教师。通过搜索中国高等学校网,研究小组根据中国旅游年鉴统计开设了旅游专业本科院校的情况,随机抽取了成立旅游管理院系的35所本科院校名单。通过相关校(院)系网站,获得了部分教师的个人邮箱。2009年10~11月,研究小组通过电子邮件(E-mail)形式把问卷发给这35所高等院校的479名旅游专业教师,共回收有效问卷263份,有效问卷回收率为54.9%。其中,男179名,女84名;本科138人、硕士83人和博士42人;工作1~3年的教师98人,4~6年的74人,7~9年的55人,10年以上的36人。

4.2 探索性因子分析

探索性因子分析将获得每个测量题项与因子之间(指标与要素之间)的因子载荷量(FactorLoading)。因子载荷量越高,表明测量题项与因子之间的关联性越强。对样本的探索性因子分析分两步进行。

第一步,运用主轴法,采取斜交旋转,来萃取因子,最后保留因子荷载量最大而且在0.5以上的55个变量。利用相关系数矩阵,在55个变量构面找出特征根值大于1的共同因子个数(因为篇幅所限,相关系数矩阵省略)。探索性因子分析结果表明,13个测量题项中因子荷载小于0.5的应予以删除,标准2(教学与学习)和标准3(课程)应合并成为一个标准,萃取出的公共因子有12个,而不是初级模型中的18个。

第二步,运用相同的方法对55项观测变量进行第二次探索性因素分析。结果显示,55项观测变量经萃取形成6大公共因子,形成修正后的旅游本科专业培养方案模型。所有观测维度变量的平均值大于3,说明旅游专业教师对旅游本科培养方案的观测维度都持积极评价;6大公共因子为旅游本科培养方案质量的有效预测因子,解释变异量在51.85%至66.86%之间。量表的内部一致性系数在0.78至0.95之间,表明量表的内部一致性良好。研究结果表明,样本结构的有效性强,每个指标在相应因子上的载荷量均大于0.5的临界值(表3和表4)。

5 结论与讨论

5.1 结论

本研究表明,在严格的建构开发程序基础上,可以把CIPP模型和MBNQA模型很好地结合起来,开发出旅游本科培养方案质量评价模型。旅游本科培养方案质量包括6大标准(战略管理、课程与指导、资源、师资、学生业绩、行政管理),在这些标准之下形成12个观测维度(远景、使命、目的和目标;自我提高;课程;教学与学习;资源与管理;教学空间;教师质量;教师业绩;学生和毕业生业绩;校友反馈;行政管理能力;学生管理)(表4),并在相应的维度下生成55个测量指标(表3)。作为一种测评工具,旅游本科培养方案质量评估修正模型得到初步验证,为旅游本科培养方案的评判提供了初步的概念性和指导性意见。

在考虑了CIPP要素的基础上,旅游本科培养方案评估工具(修正模型)重新界定了旅游课程质量的诸多维度,并把这些维度转化为有形的、可用来描述和测评这一教育体系期望结果的观测项目。此外,旅游本科培养方案评估工具(修正模型)还引入了MBNQA模型中的维度,这与目前教育质量评价和认证过程中运用的全面质量管理方法也是一致的。

对课程和教与学标准的进一步强调是与课程和指导原则相一致的。课程、教学与学习三者相互补充和促进,这些关键性因素在很大程度上影响教学的效果和学生的成绩,也相应地影响教育机构的质量业绩。课程与指导是Tedqual和ACPHA两大评价模型中强调的一大标准,包括课程内容与设计,也包括教学、学习和评价3方面。

具体来说,本研究考察了旅游专业教师对旅游培养方案质量不同维度的重要性的认识。研究结果表明,培养方案质量标准都有很高的因子荷载(表3)。被调查者认为,这6大质量标准对培养方案的质量具有显著意义。被调查者相信,CIPP模型中的输入(如课程与师资)和过程(如指导),在决定培养方案质量上是重要的影响因子。研究结果支持“课程质量、有效的教学和学生学习结果的提高是教育质量管理的基本方面”这一观点。旅游培养方案质量评估模型确认,培养方案应该优先考虑课程、教学与学习和师资的质量管理,来满足学生的需要。因此,需要我们高度关注“什么是一个好的旅游教师,什么是一个好的学习体验,什么是一个全面的学习体验”。研究结果还表明,一个成功的旅游本科培养方案,关键在于作为旅游专业教师和研究者的学术队伍的质量。“教师的资历、研究活动和产业经验反映在所教的课程中,就更加重要。”

研究结果还表明,战略规划和行政管理对质量有重要影响。传统的评价理论不太强调战略管理和领导能力对质量的影响,但旅游本科培养方案质量评估模型把这些要素作为测评的变量。这验证了基于TMQ(全面质量管理)教育质量模型中的核心要素(如领导者忠诚、战略管理、工作管理和自我完善机制)在旅游本科培养方案质量中的积极作用。学生、毕业生和校友的业绩反映了教育的结果。这个产出因素在旅游本科培养方案质量模型中被认为是学生业绩,要评价学生产出的情况,学生业绩应属于培养方案质量评价和认知工具中的一个范畴。

在6大标准中,被调查者认为,资源是影响培养方案质量相对次要的一个维度,这一结论与佩雷达(Pereda)等的研究结论基本一致。造成这一认识的原因有:资源是教育输入的基础,但资源本身不能自动转化为好的学习体验,不能保证旅游教育的质量;很多旅游专业教师认为,旅游本科培养方案应以实践为导向,大多课程都能提供实习的机会,旅游本科培养方案的内在资源对方案全面质量的影响可能要相对小一些。

教育测量与评价论文第6篇

关键词:汉语教学 汉语教学评价 国外教育评价流派

汉语作为第二语言教学既指的是在中国进行的对外国人的汉语教学,也指的是世界各地的汉语教学,还指对中国国内少数民族的汉语教学,我们把这种教学简单的称为“汉语教学”。[1]汉语教学评价虽然是一门年轻的学科,但是已经成为评估和检测对汉语教学目标、教学过程、教学效果、教学大纲制定、教材选择等的有效手段。作为教育评价的一个分支,教育评价既要遵循教育评价的一般规律,也有自身的学科特点。分析国外教育评价的不同发展阶段的特点,对于丰富和深化我国汉语教学评价理论有重要的理论价值,对于提高汉语教学质量有重要的实践意义。

一.国外教育评价的发展阶段

国外教育评价划分为四个理论阶段:第一阶段是“测量时期”,十九世纪末至二十世纪三十年代。英国的高尔顿通过对个体差异的长期研究,于1869年发表了《遗传的天才》一书,揭开了教育测量的序幕。1879年,德国的冯特在莱比锡逐步摸索出了一套实验心理学测量方法;1889年厄恩编制的测验,将能力分为知觉、记忆、联想和运动机能等四种;1892年波尔顿试行记数测验,测量儿童记忆力;1896年艾宾浩斯首先用填充法测量学生智力;1897年,美国的莱斯发表了他对20个学校的1600名学生所作的拼字测验的结果,引起了人们对测验方法的普遍关注;“1904年,美国的桑代克发表了《心理与社会测量导论》一书,提出了“凡存在的东西都有数量,凡有数量的东西都可以测量”的基本观点,为教育测量奠定了理论基础,对教育测量学的建设与发展做出了巨大贡献。”[2]这一时期,以测量作为标志,追求的是教育客观化渗透了教学工作的各个方面。

第二阶段是“描述时期”,二十世纪三十年代至五十年代。“1929年资本主义世界经济危机的爆发导致美国经济的大衰退,也引起人们重新评价中学的课程设置、教学大纲以及中学与大学之间的关系,从而对教育也提出了新的需求。社会各界纷纷要求改革现有的教育制度,以便适应社会发展和满足学生需求。于是,在“进步教育协会”的指导下开始了这项为期8年的实验研究。”[3]“八年研究”结束时,以泰勒(Ralph W Tyler)为首的学院追踪研究组,对“八年研究”的结果进行了评价。1949年,泰勒正式出版了被奉为课程论圣经的《课程与教学的基本原理》一书,总结了他在“八年研究”中的成果,正式提出教育评价的概念,使人们在思想上和行动上接受了采用教育评价方法来描述教育效果这一观点,其特征是对测验结果进行“描述”,并力求教育标准化。

第三阶段是“判断时期”,大约出现于一九五零年至一九七零年。1963年,克龙巴赫在其题为《通过评价改进课程》的论文中,把教育评价的内涵阐述为:“为作出关于教育方案的决策,收集和使用信息。”1967年斯克里芬发表了《评价方法论》提出了一个完整的、包含描述与判断两个方面的评价模式。他们认为评价的依据不是方案制定者的预定目标,而是参与活动者的实际成效。评价者的思考应该从教育方案想干什么变成教育方案实际干了些什么。评价者不仅要运用测量手段去收集各种信息,还要根据一定的价值取向评判教育,追求教育多元化。这样,判断就成了第三代教育评价的标志。

第四阶段是“同构时期”,出现在上世纪七十年代后期至今。第四代评价理论的创立者美国印第安纳大学教育学院枯巴(Egong Guba)教授和维德比尔大学高等教育学院副教授林肯(Yvonna Session Lincoln)依据建构主义方法论,1989年他们出版了名为《第四代教育评价》的专著,针对前三代评价中存在的“浓厚的管理主义倾向”、“忽视价值多元性”和“过分强调科学实证主义的方法”等缺点和不足,对评价的本质进行了有益的探讨,主要包括:心理构建论。教育评价从本质上说是一种心理构建,评价所表述的是评价者对评价对象的一种认识。评价结果也是其双方交互作用的“产物”。

价值协调论。教育评价是协调价值观的过程,在评价过程中,评价者与评价对象之间,在教育价值观上存在着差异,这种“差异”观点将纠正传统评价理论价值是一致的、单一的观点,表现为价值系统的多元化。

评价结果认同论。评价结果不依赖于评价对象的状况与客观现实符合的程度,而是参与评价活动的人关于评价对象状况的不同意见交换、认同的结果。

二.国外教育评价的流派

(一)行为目标模式。19世纪下半叶和20世纪最初三十年,课程和测验都是以教科书为中心加以编制,测验内容只是要求学生记诵教材的知识内容,不能反映出学生的实际需要。在这种情况下,美国俄亥俄州立大学教育科学研究所教授泰勒(Tayler, R.W)主持了课程与评价的研究,正式提出了教育评价的概念。泰勒把评价理解为“评价过程在本质上,乃是一种测量课程和教学方案在多大程度上达到了教育目标的过程。”行为目标模式是一个封闭的系统,包括:确定目标、选择经验、组织经验、评价结果。即以目标为中心,通过具体的行为变化来判断教育目标实现的程度是泰勒教育评价的主旨。

(二)CIPP模式。它是由背景(Context)评价、输入(Input)评价、过程(Process)评价和成果(Procluct)评价这四种评价组成的一种综合评价模式。它由美国的塔弗尔比姆(Stufflebeam)1966年提出的,它以决策为中心,为决策的不同方面提供信息。背景评价形成计划决策,输入评价为组织决策服务,过程评价指导实施决策,成果评价为再循环评价效力。CIPP模式将目标纳入了评价体系中,使得这种评价更完整更科学。它同时重视形成性评价,时刻考虑为决策者提供信息,使得评价活动更具备实用性和方向性。

(三)目标游离模式。1967年美国的斯克里芬(M.Scriven)提出他认为,实际进行的教育活动除了收到预期效应外,还会产生各种“非预期效应”,或者叫“副效应”或“第二效应”。布卢姆也说过:“人们无法预料教学所产生的成果的全部范围。没有预料不到的成果,教学也就不成为一种艺术了。”[4]斯克里芬认为泰勒将评价限于衡量达到教育目标的程度是不全面的,因为很容易让人忽视非预期的效果。这种非预期效应的影响有时是重要的,而在目标评价中却得不到反映。他不提倡让把评价的目标告诉被评价者,使得评价者搜集有关方案的全部成果信息。

(三)应答模式。这一模式由斯塔克(Stake.R.E)提出。他认为,要使评价结果能真正产生效用,评价人必须和这一活动所有参与者的不断对话,通过正式访谈、描述分析等自然主义方法获得信息反馈,使活动结果能满足各种人的需要,他认为解决问题只能依靠那些接触问题的人,这样的调查毫无疑问可信度比较高。斯塔克还强调“多元现实性”,反映了参评人员一定的需要,具备一定的民主性。

(四)反对者模式。反对者模式(adversary model)是由美国学者欧文斯(Owens,T.)等人在上世纪70年代中叶提出的。该模式为了揭示方案正、反两方面长短得失,采取准法律过程评委会审议形式的评价模式。它主张让持不同意见的评价者一起参与教育活动和教育方案的谈判。这一评价的基本特点是充分反映了各类人员“多元的”价值认识,依靠人们直觉与经验进行评价。

反对者模式的另一种形式是由美国学者沃尔夫于1973年提出的司法模式。沃尔夫的司法模式由下述四个阶段组成:争论的提出、争论的选择、辩论的准备、听证。反对者模式有助于决策者全面的获得信息,有助于事先使得各种潜在的冲突意见达到一致。

以上并没有把所有的教育评价流派列举出来,每一种流派都有其优势和劣势。关于教育评价流派的发展历史来看,我们可以看出一下趋势:1、评价过程,由封闭转为开放。泰勒模式以目标为出发点和最终归宿,组合成一个封闭的系统。重过程轻结果。CIPP模式及应答模式将评价看做本身的一部分,呈开放式的网络。2、评价内容,由单一转为全面。早先的教育评价只评价学生的学力,最后发展到教学准备、信息输入、教学过程、教学结果、评价参与人员等各个方面。3、价值观念,由客体转为主体。泰勒模式中,目标成为统一的评价尺度,一直到目标游离模式和应答模式中把人的需求也纳入到评价模式中来,逐渐强调人在评价中的作用。4、评价手段,由测试到多样化。从最早推崇各种客观的、标准化的测量,发展到提倡观察、交谈等自然主义方法,为评价提供了可靠地依据。

三.汉语教学和国外教育评价理论

汉语教学评价是汉语教学的一个重要组成部分,它的评价目标与教学目标是一致的,评价方法的使用要受到教学用途和教学阶段的制约,同时教学评价又总是要关注教学的改善,所以汉语教学与教学评价之间的非常紧密的相互依存的联系。[5]简单分析如下:

1、通过教学评价流派的演变,我们可以看到教学评价流派理论为汉语教学评价提供了评价的规则和途径,决定了评价的评价范围和权重比例。对教育评价流派的研究可以为我们提供理解汉语教学教和学的内涵和外延,同时,教育评价流派不仅研究了教学目标,还对评价的背景、信息输入、评价的结果、参与评价者本身、评价目标和实际目标的差距、评价的方法等进行了深入研究,这些理论对诊断汉语教学评价的重难点提供了一定的解释成因的理论依据。

众所周知,汉语教学特别是在汉语作为第二语言教学中,不同的国家由于学生及语言环境等原因的不同,怎样制定一个比较全面能够在一个国家普遍运用的评价规则,就需要从教育评价流派中寻找到理论依据。

2、设置任何一种的汉语教学评价方式都或多或少会受到教育评价流派的影响。为了检验某种教学法的效果和学生学习的效果,新的语言测试评价法都会在新的教育评价流派的影响下出现。教育评价流派无论对汉语教学评价体系的总体设计、评价方案的制定、评价工具的编制、评价活动的展开都有宏观和微观的直接指导的意义。

在汉语教学的综合课中,我们可以充分运用泰勒模式,对学生进行生词学习的检测。课文教学就需要结合学生实际,紧扣汉语作为第二语言教学的特点,把教学目标也纳入评价体系,考虑该目标是否符合本国的学生要求,同时在教学目标和实际目标的对比中,要注重实际目标,培养学生的华语交际能力。

3、教育评价流派理论对学习客体、学习目标、学习内容、信息反馈、限制和避免参与评价者的主观评价等进行了深入研究,对我们研究教材编写、课程设计、课堂教学等这些第二语言教学中极其重要的环节提供了一定的可行性操作方案。

在国内汉语作为第二语言教学理论研究正在如火如荼的进行,和国内火热场面形成强烈对比的是,由于国外的语言环境和教师素质不同,一些国家还在一些基本理论上争论不休,比如普通话和闽南话之争、繁体字和简体字之争、不同课型怎么来上等。教育评价流派为我们怎么去评价这些国家的汉语教学提供了具体可行的方案。比如作文教学目标的制定、听力课的信息反馈、评价学生的实际学习水平等。

如上所述,汉语教学评价是一门综合叉性学科,它的课程特点决定了教育评价流派是它的理论基础之一,深入具体的探讨教育评价流派会使汉语教学评价更加具有科学性和实用性,从而提高汉语教学质量。

参考书目:

[1][5]杨翼:《汉语教学评价》,北京语言文化大学出版社2008年第一版

[2]胡玲翠许有《浅析国外教育评价发展的主要阶段及特点》,《校外教育·理论》2007年第6期

[3]吴艳《美国‘八年研究’初探》2002年教育史硕士论文

教育测量与评价论文第7篇

关键词:中小学教育;学习质量;测评体系

中图分类号:G632 文献标识码:B 文章编号:1002-7661(2016)10-087-01

前言:现代世界在信息化中进行高速的发展,数学是现代科技产品开发的基础保障,是国家创新建设的重要支柱,也是人才培养的重要方向之一。为了使我国在国际市场中更具竞争力,科技型人才的培养是一项重要工作,而保证科技人才培养的一大重要前提就是保证数学教学的质量。在各个国家的基础教育中,数学都是一门重要的学科。鉴于数学在在未来社会发展中起到的重要作用,二十世纪六十年代初便逐渐出现研究学者致力于数学的研究工作。而我国对数学研究成果相对不完善,需要吸取先进经验进行充实。

一、全美教育进展的评价

1、NAEP的发展

NAEP是全美教育的简称,NAEP的发展要从20世纪60年代说起,美国教育部门针对学生学习质量缺少了解,开展了一项全国范围的周期性研究项目,称之为全美教育进展评价,也就是NAEP。此项目使用多维度的评价框架,详细的描述了学生的学习状况,科学的反映出学生对教学知识的掌握情况。此项研究使全美对学生的学习质量有了初步的了解。到80年代时期,不同地区的要求下,NAEP在各州开展了测评体系[1]。随着NAEP发展逐步成熟,越来越受到各教育部门的重视,不仅如此此项研究在国际教育事业中也引起了极度的重视,1988年国际教育进展评价研究使用NAEP的评价体系,在所参与的6个教学机构进行了教学质量评价。足以见得NAEP教学研究成果的质量。

2、NAEP数学评价系统

NAEP的数学评价系统力图描绘出,全美中小学生数学教学成绩的变化状态。NAEP在1990-2003年这个阶段所使用的评价结构包括了,数学内容、数学能力、数学质量三个方向,其中数学内容所指的是书的性质、运算、测量、代数与函数等等,数学能力所指的是对概念的了解、程序性知识等,数学素质干改了推理、交流与关联。到2005年NAEP的数学评价结构所反映的是最新的课程重点与课程目的[2]。为达到在数学内容与了解做数学的方法上保持平衡的效果。

二、国际学生评价项目的研究

1、PISA的评价体系

PISA的概念是国际经济合作与发展组织所进行的国际学生评价项目。PISA的评价是基于终身学习的理念,所提出的论据是认为数学素养是理解与使用数学的能力,以及数学对人类在未来生活与工作中所起到的作用于良好的判断能力。所以PISA的方向是学生未来的发展,所重视的是学生发展的潜能。不只是倾向于学生对数学课程的掌握程度,与数学教学的目的,而是同时吸收校内的教学内容与校外所学习的元素,关注学生在平时生活中使用的数学能力。

2、PISA的数学评价结构

PISA同样是属于定期的持续的评价项目。第一次的评价测查开始于2000年,参与国家高达30个OECD成员国,此后PISA的进度是每三年进行一次测查。PISA的目标是以一个更开阔的角度对学生进行数学的考察。PISA的基本结构涵盖了三个方面,第一个是数学内容,通过更广泛的意义去理解数学内容,例如定量推理、从属关系等等。第二个是数学过程,所指向的是思考与推理、交流、解决问题等等呢过。第三个是数学情景,所指向的是人的生活、工作、科学关系等想关联的情景。更加开阔了评价的范围。

三、已有研究结论对我国教育评价的启示

1、确定正确评价目标的前提

正确的评价目标属于建设可续评价系统的前提。对于技术数学质量的评价需要以提升教学质量,以及学生数学素质为方向。国内现阶段的数学教育评价对基础数学教育的改革行程了阻碍。现阶段的书序质量评价主要重视的是高难度方向,目标是甄别与选拔服务,在一定程度上屏蔽了评价系统的反馈学生发展的性能。科学性的数学评价系统需要着眼于学生未来的发展,科学的反应学生的学习状态。

2、确保教育评价的科学规范实施

目前已经形成的国际数学研究结论是,客观的研究资料、严格的测查过程是进行成功评价研究的保障。结合研究过程来看,要先保证调查抽样的随机性,对国内中小学生进行测评时,要涵盖各个范围的中小学教学机构,避免抽样调查的不全面性。在进行全面测查前,可进行小范围内的测评,对测查中可能出现的问题进行提前掌握,确保测查的有效进行[3]。测查方式可选择多种渠道,最后在进行测查结果分析时要确保其真实。可靠,在收集测查结果是要细致,测查结果不仅要显示学生的数学学习情况,还应该查看数学素养的发展进程。

结论:国际数学测评的最新理念与测评的最新方式,对我国进行素质教育为中心的教育改革具有一定的启发。我国教育的发展长期以来受制于应试教育的模式,形成的教育发展进度的重要阻碍。在我国教学模式中各类的考试也是在进行学生的测评,若是在测评过程中,加入学生过程测评与数学素养测评则更具现展的意义。对中小学数学测评的研究,可对国际现有的先进研究成果进行借鉴,充分丰富我国中小学数学测评的理论依据,提升教育改的的进度。

参考文献:

[1] 张维忠,孙庆括.我国数学文化与数学教育研究30年的回顾与反思[J].当代教育与文化,2011,02(06):41-48.

教育测量与评价论文第8篇

关键词: 中学作文评价 作文文体教学 驾驭文体能力 内容效度 效标效度

高中语文人教版“表达与交流”模块对高中写作教学无疑具有指挥棒的作用。由五本课本中“表达与交流”内容编排的分析,我们可以看出教材注重什么淡化什么。具体为必修一:心音共鸣――写触动心灵的人和事,亲近自然――写景要抓住特征,人性光辉――写人要凸显个性,黄河九曲――写事要有点波澜。必修二:直面挫折学习描写,美的发现学习抒情,想象世界学习虚构。必修三:多思善想――学习选取理论的角度,学会宽容――学习选择和使用论据,善待生命――学习论证,爱的奉献――学习议论中的记叙。必修四:解读时间――学习横向展开议论,发现幸福――学习纵向展开议论,确立自信――学习反驳,善于思辨――学习辩证分析。必修五:缘事析理,学习写得深刻;讴歌亲情,学习写得充实;锤炼思想,学习写得有文采;注重创新,学习写得新颖。

不管从标题上,还是从篇目内容及课后练习上,认真分析比较,我们都可以归纳出“表达与交流”的三大内容:一谈如何写好记叙,描写,抒情,议论,二谈“虚构”与真实,侧重虚构,三谈好文章的四项指标――深刻、充实、文采、新颖。没有涉及它们与文体的相关,更没有涉及文体的理论知识与实际操作指导。必修教材的“表达与交流”忠实地执行了我国《语文课程标准》的要求。我国《语文课程标准》并不特别强调文体,小学以叙述文为主;初中有明确的文体要求:“写记叙文,做到内容具体;写简单的说明文,做到明白清楚;写简单的议论文,努力做到有理有据;根据生活需要,写日常应用文。”普通高中只要求综合运用记叙、说明、描写、议论和抒情等表达方式,并没有明确的文体规定。这反映出《语文课程标准》淡化文体意识的价值取向。

美国高中作文教学却与我们不同,文体教学在美国高中作文教学中有着重要地位,在作文教学的几大模块中占有相当大的比重。

如在作文教学纲要和指导观念里,实用文体的写作训练和写作基本能力训练与表达方式的训练共同组成美国的写作教学的三大内容。这三大训练有多种训练体系,有单向的也有综合的。“文体”意识和实际指导在这些体系中随处可见,如“思维―表达训练体系”主要进行思维和文体写作的训练,其他还有一般文体写作训练体系、实用文体写作训练体系。如美国加利福尼亚州的《公立学校英语课程标准》明确要求学生写叙述文、文学评论、研究报告、劝说文、技术性文章及常用应用文,对每一文体都有明确规定。

在实际教学操作中,文体教学得到了同样的重视。

如三册《美国语文》(2004年同心出版社出版的《美国语文―――美国著名中学课文精选》,以下简称《美国语文》)是中国大陆第一套系统引进的西方著名中学语文教材。文体类型(除编译时由于篇幅关系删去的戏剧、诗歌外)统计如下:

文体类型具体类型举例:

(1)小说:短篇小说、科幻小说、长篇小说;

(2)散文:分析散文、讽刺散文、说明散文、思考性散文;

(3)其他类:日志、神话、传说、故事、叙述文、布道、自传、劝说文、演讲、格言、书信、通告、游记、回忆录等。

课后写作练习文体训练类型举例:

(1)想象、娱乐、感受类:神话、短篇小说、科幻小说、电影情景、人物传记、日记、续写、改写、广告、网页制作、格言等;

(2)通告、阐释、描述类:通信、通告、新闻报道、报告、描述性信件、摘要、讣告、课程描述、竞赛公告等;

(3)劝说、建议、说明类:说服性的短文、给校长的建议、建议专栏、收藏者指南、提议、有说服力的信条等;

(4)分析、评论类:文学分析、社论、批判性回应、说服力评价、比较研究等。

与淡化文体教学对应的是中国作文评价标准是面向文学性、诗意和哲理性很强的记叙文、议论文、说明文的通用标准;与注重文体训练对应的是美国评价标准鲜明地体现为分文体定标准。这种分文体制订评价标准的做法是较为严谨的。它能充分反映评价学生驾驭不同文体的能力,较之抽象地评价内容充实否、结构完整否、符合要求的“通用”标准否,更能起到实际的评分指导与规范作用。

我认为美国作文教学对文体教学的重视,是美国作文教学卓有成效的原因之一。在美国教学中最令全球教育界惊奇的事就是美国人普遍具有良好的写作能力,只要受过普通教育的美国人,都能把自己要说的话写在纸上且表达清楚,同时尽可能遣词造句,使意义更准确。而这种情况,反映的正是美国高中作文评价有相当高的效度。

美国作文教学之所以卓有成效,注重文体教学和注重效标效度的分文体制订评价标准的作文评价功不可没。这样的结论不是主观臆测,而是通过客观分析得出的。了解美国文体教学与分文体制订评价标准的作文评价,并对评价效度进行分析,我国作文评价的效度问题亟待解决。

怎么改进甚至改革高中作文教学呢?作文成绩与写作能力是否成正比呢?

举个比较绝对的例子,假如高中作文教学只有新诗教学,作文练习与测评题只有新诗形式的测评题,有这么一个可能结果,老师抱怨作文难教,学生抱怨作文难学难写、没东西可写、太多束缚不自由……还有一个可能结果是,作文测评成绩不错的高中毕业生在社会上不会写读书笔记,不会写文学评论,不会写报告,不会写社论,不会写计划书,不会写基本的商业策划,不会写比赛公告……作文测评成绩不好的高中毕业生在社会上却成了新兴作家或者公司的文案高手……于是作文教学改革呼声四起,兴起了半命题写诗、话题写诗、材料写诗、漫画写诗、不定题材写诗、生活化写诗、心灵化写诗、学生诗作互评、多就少改诗、总评诗、面评诗、每日一诗……

当然,上述是一个较为绝对的例子,可事实是,这个绝对例子与当下高中作文教学内容的关系只不过是五十步与百步的差别。高中作文教学中并未有更多样的文体介绍和指导,在大部分学生的脑海中,他们知道的文体就只有文学性质的记叙文、散文、论点论据论证式议论文、诗歌和戏剧,就在这有限的三四个文体中选择,较之于事实上丰富多样的文体而言,“文体不限”能算是真正意义上的文体不限么?脑海中根本就没有多少文体概念知识,何谈文体不限的选择呢?在记叙文、散文、论点论据论证式议论文、诗歌和戏剧范围内分文体定标准的作文评价是否是真正意义上的分文体定标准作文评价呢?如前文所示美国中学文体训练类型涵盖了工作岗位上大部分的文体写作,培养了美国人而不是美国学生普遍良好的写作能力,而大部分接受过高中作文教学的中国高中毕业生,在进行工作岗位上基本的文案写作时一般都是初次接触,能力匮乏。这不仅是高中语文作文教学中文体教学缺失造成的后果,还反映了对应于淡化文体教学的淡化文体评价的作文评价的低效度。

任何测评都涉及效度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。在作文教学中或者在升学考试中指作文测评的分数反映学生作文真实能力的程度。在判断作文测评是否有效性时,在考虑到测评的内容效度的同时还必须考虑到效标效度。

内容效度最容易理解,它关心的是测量的内容。比如某一个学段进行诗歌写作教学,内容效度就会考察诗歌写作测题是不是与这个学段教授的诗歌写作知识、方法和技能有正相关。

效标效度稍微复杂些,是指当前一项测验结果与作为效标的资料或数量之间的相关程度。效度的高与低,需要有一定的参照点加以考查,尤其是能力的测试。实际上能力都是无法测量的,因此我们只能确定一个或几个能反映能力的标准,然后做间接的比较。这种人为确定的效度标准简称“效标”。效标效度关心的是测量结果和另外一个效标(criterion)的符合程度。比如,据说微软公司招人的时候会考一些类似脑筋急转弯的问题,像“纽约有多少个水井盖”之类。考察者并不真的关心答题者是不是真的知道纽约有多少个水井盖,他关心的是答题者以后的工作业绩(相当于效标)。那么考题到底能在多大程度上预测工作业绩呢,或者说这些考题和工作业绩的相关程度到底如何呢,这就是效标效度。比如,在美国高中作文教学进行的同时,进行多种文体的训练与测评,这个测评,除了关心测评题与教学内容的相关程度外,更关心学生实际生活和工作中的写作能力及发展。测题到底能在多大程度上预测写作能力呢?或者说这些测题与日后的写作能力的相关程度到底如何呢?这就是效标效度。

内容效度和效标效度的区别首先是调查者(investigator)的观察的取向(orientation)不同。使用内容效度的调查者,关心的是测量的得分。比如教师对学生进行写作测验,那么学生在这张试卷上的得分正是教师所关心的。使用效标效度的调查者,他关心的是效标的得分。比如上面举的招聘的例子,公司并不真正在乎你在招聘试题上的得分,他在乎的是你以后的工作业绩(相当于效标),上面举的作文测评的例子,教师还关心学生在以后的生活和工作中的写作能力(相当于效标)。

这是两种效度在观察重心上的区别,另一个明显的区别就是推论(inference)的程度的不同。对使用内容效度的测量者来说,基本上不存在推论。还以作文测题为例,作文成绩高分就说明这学生作文能力好,教师不需要进行推论,作文成绩得分直接说明问题(如果要引申到学生的学习态度就是在进行推论了)。在效标效度的例子里,推论是很明显的。招聘试题上的得分真的能预测将来的工作业绩吗,诗歌写作成绩好真的能预测将来生活和工作中的写作能力吗?局限于记叙文、散文、小说、论点论据论证式议论文和诗歌的写作成绩好,真的能预测将来的写作能力吗?这时候推论的意味已经很强烈了,实际上效标效度就是用来衡量这种推论的可靠性的。

测量者关心的是测量得分时,用内容效度;测量者关心的是效标得分时,用效标效度,也许还需要解释一下,这两种效度并非只能用于不同的作文测题,而是取决于测量者如何使用作文测题。比如,同样是一套或一系列作文测题,两种效度都可以用来考核它,这取决于施测者如何使用这套或者一系列作文测题。如果施测者只想从中知道学生对相关的写作知识和能力的掌握情况,那么他应该关心这套或这个系列作文测题的内容效度如何;如果施测者想以此推断学生将来工作生活中的写作能力,那么他应该关心这套或者这个系列的写作测题的效标效度如何。

在关注效标效度时,不能忽略了同时效度和预测效度。它们是在时间上对效标效度进行的分类。它们的区别是时间上不同,同时效度的效标和原测量工具是同时施测的,而预测效度的效标是在原测量工具之后施测的。比如学习期间正式进行的作文写作测验的同时效度的效标是与这些测验并行的学生写作练习成绩和老师观察评价等,而预测效度的效标则可以是期末考作文成绩,高考作文成绩和生活工作中的写作能力。

前文已经说道,效标效度的使用者真正关心的是效标上的结果,因而待检验的测量工具其实是作为效标的替代物出现的。为什么要使用替代物呢?其理由在预测效度这里很明显,效标是作用于将来的,我现在要知道结果就必须使用替代物。比如要知道学生在将来正式高考时的可能成绩,那么我们需要使用有较高的预测效度的模拟试卷。又或者要知道学生将来写研究报告的能力,那么教学时应该使用有较高的预测性的作文测题;这两个例子里的模拟试卷和写作测题都是为了实现预测的目的而必须使用的替代性的测量工具。

结合以上关于内容效度和效标效度的分析,我国作文教学和作文评价的现状如下:高中作文教学模块“表达与交流”有三大内容:一谈如何写好记叙,描写,抒情,议论,二谈“虚构”与真实,侧重虚构,三谈好文章的四项指标――深刻,充实,文采,新颖。作文评价对应于这三大内容的评价标准。那么从理论上说作文评价已有了较高的内容效度。可是内容效度高并不代表作文评价的效度高,并不能真实反映作文教学的成效如何,是否科学合理。在作文教学中,文体教学的严重缺失,文体意识严重匮乏导致学生日后生活中自由写作思维极为狭隘,没有可供自由选择的文体写作,驾驭文体能力相当乏弱导致学生日后无法快速应对丰富多样的文体写作,这反映了我国高中作文教学评价相当低的效标效度。

事实上,高中毕业后大部分人都有这样的经验,开始社会生活、走上工作岗位后,没有多少人会继续进行我国高中作文类型的写作,例如写文学性、诗意、哲理性很强的记叙文、散文、议论文,反而是当下高中作文教学所淡化的形式规范性很严格而且思维能力要求各具特色的其他文体写作特别是实用文体写作成了很多人的日常写作,可是在作文评价过程中,忽视对效标效度的分析,并没有把驾驭这些文体的写作能力当做预测效标来分析和重视。缺少这种效标效度分析的作文评价就无法发现当下作文教学成效低微,学生应对生活与工作的实际写作能力低弱的真正原因。

参考文献:

[1]黄全愈.高考招生制度改革的追问[J].全球教育展望,2005(5).

[2]陈文中.外国大学入学作文考试的启示[J].中学语文教学,2004(4).

[3]周鸾飞.近五年我国高中教学作文评价的研究[J].湖南师范大学硕士学位论文,2009.5.

[4]贺义廉.高考备考作文训练的现状与误区[J].当代教育论坛,2008第5期.

[5]王选遨.构建符合课程标准要求的写作教学新思路[J].语文教学通讯高中版,2005(3)

[6]朱晓斌.西方写作教学研究的新进展[J].心理科学,2001,VOL24(4).

[7]张娟.我国高考作文命题及评价回归生活的诉求[J].教育测量与评价,2008.9.

[8]黄全愈.“高考”在美国[M].广西师范大学出版社.

[9]瞿宝奎.教育学文集・教育评价[M].人民教育出版社,1989.

[10]张华.课程与教学论[M].上海教育出版社,2000.

教育测量与评价论文第9篇

本次专题研讨会的论文和专家报告表明,我国在基础教育质量评价、检测和监控的研究及实践方面已进入了一个新的发展阶段。

一、看待基础教育质量标准及检测或监控的不同视角

基础教育的质量、质量标准、质量评价、质量检测或监控等,是与会者共同关注的基本问题。大家从多种视角看待上述问题。特邀报告多为宏观视角。专题研讨会论文的视角可分为理论的、区域的和学校的三个层面。

基础教育质量包含的内容过多。办学质量、师资质量、课程质量、教学质量、人的全面发展质量等,都是基础教育质量必须包含的内容。观察基础教育质量的立场和角度也太多。宏观、中观、微观,理论、实践,历史、现实、未来,政府、社会、学校、家长,不同视角的观察,获得的结果和结论有所不同。特别是对于基础教育质量、质量标准的看法存在很多差异。

特别需要澄清的是,监控意义上的基础教育质量,指的是教育的质,而不是教育的量。质的意义上的教育质量,对应着以课程标准为核心的明确的标准(课标),与课程标准相对应的评价(监测或监控)只能用达标与否来表示。也就是说,质的意义上的教育质量,只有一个质的标准,判断的方法,就是看其是否完成了这个任务、达到了这个标准。《教育规划纲要》提出的建立国家基础教育质量标准,就是质的标准;建立基础教育质量监测或监控机制,就是通过恰当的、适用的评价形式,保障全国基础教育都能够完成教育任务、达到教育标准。

量的意义上的教育质量对应的是教育结果(有时还延伸到教育过程)的优劣程度。通过恰当的、适用的评价方法,对教育优劣程度作出判断,将不同地区、学校及教师的教育教学质量水平区分出来,能够给学校或教师的工作质量的高低或优劣进行排名。所谓“不断提高教育质量”,指的就是这种量的意义上的教育质量。

将质和量加以区分,有助于梳理对质量监控的认识,也便于质量监控工作的操作,在某种意义上还有助于对社会和大众的宣传。质,是达到目标,并且是百分之百达到。量,是“更高”、“更好”、“更多”、“卓越”、“优质”。政府、学校和教师的法定任务是完成质的目标,学校和教师在完成质的目标的基础上,可以努力达到更高的质量,但那不是当前质量监控的重点。质量监控,首先是质的评价和保障,其次才是量的追求。

基于不同的目的,质量监控应采用不同的评价形式;使用评价方法不同,获得的评价结果就不一样。测查教育质量的高低、好坏、优劣程度,适用于相对评价方法。相对评价方法的基础是群体均数、常模之类的客观标准。监测或监控基础教育质量是否达标,适用于绝对评价方法。绝对评价的基础是制订基础教育质量标准,比之“常模”,这种标准带有较强的主观性。基础教育质量标准是以课程目标为核心而确立的学校、教师和学生必须达到的教育和学习目标。通过绝对评价,可以准确而高效地监测或监控质量目标的完成情况。至于在实现标准之后,如何追求更高的、卓越的、优质的教育质量,就不是教育质量标准所关注的问题,因此也就不是教育质量监测或监控所应考虑的问题了。倘若在讨论制订基础教育质量标准问题时,不能在理论上和思维方式上剔除“更高”、“卓越”、“优质”这些旨在反映目标标准之上的量的提升情况的修饰词,就容易在质和量的问题上出现摇摆,就容易说不清基础教育质量监测的任务究竟是为了改进工作,还是为了给地区和学校乃至教师和学生进行排名。

研讨和论文中还涉及两个基础性概念,一个是监测,一个是监控。厘清这两个概念也有助于推进对基础教育质量问题的研究和实践。这两个概念涉及测、监、控三个字,分别具有不同的含义。测,是方法和技术,是手段,表现为测量工具的开发和应用;监,是实时掌握和了解质量状态,是对质量的充分把握、切实把握,表现为一种常态化的运作机制建设;控,是控制教育质量和保障教育质量,表现为一种使基础教育尽快达到国家标准的保障制度建设。基础教育质量监测是以质量标准为基点,测查教师的教学和学生的学习是否达到了目标。当然为了保证教师的教学和学生的学习,需要监测的还有学校的管理及其他教育质量的主要影响因素。建立一种质量控制的机制,以保证基础教育能够完成教育标准。在当前我国的教育体制中,督导或督学制度是实现监控的主要途径之一。测在前,控在后,测是技术的表达,控是制度的表达。监控比之监测,多出来的正是对质量保障制度的诉求。

二、从量的评价转向质的评价,从相对评价转向绝对评价

制订基础教育质量标准,是开展基础教育质量检测或监控的逻辑前提。依据质量标准而实施的评价属于绝对评价。我们要开展质量监控,首先需要实现评价观的转变。近年来,社会普遍信服客观标准,相对评价属于比较偏重于客观标准的评价(常模),绝对评价则偏于主观,但是质量监控需要的恰恰是要制订一个适合当前工作状态的主观标准(人为制订)。

从宏观角度看,在国家和一个相对大的区域层面,需要有意识地排除通过评价给地区和学校排序、评比的做法。宏观层面所谓转变评价观念,就是要强调基础教育质量监控的是质而不是量,是教育目标的完成情况以小学语文课程为例,课程标准对识字数量是从学生认识的字数和会写的字数两方面来要求的,学生认识的字数在第一学段增幅为1600字~1800字,会写的字数在第一学段为800字~1000字。这两个数字构成了教育质量的监控标准。但是有些地区和学校,把标准中的“一会”提高为“两会”(不仅会认,还要会写1600字~1800字,超标一倍),“两会”再提高为“四会”(会认、会写、会读、会用),对于这些做法,我们应该给予什么样的评价呢?给予“达标”,似乎不足以说明其质量的“高超”程度,给予“良好”和“优秀”,则又非质量监控的本意,也不是课程标准的本意,甚至还可以说是对课程标准的某种僭越和批判——要求二年级的教师和学生完成四年级的任务——课业负担就是这么被加重的!

对于学生及其家长而言,认字越多越好,这是量的评价,是相对评价的任务;对于学校、教师及政府而言,完成课程标准就好,这是质的评价,是绝对评价的任务。识字教学这个例子说明,可以“不断提高”的,只有量,没有质。

当然,一般来说,宏观和微观视角中的教育质量监控的实际含义多少有所不同。

宏观、中观的视角,重在监控底线,须用绝对评价方法。微观的视角中,重在考查程度,既可用绝对评价方法,也可用相对评价方法。假如以15秒为学生百米跑的速度标准,代表体育教学目标,那么我们可用绝对评价方法予以监控。凡15秒以上者为达到目标、完成任务、质量合格。但对于14秒、13秒、12秒、11秒的学生是否就意味着质量很高?要不要更高?在宏观和中观视角中即绝对评价中,后面的问题都不成立!只有在微观视角中,才可以说,跑11秒和15秒之间意味着什么差异。美术、音乐等艺术和技能性课程都如此,知识性课程、道德性课程同样如此。比如:学生做志愿服务或社会实践的时间,20课时为达标、合格。可以倡导或鼓励个别学生争取30、40个课时,并予以表扬,但不能作为质量标准。换言之,质的评价,是针对15秒、20课时的达标性评价。它不太关注14秒、13秒,30课时、40课时的问题,相反,它非常关注16秒和19课时所反映出的教育教学工作问题。

及存在的问题。基础教育质量监控的“达标”性质和“保障”目的,决定了绝对评价是比相对评价更加适宜的评价方法。

从微观角度看,由于绝对评价依据的是教学目标,是一种质的评价,因此它有助于我们发现教学中的问题,其结果对于改进工作具有重要价值。而相对评价依据的是群体均数,是一种量的评价,它有助于发现个人差异,其结果具有很客观的评比、排名作用。所谓转变评价观念,就是依据提升教育质量的目的,微观层面的学校和教师,都应该将适应于“完成既定教学任务,发现教学中存在的问题以便及时改进”的评价方法作为主要方法,而压缩和减少使用相对评价方法。

无论宏观角度的监控还是微观角度的监控,都应遵循把握教育质量的“质”这个逻辑原则。《教育规划纲要》中提出的制订基础教育质量标准所预示的对应的评价性质是质的评价,对应的评价技术是绝对评价。如果说我们曾经在新课程改革过程中一度比较重视应用相对评价的技术和方法,如比较重视课程及教学目标的生成性,重视研制各种常模,以便于评价每个孩子(与群体均数相比)的发展情况,那么,国家层面所要监控的必定是教育教学目标的达成程度。相对评价一般使用等级分数,自然能够评出名次;绝对评价一般使用达标线,只能分出是否达标,而不能细分名次。

当前,基础教育质量评价面临的问题是多方面的。

重量轻质,并把量当成质,是当前的一个主要问题。当我们把一个本来有目标、有标准的事物由于美好的愿望而有意抹杀其质的标准,使之变为一个具有无限弹性的事物时,“不断提高”这四个字,就从愿望性的口号变成了现实政策。在“不断提高教育质量”的观念下,是无法确立和制订质量标准的。没有标准,便无法确定恰当的、适用的评价方法;没有明确的评价方法,便没有切实的监控。“不断提高”只是此类愿望性口号的代表,实践中还可以看到花样翻新、五光十色、丰富多彩的不断创新的概念说法(优质的、卓越的、高标准的、可持续发展的学生等)。这些说法的目的并不在保障教育质量方面,而仅在于如何“不断”提升名次,以达到“出人头地”的目的。在几篇介绍香港基础教育质量监控的文章中,我们也可以清晰地看到这样一个转向的趋势:基础教育质量监控的评价从重视输入、过程,向重视结果方面转化,从重视量向重视质方面转化,从重视“虚”向重视“实”方面转化,从权力控制向评价监控方面转化。

有论文鉴于目前流行的评价方法对教育质量的结果评价只有好坏、优劣、高低这样的表达方式,而提出用模糊综合评价模型来处理这个问题。这在实践中也是一种被大家普遍接受的方式。但是,在好坏、优劣、高低之前,还存在一个“是否”、“有无”的问题,而“是否”和“有无”所针对的,恰恰是基础教育质量的标准所在,是质量的“质”所在。

时龙理事长在讲到质量标准框架时,提到了一系列相关工作,概括地说,主要包括:一制订标准,二研制相应的技术、方法和工具,三建立监测机制,四建立控制、保障机制。这四个要素构成了基础教育质量监控的完整架构。

香港教育质量检测和保障的基本机制包含三个圆圈,小圈指学校层面对于质量的监控,中圈指区域层面对于质量的监控,大圈指国际层面对于质量的监控。它给我们的启示在于,这三个圈完全符合质量保障和质量管理的一般思维和实践逻辑,管理学上称之为PDCA质量圈(计划、实施、评价、改善)。香港的质量监控机制对我们研究、设计、实验基础教育质量监控的方案和计划,具有重要的参考意义。

基础教育质量监控应该是一个逻辑严密的系统。这个系统所包括的四个基本环节(质量标准——评价技术——检测方案——保障制度)的相互关系应该是:质量标准是基础,是当前的工作重点,是评价或监测的指标构成。监测(评价)方法和工具是与质量标准相配套的技术手段,是教育评价研究者最为关注的重点。监测方案是以与质量标准相关联的评价技术为核心而建立起来的一整套教育质量监测机制,这套机制也可视为基础教

三、构建教育质量监控体系的四个基本要素及其相互关系

育质量监测的解决方案,目前国家和各省市正处于尝试研制和试点建立阶段。第四是依据这套监测机制或监测方案而构建的质量控制和保障制度,这是通过对现有教育管理制度进行以保证质量为目标的整合而形成的新的基础教育管理体系。具备了质量控制和保障机制之后,质量标准才能真正得到全面落实。

目前来看,要建立基础教育质量监控体系,我们还有许多问题需要澄清,有观念方面的、习惯方面的、认识和理解方面的,体制、机制和制度方面的,也有技术和操作方面的。

我们首先要解决的问题是制订基础教育质量标准。

这项工作的艰巨性主要表现在三个层面:思想理论层面、政策制度层面和方法技术层面。

在思想理论层面,“优质”、“均衡”、“人民满意”等观念混淆在一起,不利于在“什么是”基础教育质量标准问题上取得价值共识。许多地区在为义务教育均衡发展制订阶段目标时,都把“优质均衡”或“高质量、高水平均衡”作为一个阶段目标的标志,说明在义务教育均衡发展问题上普遍存在认识上的混乱。优质与均衡分别体现着不同的价值取向。价值的多义性,导致基础教育政策的多标准性;政策的不稳定性,导致教育评价及质量监控工作的盲目性和模糊性。

在政策制度层面,监控体制的建设涉及教育行政部门、教育督导部门、教育研究部门以及其他相关部门的职责和权利的整合与合作。近年来,各地教育行政部门在做各种机制调整的尝试,各级督导部门也在积极开展质量监控的理论和实践探索。这个层面的问题是当前推进基础教育质量监控工作的关键。其深层,关乎思想理论的进一步澄清;其表层,影响着评价技术操作方面的研究和推进。

在方法技术层面,制订基础教育质量标准,所面临的首先是质量标准的研制问题,而不仅是测评工具、分析手段等问题。教育质量监控是以课程标准为基础的,即虽然课程标准是主观制订的,但我们必须假定它是合理、合法的(虽然有与会者提出课改后新课程标准存在种种问题)。课程标准可分为三个维度的内容,一是知识、技能维度,二是思维、表现维度,三是态度、情感维度。知识、技能部分对应的标准是理解和掌握;思维、表现部分对应的标准是判断和表达,态度、情感部分最为复杂,课标对此的表述是态度、情感、价值观,在实际操作中,如北京的综合素质评价,还包括学习兴趣、自信心、意志力、积极性等。态度、情感、价值观的可测标准怎样确定?这是多年来一直困扰大家的难点问题,但并非不能解决。当我们首先确定质量标准是“准则参照”而不是“常模参照”,对应的方法是绝对评价而不是相对评价时,这个问题就会在相当程度上变得比较清晰也比较容易操作。

质量监控,核心是保障教育活动完成既定目标。香港在质量标准的基本分类中,同样包含“学生表现”和“校风及学生支援”的范畴。该范畴的“范围”表述(学生支援、学校伙伴,态度和行为、参与和成就)和“指标”表述(学生成长支援、学校气氛,家校合作、对外联系;情意发展和态度、群性发展,学业表现、学业以外表现),这两个层次的表述方式,形成了一种“准则参照”体系,并在相当程度上具备了“是否”、“有无”的基本特征。由此可见,即使是对于态度、情感、价值观这方面的教育目标,只要排除了量的无限要求,其质的部分,还是可以通过我们的细致工作,加工成为可测的指标体系的。上海教科院基教所陆关于上海地区参加2009年PISA测试情况的报告,也向我们展示了PISA怎样成功地测查了态度、情感和价值观方面的内容。

四、基础教育质量监控理论与实践今后可能的发展方向

作为基础教育质量监控的核心问题的评价体系及其方法,可能需要我们向着逻辑化、技术化和艺术化方向进一步深化研究。评价体系及其方法的逻辑化,指的是强化质量监控体系的科学化程度;技术化,指的是强化质量监控体系的实用化和便利化程度(如指数化、色标化、概念化等);艺术化,指的是强化质量监控体系的平等、尊重、友好、善意、和蔼、亲切等美感友善的程度。艺术化主要在微观层面的应用中需要特别加以注意,以便于学校和教师愿意自觉地、愉快地应用。

评价方法和技术没有好坏之分,只有恰当与否。根据不同的评价目的,选取恰当的、适用的评价方法,是正确的做法。如相对评价对于发现学校或学生的发展问题而言,是好的评价方法。绝对评价对于监控既定教育质量目标的完成及工作改进情况而言,是好的评价方法。

我们始终面临着一个十分纠结的问题:如果说质量标准的制订从理论上讲指的是“最低标准”的话,那么,我们多年来习以为常的一些概念,诸如优质、卓越、高水平、拔尖创新、学生的可持续发展等等,又怎么理解、怎么对待、怎么处理?换言之,怎么不断鼓励学校办出特色,不断鼓励教师提升教学水平,不断鼓励学生提高学习成绩?这个纠结,根本原因在于,监控者(政府)确定的质量标准不是质的标准,而是量的标准;使用的评价方法,不是旨在达标、在发现问题以改进工作的绝对评价,而是旨在区分发展差异、旨在评比排名的相对评价。

其原因还在于,应该属于学校校长甚至教师的某些权力,在一定程度上还被掌控在政府教育管理部门,质量监控与业绩考评与评比竞赛等混杂在一起。这些,都有待于教育体制、制度和机制的进一步改革。教育质量监控工作一方面是一项有助于促进教育改革的工作,一方面它又需要通过教育改革的深化才能逐渐完善起来。

通过对现有教育管理制度进行以保证质量为目标的整合而形成的新的基础教育管理体系,其有效的运行,将全面促进基础教育质量在“量”的方面的不断提升。优质、卓越、拔尖创新、高水平、高层次等概念,只有在这个质量监控体系的基础上,才具有实质的意义。