教育评价是教育过程中的关键环节,在教育变革中,教育评价该如何落地?又该如何改革以应对整体教育改革的现状?在“中国教育学会2016年度教育评价研讨会”上,谈松华提出,应重视“提高教育评价专业化水平、发挥其推进性功能”。
由于工作关系,我陆续接触了教育评价问题,深感教育评价问题,对人才培养模式的改革和教育体系的建设具有不可替代的作用。而教育评价功能的发挥,关键在于提高教育评价的专业化水平。
所以,今天我讲的内容,两句话就能概括我想表达的意思。
第一,提高教育评价的专业化水平。中国教育评价目前面临的任务是更需要有专业化的评价,因为过去比较多的是政府督导,政府主导的评价比较多。
第二,发挥教育评价的推进性功能。因为教育评价对于教育改革发展的功能是多方面的,但是如果把这些功能归纳起来讲,就是教育评价的推进型功能。
一、教育变革中的教育评价
这实际上有两层意思,一层意思是讨论教育评价问题,要和整个教育变革全局相联系,也就是说,要从教育变革的全局来思考教育评价的问题;另一层意思,就是教育评价本身在现代教育变革的新阶段,教育评价本身要进行变革。
我国教育正处在重要的历史转折点。习近平总书记最近在G20峰会上指出,人类正处在一个新的历史起点。中国教育应该说也处在一个新的历史转折点上。这个历史转折点我们可以从很多方面去分析,和教育变革相关的,至少有以下三个方面是要关注的。
1、从量的扩张转向质的提升
我们过去30多年教育的重点是推进教育的普及,让更多的人受更多的教育。因此数量的扩张必然成为一个主要的任务,这个任务现在应该说是基本接近实现了,各级各类教育,毛入学率都已经到了比较高的水平。
现在的重点应该转向质量的提升,这个质量的提升既是教育内在的需要,也是社会大众所普遍关注的重点。人们过去关注的是有没有机会去上学,现在更多的是关注接受一种什么样的教育,上一所什么样的学校,这是一个大的转变。这个转变要求教育评价也需要有相应地变化。
过去在数量扩张阶段,教育评价的重点在于政府普及教育的政策能不能得到落实,所以当时督政是主要内容,督导的重点是在普九以及教育均衡等方面。而当我们要讲质的提升的时候,督学就很重要,对教学的评价越来越成为重点。所以现在督导的工作不仅督政,还要督学。督学不能光靠政府,它需要有更多方面的评价,这是一个变化。
2、从学历本位或知识本位转向能力本位
我们过去强调质量,更多的是强调知识传授,而现在教育发展的趋势,是越来越关注能力和素养的提升。这种变化对评价来讲,也会有新的要求,当我们教育的质量更多关注知识的时候,我们测量的重点就是考查知识水平,测量知识掌握的程度。当教育质量转向能力和素养的时候,仅仅去评价知识水平已经不够了,它需要扩展成为对人的素养的全面评价。
3、从单向吸收转向双向交流
当我们的教育是单向吸收的时候,更多的是参照发达国家发展的程度,以此作为我们评价中国教育的重要坐标。当中国国际地位发生了变化、国际关系随之发生了深刻变化的时候,中国教育不仅是需要吸收国际先进经验,同时也需要总结自己的成功经验,在国际教育上,占有一席之地。
所以现在的教育评价,应该比较中国和世界一些先进国家的长处和短处。比如说现在我们参与PISA考试就是参与国际评价,现在也正在讨论参与国际高等教育、参与国际工程教育的评价,等等。
因而这个评价已经不是单向的、仅限于国内的这样一种封闭性的评价。因而教育评价实际上既要吸收国外的先进经验,同时也要总结我们自己的成功经验。
这几点必然要求中国教育从理念、道路、模式和制度上实现整体性的变革,而评价制度的改革,不仅是制度变革和创新的重点,而且对教育的整体性变革具有关键性的作用。
评价制度对于教育发展具有多重功能。其中,有五种功能可能是比较主要的。
一是诊断功能。在学校教育教学的过程中,评价确实起了一个很重要的诊断功能,可以诊断我们教育教学的实施效果,这种诊断对我们实现教学目标,改进教学具有非常重要的作用。
二是选拔功能。基础教育阶段的初中后和高中后两次分流,都需要有一个考核评价和选拔过程。
三是导向功能。因为怎么评价必然会影响我们怎么教学,考什么教什么,虽然这是比较片面的,因为教学不能完全根据考试来决定,但是在实际教学中,它势必受考试评价的影响。
我们的教学结果是要经过这样一种考试评价来检验的,如何进行评价等于树立了一个标杆,这个标杆作用就是导向作用。
四是发展功能。评价的目的最终是为了促进发展。
五是管理功能。教育教学管理需要通过评价来改进教育教学。
所以也可以说,教育评价是服务于教育发展的,这个教育发展整体上来说可以分为学校发展、教师发展和学生发展。过去我们理解的评价,主要是对学生,所以比较关注的是学生发展,实际上教育评价不只是学生,发展的作用是既对学生,也对教师,也对学校,但是学生的评价是基础性的。综合这五种功能,即推进性功能,各种教育评价都是为了推进发展。
中国教育评价整体来讲,还处于比较薄弱的状态,还比较缺少相对完整、完善的科学评价制度和评价体系。
1、教育评价的目标比较狭窄。评价目标的指向主要是学生的学业知识。这个学业知识当然非常重要,但是仅仅局限于学业知识,就不能着眼于学生的全面发展。
2、教育评价的方法相对陈旧。既然学业知识是主要目标,因此评价的方法更多的是纸笔测试,所以学生要应付各种各样的考试。
3、教育评价主体比较单一。评价的主体从宏观上主要是政府,政府主导教育的评价。主要是政府主导和参与的评价,社会参与不够、参与渠道不完善。
4、教育评价结果简单。评价结果呈现出来的主要是分数,对学校学生的评价也好,对教师的评价也好,仅仅依靠分数是不能完全反映发展状态的,分数背后可以发规的许多东西,没有呈现出来。
这是我们现在评价存在的一些缺陷。因此,我们的教育评价目标要从比较狭窄的目标转向综合的目标;教育评价方法要从比较陈旧的方法创新出更多新的方法;评价的主体要更加多元;评价结果的呈现方式要更加丰富、更加有效,要能够真正起到改进的作用。
二、教育评价制度改革几个重点
教育评价覆盖各级各类教育的方方面面,有对政府的政策评价、高校的专业评价、职业教育的职业能力评价,也包括继续教育的学分评价、能力评价等等。从基础教育来讲,主要是指学校发展评价、教师发展评价和学生发展评价。一般这三种评价分别是学校的增值评价,教师的绩效评价和学生的发展评价。其中重中之重是学生的发展评价。
学校增值评价
现在中国对学校的评价缺乏一个比较完整的指标体系。对学校的评价客观上来讲,主要看的是考试分数、升学率,这些是对学校评价的最硬指标。这种评价的缺陷是明显的,因为学校的工作不能仅仅看考试成绩。
我们每次考试的可比性也是不够的,所以用这样一种测评的办法来判断学校工作,本身存在局限。各个学校的基础不一样,生源不一样,师资不一样,利用最终的分数来评,对于不同学校是不公平的。
所以,在国际上,像英国、美国从20世纪80年代以后,用得比较多的是学校增值评价,顾名思义,增值评价就是把产出和投入作为一个整体来进行评价。分数是学校的产出,但是这种产出如果不和投入联系起来,那就不合理。所以就应改变过去只看产出结果,即最后的考试成绩这样的做法。
增值评价是把学生进学校时候的成绩、家庭背景、社区环境、教师水平等各种因素,都作为投入因素,然后对学生的表现,对最终的产出做细致的分析。
如果某一所学校所有学生在进校时候的平均成绩是50分,经过三年的初中或者高中教育以后,以同样的尺度来考量,学生的平均成绩提高到了60分,而另外一所学校所有学生在进校时候的平均成绩是80分,经过三年以后,学生的成绩提高到了85分,那从提升的幅度来讲,应该说前一所学校的增值性更强、增值效果更好。而基础好的学校,如果提升得很慢,相比来说,其增值效果是不理想的。
这样一方面侧重于评价学生在学校教育后的进步程度,激励学生和学校尽最大努力,做最好的自己;另一方面对于不同家庭背景和社区环境的学生做具体分析,找到针对性的改进措施。
不同家庭背景的学生,因其家庭环境不一样、社区环境不一样,他的受教育条件是有差别的。我们可以分析这个成绩背后的一些因素,进而提出改进措施。所以应该说,增值评价至少比只看一个最终结果更合理、更公平、更科学。
推广教育增值评价碰到两个问题。这两个问题在发达国家也存在。第一个问题是,因为增值评价需要大量的数据做支撑,中国的学校档案建立尚不完善,没有完整的基础数据,所以要推行增值评价比较难。第二个问题是,一些基础好的学校提出异议,从60分提到70分是比较容易的,但是从90分提到95分是比较难的,所以这样的衡量,对于基础好的学校来说是不公平的。所以如何找到一个既能够反映学校增值水平,同时又能够照顾到不同学校的实际进步程度,也是增值评价需要进一步改进的地方。
教师绩效评价
在国内现在还没有比较完善和成熟的教师评价制度,因为现在教师评价无非是考量教师工作量、学生的考试成绩、工作态度及教科研、发表论文等。但是缺乏一种比较客观完整的指标。
对中小学教师来讲,发表论文有时候是可以做参考的,但是并不能作为教师评价必备的依据,这也需要认真研判。中小学教师的主要任务应该放在不断提高教学水平、教学质量上。有一部分教师有条件把好的教学经验进行比较系统的总结,作为论文来发表,是一件很好的事情,但不是所有老师都需要这样做。如果把发表论文作为一个主要的评价指标的话,很可能会引导中小学教师在写好文章上下功夫,而不是改进学生的教学。
对教师的评价应该和教师的专业的发展,比如教师的师德,教师应该担负的职业责任等相联系。所以,教师评价是世界性难题,但是职业素养、教学效果、师生关系许多方面应该是对教师进行评价基本的要求。前一段时间美国出了《第56号教室的奇迹》这本书,一个校长把一所生源很差的学校办成了受到各方面都肯定的学校,这应该是我们对教师评价的更重要的一种标准。
学生发展性评价
这是教育评价的主要部分,对学校和教师的评价也包含对学生的评价。因为对学校、对教师的评价要以对学生发展的评价为基础,离开了对学生发展的评价,就没有真正的教育评价。然而现在我们对学校的评价往往就是看学校的占地面积、建筑面积、学校的教学设施等方面。对教师的评价往往更重视他们的学历。而恰恰是没有更加有针对性把学生本身的发展作为评价的基本依据。
我们国家正在进行新一轮的教育改革,把教育评价制度改革作为重要任务,主要是在核心素养的基础上,制定基础教育质量标准,再来制定课程标准,来全面评价学生的发展水平。要改进教育评价技术,科学解读教育评价结果,为学生和教师提供信息反馈,提供发展性评价,形成各种知识与能力并重的多元综合评价。
对学生的评价大体上可以分为两类。一类是过程性评价,也即诊断性评价。就是在教育教学过程中来诊断学生教育教学的发展水平,比如一些阶段性的测试,或者针对某些问题的检测。一类是形成性评价。形成性评价也可以说是结果性评价。这个评价指在完成一个学段、需要进入另一个学段的时候,对已结束学段的整体性评价。形成性评价又分两种,一种是标准参照评价,一种是常模参照评价。标准参照评价就是水平评价,比如初中结业的形成性评价,考量的是一个学生能不能达到初中毕业水平;常模参照评价就是测量一个学生在年级中处于什么位置,以平均成绩为参照。标准参照评价是合格不合格的问题,常模参照评价是处在什么位置的问题。
高考招生制度改革是教育评价制度改革的重点和难点。高考改革的思路即制度设计应该用四点来概括。
1、招考分离。现在,我们的考试结果就是招生依据,考试就是招生。其实考试是招生的一种手段,并不是全部,所以首先应把考试和招生相对分离。
2、分类考试。现在主要有两类,一类是高职高专,要对文化素养和职业技能进行评价。从长远来看,高职高专不一定参加现在的高考,它可能会有另外一种文化测试,更重要的它加上一个职业技能评价,这样更符合职业教育选拔人才的要求。
第二类是普通本科的考试,包含必考科目和选考科目,过去的高考是3+X,3+文综理综,现在必考科目没有动,文理不分科。过去选考科目是指定的,文综就是文科三门,理综就是理科三门。现在浙江和上海的试点,上海是理化生历史政治地理这六门课里选三门,文理可以交叉选;浙江是七选三,加上技术课。这样的分类考试让学校和学生有更多选择的机会。
怎么选择?这需要学校先提出来,比如说清华,某某工科系,理化都是要考。高校提出不同专业的选考科目,学生根据所想报考学校和专业公布的考试科目,选择高考选考科目,这对学生来讲是有更多的选择,但是对学校是一个挑战,学生走班小班教学是必然的,这对高中教学具有促进改革的作用。
3、综合评价。综合评价是指高校在录取学生的时候,要根据多种材料来综合评价学生。还有一个是综合素质评价,这是高中对学生的评价,现在各个学校都在做,教育部基础教育二司也就此发过文。上海复旦、上海交大、同济等高校对学生的综合素质评价,都提出四个方面,即品德发展与公民素养、修习课程与学业成绩、身心健康与艺术素养、创新精神与实践能力。高中对学生的综合素质评价的制度现在还在探索中,这种综合素质的评价当然也包括掌握各学科基本知识和基本的技能、解决问题的能力、学科特长和兴趣以及身心素养、艺术欣赏等这些方面的能力。
4、多元录取。高校现在在录取学生时会有“两依据一参考”,“两依据”就是高考成绩、高中学业水平考试成绩。其中,高中学业水平考试成绩占一定的权重,高考成绩是主要的。“一参考”是综合素质评价,目前还不能作为依据。如果综合素质评价作为依据的话,它必须要分等,分等了才能确定成绩,但是综合素质要分等是非常困难的,所以现在在中国诚信制度还没有完全建立起来的时候,要把学生素质分等,可信度是有问题的。所以主张搞学生成长记录,就是写实性的记录,学生可以自己写,教师也写,把学生最重要的一些表现或者特长通过写实性的记录,形成一个成长记录。这个成长档案是给高校做参考的。今后还要进一步去探讨。
三、加强教育评价专业化建设
首先,要制定和完善教育评价标准。评价首先要有标准,没有标准就没有依据。根据学生的核心素养,制定教育质量标准;根据教育质量标准来制定课程标准;根据课程标准来编写教材;编写教材以后,进行课程实施,然后再进行课程评价。教育评价不仅是评价课程,它是整体性评价。对物的评价有客观的标准,合格就是合格,不合格就是不合格,但是对于人的评价是非常困难的。
最近我无意之间在电视上看到这样一个舞蹈比赛节目,这是上海电视台的一个爵士舞比赛,其中有一个表演者引起了很大的争议,非常有名的舞蹈家杨丽萍很欣赏这个表演者,但是上海的一位专门研究爵士舞评委认为,从爵士舞的角度来讲这位表演者并不合格,两位评委争执得很厉害,最后杨丽萍甚至拍桌子了,她认为舞蹈是用心来跳的,她说她看到了这个舞者的心,她认为他就是非常优秀的舞者。这就是评价,“形”和“神”到底是什么关系?我们对学生评价的时候,仅仅是看外表的东西还是看内在的东西?所以对人的评价是最复杂的,确实需要我们去进一步探讨。
其次,探索和完善教育质量评价的手段和方法。不同的手段和方法对测量的评价效果是不一样的,不同领域、不同评价对象需要有不同的评价手段和方法。评价方法可以采取定性和定量,普评和抽评,自评和互评,学业测评和心理测试等不同的方法。评价手段可以采取考试测评、数据采集与评价、问卷评价等不同的手段。现在互联网技术的发展对我们评价是有一定的促进作用的,比如说现在评价很多是要靠数据的,互联网的发展对数据的采集分析有很重要的作用。现在上海有好多学校,请一些互联网教育评价公司对学生进行评价,对学生考试的成绩进行分析,可以得出很多有针对性的结论,我们既需要单向地、深入地去研究一些评价办法,同时可以采用一些综合的手段来进行评价。
最后,加强教育评价专业机构的组织和队伍建设。现在我们国家教育评价的组织机构主要是政府机构。比如说基础教育主要是督导,高等教育主要是评估中心等,这主要都是政府的机构。我们应在重视政府评价作用的同时,鼓励民间专业评价机构的发展,特别要鼓励具有不同专业特色、针对性强的评价机构的发展,以适应不同成绩、不同要求的细分评价市场的要求。比如中小学绩效、学业成绩、学生综合素质、职业院校学生职业能力等等,都要有不同的专业机构来进行评价。
我最近和北大做了一个“中国教育创新20+”的论坛,这个论坛有大量的互联网教育公司参加,其中有一些互联网教育评价公司,做了大量的研究。有一批海归,包括哈佛、斯坦福等国际知名大学搞教育测量的人,他们专业性都很强,所以评价机构要建设。另外,评价专业化水平取决于评价队伍的专业化程度,因而要加快教育测量评价专业的人员的培养培训,尽快壮大评价专业人员的队伍,加强国际交流,提升教育评价的国际化水平。
我们离科学、专业化的测量评价,还有一段比较长的路要走,需要各方面的人员参与探索。一线的老师和校长们,也需要在实践中进行探索。

学会公众号 


