教育评价应专业、应具备推进力-教育资讯-中国教育发展战略学会

教育评价应专业、应具备推进力

信息来源：中国教育学会作者：谈松华发布时间：2016-10-26 浏览次数：1次

　　教育评价是教育过程中的关键环节，在教育变革中，教育评价该如何落地？又该如何改革以应对整体教育改革的现状？在“中国教育学会2016年度教育评价研讨会”上，谈松华提出，应重视“提高教育评价专业化水平、发挥其推进性功能”。
由于工作关系，我陆续接触了教育评价问题，深感教育评价问题，对人才培养模式的改革和教育体系的建设具有不可替代的作用。而教育评价功能的发挥，关键在于提高教育评价的专业化水平。
　　所以，今天我讲的内容，两句话就能概括我想表达的意思。
　　第一，提高教育评价的专业化水平。中国教育评价目前面临的任务是更需要有专业化的评价，因为过去比较多的是政府督导，政府主导的评价比较多。
　　第二，发挥教育评价的推进性功能。因为教育评价对于教育改革发展的功能是多方面的，但是如果把这些功能归纳起来讲，就是教育评价的推进型功能。

一、教育变革中的教育评价
　　这实际上有两层意思，一层意思是讨论教育评价问题，要和整个教育变革全局相联系，也就是说，要从教育变革的全局来思考教育评价的问题；另一层意思，就是教育评价本身在现代教育变革的新阶段，教育评价本身要进行变革。
　　我国教育正处在重要的历史转折点。习近平总书记最近在G20峰会上指出，人类正处在一个新的历史起点。中国教育应该说也处在一个新的历史转折点上。这个历史转折点我们可以从很多方面去分析，和教育变革相关的，至少有以下三个方面是要关注的。
1、从量的扩张转向质的提升
　　我们过去30多年教育的重点是推进教育的普及，让更多的人受更多的教育。因此数量的扩张必然成为一个主要的任务，这个任务现在应该说是基本接近实现了，各级各类教育，毛入学率都已经到了比较高的水平。
　　现在的重点应该转向质量的提升，这个质量的提升既是教育内在的需要，也是社会大众所普遍关注的重点。人们过去关注的是有没有机会去上学，现在更多的是关注接受一种什么样的教育，上一所什么样的学校，这是一个大的转变。这个转变要求教育评价也需要有相应地变化。
过去在数量扩张阶段，教育评价的重点在于政府普及教育的政策能不能得到落实，所以当时督政是主要内容，督导的重点是在普九以及教育均衡等方面。而当我们要讲质的提升的时候，督学就很重要，对教学的评价越来越成为重点。所以现在督导的工作不仅督政，还要督学。督学不能光靠政府，它需要有更多方面的评价，这是一个变化。
2、从学历本位或知识本位转向能力本位
　　我们过去强调质量，更多的是强调知识传授，而现在教育发展的趋势，是越来越关注能力和素养的提升。这种变化对评价来讲，也会有新的要求，当我们教育的质量更多关注知识的时候，我们测量的重点就是考查知识水平，测量知识掌握的程度。当教育质量转向能力和素养的时候，仅仅去评价知识水平已经不够了，它需要扩展成为对人的素养的全面评价。
3、从单向吸收转向双向交流
　　当我们的教育是单向吸收的时候，更多的是参照发达国家发展的程度，以此作为我们评价中国教育的重要坐标。当中国国际地位发生了变化、国际关系随之发生了深刻变化的时候，中国教育不仅是需要吸收国际先进经验，同时也需要总结自己的成功经验，在国际教育上，占有一席之地。
　　所以现在的教育评价，应该比较中国和世界一些先进国家的长处和短处。比如说现在我们参与PISA考试就是参与国际评价，现在也正在讨论参与国际高等教育、参与国际工程教育的评价，等等。
　　因而这个评价已经不是单向的、仅限于国内的这样一种封闭性的评价。因而教育评价实际上既要吸收国外的先进经验，同时也要总结我们自己的成功经验。
　　这几点必然要求中国教育从理念、道路、模式和制度上实现整体性的变革，而评价制度的改革，不仅是制度变革和创新的重点，而且对教育的整体性变革具有关键性的作用。
　　评价制度对于教育发展具有多重功能。其中，有五种功能可能是比较主要的。
　　一是诊断功能。在学校教育教学的过程中，评价确实起了一个很重要的诊断功能，可以诊断我们教育教学的实施效果，这种诊断对我们实现教学目标，改进教学具有非常重要的作用。
　　二是选拔功能。基础教育阶段的初中后和高中后两次分流，都需要有一个考核评价和选拔过程。
　　三是导向功能。因为怎么评价必然会影响我们怎么教学，考什么教什么，虽然这是比较片面的，因为教学不能完全根据考试来决定，但是在实际教学中，它势必受考试评价的影响。
我们的教学结果是要经过这样一种考试评价来检验的，如何进行评价等于树立了一个标杆，这个标杆作用就是导向作用。
　　四是发展功能。评价的目的最终是为了促进发展。
　　五是管理功能。教育教学管理需要通过评价来改进教育教学。
所以也可以说，教育评价是服务于教育发展的，这个教育发展整体上来说可以分为学校发展、教师发展和学生发展。过去我们理解的评价，主要是对学生，所以比较关注的是学生发展，实际上教育评价不只是学生，发展的作用是既对学生，也对教师，也对学校，但是学生的评价是基础性的。综合这五种功能，即推进性功能，各种教育评价都是为了推进发展。
　　中国教育评价整体来讲，还处于比较薄弱的状态，还比较缺少相对完整、完善的科学评价制度和评价体系。
　　1、教育评价的目标比较狭窄。评价目标的指向主要是学生的学业知识。这个学业知识当然非常重要，但是仅仅局限于学业知识，就不能着眼于学生的全面发展。
　　2、教育评价的方法相对陈旧。既然学业知识是主要目标，因此评价的方法更多的是纸笔测试，所以学生要应付各种各样的考试。
　　3、教育评价主体比较单一。评价的主体从宏观上主要是政府，政府主导教育的评价。主要是政府主导和参与的评价，社会参与不够、参与渠道不完善。
　　4、教育评价结果简单。评价结果呈现出来的主要是分数，对学校学生的评价也好，对教师的评价也好，仅仅依靠分数是不能完全反映发展状态的，分数背后可以发规的许多东西，没有呈现出来。
　　这是我们现在评价存在的一些缺陷。因此，我们的教育评价目标要从比较狭窄的目标转向综合的目标；教育评价方法要从比较陈旧的方法创新出更多新的方法；评价的主体要更加多元；评价结果的呈现方式要更加丰富、更加有效，要能够真正起到改进的作用。

二、教育评价制度改革几个重点
　　教育评价覆盖各级各类教育的方方面面，有对政府的政策评价、高校的专业评价、职业教育的职业能力评价，也包括继续教育的学分评价、能力评价等等。从基础教育来讲，主要是指学校发展评价、教师发展评价和学生发展评价。一般这三种评价分别是学校的增值评价，教师的绩效评价和学生的发展评价。其中重中之重是学生的发展评价。
学校增值评价
　　现在中国对学校的评价缺乏一个比较完整的指标体系。对学校的评价客观上来讲，主要看的是考试分数、升学率，这些是对学校评价的最硬指标。这种评价的缺陷是明显的，因为学校的工作不能仅仅看考试成绩。
　　我们每次考试的可比性也是不够的，所以用这样一种测评的办法来判断学校工作，本身存在局限。各个学校的基础不一样，生源不一样，师资不一样，利用最终的分数来评，对于不同学校是不公平的。
　　所以，在国际上，像英国、美国从20世纪80年代以后，用得比较多的是学校增值评价，顾名思义，增值评价就是把产出和投入作为一个整体来进行评价。分数是学校的产出，但是这种产出如果不和投入联系起来，那就不合理。所以就应改变过去只看产出结果，即最后的考试成绩这样的做法。
　　增值评价是把学生进学校时候的成绩、家庭背景、社区环境、教师水平等各种因素，都作为投入因素，然后对学生的表现，对最终的产出做细致的分析。
　　如果某一所学校所有学生在进校时候的平均成绩是50分，经过三年的初中或者高中教育以后，以同样的尺度来考量，学生的平均成绩提高到了60分，而另外一所学校所有学生在进校时候的平均成绩是80分，经过三年以后，学生的成绩提高到了85分，那从提升的幅度来讲，应该说前一所学校的增值性更强、增值效果更好。而基础好的学校，如果提升得很慢，相比来说，其增值效果是不理想的。
　　这样一方面侧重于评价学生在学校教育后的进步程度，激励学生和学校尽最大努力，做最好的自己；另一方面对于不同家庭背景和社区环境的学生做具体分析，找到针对性的改进措施。
　　不同家庭背景的学生，因其家庭环境不一样、社区环境不一样，他的受教育条件是有差别的。我们可以分析这个成绩背后的一些因素，进而提出改进措施。所以应该说，增值评价至少比只看一个最终结果更合理、更公平、更科学。
　　推广教育增值评价碰到两个问题。这两个问题在发达国家也存在。第一个问题是，因为增值评价需要大量的数据做支撑，中国的学校档案建立尚不完善，没有完整的基础数据，所以要推行增值评价比较难。第二个问题是，一些基础好的学校提出异议，从60分提到70分是比较容易的，但是从90分提到95分是比较难的，所以这样的衡量，对于基础好的学校来说是不公平的。所以如何找到一个既能够反映学校增值水平，同时又能够照顾到不同学校的实际进步程度，也是增值评价需要进一步改进的地方。
教师绩效评价
　　在国内现在还没有比较完善和成熟的教师评价制度，因为现在教师评价无非是考量教师工作量、学生的考试成绩、工作态度及教科研、发表论文等。但是缺乏一种比较客观完整的指标。
　　对中小学教师来讲，发表论文有时候是可以做参考的，但是并不能作为教师评价必备的依据，这也需要认真研判。中小学教师的主要任务应该放在不断提高教学水平、教学质量上。有一部分教师有条件把好的教学经验进行比较系统的总结，作为论文来发表，是一件很好的事情，但不是所有老师都需要这样做。如果把发表论文作为一个主要的评价指标的话，很可能会引导中小学教师在写好文章上下功夫，而不是改进学生的教学。
　　对教师的评价应该和教师的专业的发展，比如教师的师德，教师应该担负的职业责任等相联系。所以，教师评价是世界性难题，但是职业素养、教学效果、师生关系许多方面应该是对教师进行评价基本的要求。前一段时间美国出了《第56号教室的奇迹》这本书，一个校长把一所生源很差的学校办成了受到各方面都肯定的学校，这应该是我们对教师评价的更重要的一种标准。
学生发展性评价
　　这是教育评价的主要部分，对学校和教师的评价也包含对学生的评价。因为对学校、对教师的评价要以对学生发展的评价为基础，离开了对学生发展的评价，就没有真正的教育评价。然而现在我们对学校的评价往往就是看学校的占地面积、建筑面积、学校的教学设施等方面。对教师的评价往往更重视他们的学历。而恰恰是没有更加有针对性把学生本身的发展作为评价的基本依据。
　　我们国家正在进行新一轮的教育改革，把教育评价制度改革作为重要任务，主要是在核心素养的基础上，制定基础教育质量标准，再来制定课程标准，来全面评价学生的发展水平。要改进教育评价技术，科学解读教育评价结果，为学生和教师提供信息反馈，提供发展性评价，形成各种知识与能力并重的多元综合评价。
　　对学生的评价大体上可以分为两类。一类是过程性评价，也即诊断性评价。就是在教育教学过程中来诊断学生教育教学的发展水平，比如一些阶段性的测试，或者针对某些问题的检测。一类是形成性评价。形成性评价也可以说是结果性评价。这个评价指在完成一个学段、需要进入另一个学段的时候，对已结束学段的整体性评价。形成性评价又分两种，一种是标准参照评价，一种是常模参照评价。标准参照评价就是水平评价，比如初中结业的形成性评价，考量的是一个学生能不能达到初中毕业水平；常模参照评价就是测量一个学生在年级中处于什么位置，以平均成绩为参照。标准参照评价是合格不合格的问题，常模参照评价是处在什么位置的问题。
　　高考招生制度改革是教育评价制度改革的重点和难点。高考改革的思路即制度设计应该用四点来概括。
　　1、招考分离。现在，我们的考试结果就是招生依据，考试就是招生。其实考试是招生的一种手段，并不是全部，所以首先应把考试和招生相对分离。
　　2、分类考试。现在主要有两类，一类是高职高专，要对文化素养和职业技能进行评价。从长远来看，高职高专不一定参加现在的高考，它可能会有另外一种文化测试，更重要的它加上一个职业技能评价，这样更符合职业教育选拔人才的要求。
第二类是普通本科的考试，包含必考科目和选考科目，过去的高考是3+X，3+文综理综，现在必考科目没有动，文理不分科。过去选考科目是指定的，文综就是文科三门，理综就是理科三门。现在浙江和上海的试点，上海是理化生历史政治地理这六门课里选三门，文理可以交叉选；浙江是七选三，加上技术课。这样的分类考试让学校和学生有更多选择的机会。
　　怎么选择？这需要学校先提出来，比如说清华，某某工科系，理化都是要考。高校提出不同专业的选考科目，学生根据所想报考学校和专业公布的考试科目，选择高考选考科目，这对学生来讲是有更多的选择，但是对学校是一个挑战，学生走班小班教学是必然的，这对高中教学具有促进改革的作用。
　　3、综合评价。综合评价是指高校在录取学生的时候，要根据多种材料来综合评价学生。还有一个是综合素质评价，这是高中对学生的评价，现在各个学校都在做，教育部基础教育二司也就此发过文。上海复旦、上海交大、同济等高校对学生的综合素质评价，都提出四个方面，即品德发展与公民素养、修习课程与学业成绩、身心健康与艺术素养、创新精神与实践能力。高中对学生的综合素质评价的制度现在还在探索中，这种综合素质的评价当然也包括掌握各学科基本知识和基本的技能、解决问题的能力、学科特长和兴趣以及身心素养、艺术欣赏等这些方面的能力。
　　4、多元录取。高校现在在录取学生时会有“两依据一参考”，“两依据”就是高考成绩、高中学业水平考试成绩。其中，高中学业水平考试成绩占一定的权重，高考成绩是主要的。“一参考”是综合素质评价，目前还不能作为依据。如果综合素质评价作为依据的话，它必须要分等，分等了才能确定成绩，但是综合素质要分等是非常困难的，所以现在在中国诚信制度还没有完全建立起来的时候，要把学生素质分等，可信度是有问题的。所以主张搞学生成长记录，就是写实性的记录，学生可以自己写，教师也写，把学生最重要的一些表现或者特长通过写实性的记录，形成一个成长记录。这个成长档案是给高校做参考的。今后还要进一步去探讨。
三、加强教育评价专业化建设
　　首先，要制定和完善教育评价标准。评价首先要有标准，没有标准就没有依据。根据学生的核心素养，制定教育质量标准；根据教育质量标准来制定课程标准；根据课程标准来编写教材；编写教材以后，进行课程实施，然后再进行课程评价。教育评价不仅是评价课程，它是整体性评价。对物的评价有客观的标准，合格就是合格，不合格就是不合格，但是对于人的评价是非常困难的。
　　最近我无意之间在电视上看到这样一个舞蹈比赛节目，这是上海电视台的一个爵士舞比赛，其中有一个表演者引起了很大的争议，非常有名的舞蹈家杨丽萍很欣赏这个表演者，但是上海的一位专门研究爵士舞评委认为，从爵士舞的角度来讲这位表演者并不合格，两位评委争执得很厉害，最后杨丽萍甚至拍桌子了，她认为舞蹈是用心来跳的，她说她看到了这个舞者的心，她认为他就是非常优秀的舞者。这就是评价，“形”和“神”到底是什么关系？我们对学生评价的时候，仅仅是看外表的东西还是看内在的东西？所以对人的评价是最复杂的，确实需要我们去进一步探讨。
　　其次，探索和完善教育质量评价的手段和方法。不同的手段和方法对测量的评价效果是不一样的，不同领域、不同评价对象需要有不同的评价手段和方法。评价方法可以采取定性和定量，普评和抽评，自评和互评，学业测评和心理测试等不同的方法。评价手段可以采取考试测评、数据采集与评价、问卷评价等不同的手段。现在互联网技术的发展对我们评价是有一定的促进作用的，比如说现在评价很多是要靠数据的，互联网的发展对数据的采集分析有很重要的作用。现在上海有好多学校，请一些互联网教育评价公司对学生进行评价，对学生考试的成绩进行分析，可以得出很多有针对性的结论，我们既需要单向地、深入地去研究一些评价办法，同时可以采用一些综合的手段来进行评价。
　　最后，加强教育评价专业机构的组织和队伍建设。现在我们国家教育评价的组织机构主要是政府机构。比如说基础教育主要是督导，高等教育主要是评估中心等，这主要都是政府的机构。我们应在重视政府评价作用的同时，鼓励民间专业评价机构的发展，特别要鼓励具有不同专业特色、针对性强的评价机构的发展，以适应不同成绩、不同要求的细分评价市场的要求。比如中小学绩效、学业成绩、学生综合素质、职业院校学生职业能力等等，都要有不同的专业机构来进行评价。
　　我最近和北大做了一个“中国教育创新20+”的论坛，这个论坛有大量的互联网教育公司参加，其中有一些互联网教育评价公司，做了大量的研究。有一批海归，包括哈佛、斯坦福等国际知名大学搞教育测量的人，他们专业性都很强，所以评价机构要建设。另外，评价专业化水平取决于评价队伍的专业化程度，因而要加快教育测量评价专业的人员的培养培训，尽快壮大评价专业人员的队伍，加强国际交流，提升教育评价的国际化水平。
　　我们离科学、专业化的测量评价，还有一段比较长的路要走，需要各方面的人员参与探索。一线的老师和校长们，也需要在实践中进行探索。