查看原文
其他

“来”读书第十期 | 学本评估:系统化的评价方式

刘森 外研测评 2022-04-24

本期主笔

刘森,北京师范大学博士生,研究方向为语言测试与评价。参与多项省部级外语测评项目。

Neil Jones & Nick Saville (2016). 

Learning Oriented Assessment:A Systemic Approach.

Cambridge University Press. xviii+ 148 pp. 

ISBN: 9781316507889 (paperback)

全书简介

根据评价的目的,评价可以分成:关于学习的评价(Assessment of learning)、作为学习的评价(Assessment as learning) 和促进学习的评价(Assessment for learning)。越来越多的研究关注到促进学习的评价。学本评估(learning-oriented assessment)以促进更好地学习为目标,与促进学习的评价理念不谋而合。与传统大规模测试关注信度和效度不同,学本评估强调在一个系统中实现诊断、提供教学反馈等不同功能,在有计划或无计划的课堂互动中实现系统的统一。


剑桥英语(Cambridge English)经历了百年发展,同样非常关注学本评估的研究。2002年剑桥英语团队研发了The National Languages Strategy体系,将促进交际语言能力作为语言教育的首要目标。项目目标是将终结性和形成性评价结合,将成果与CEFR各个级别和25种语言相对应。2014年,系统进一步丰富发展成The Asset Languages测评体系,具体细节参见Jones(2014)。本书无疑是剑桥英语多年研究的总结,Neil Jones与Nick Saville充分吸取剑桥英语先前研究的经验和教训,清晰地建构了学本评估系统。


各章节内容介绍

全书共九个章节,分为三个部分:第一章为全书简介;第二章到第五章为相关理论论述;第六章到第九章为学本评估详细论述和实践。


第一章


第一章全书主要内容。语言学习是生活中的重要部分,语言测试与语言学习关系密切。学本评估系统能够融合语言学习和测评,提供更加有效的学习。评价的目的有两个:促进学习和测量学习并给予解释,两项目的分别与形成性评估和终结性评估特征一致,学本评价试图寻求一种能够实现两种目的的评价体系。大规模评价和课堂评价之间相互弥补:大规模评价提供定量数据,课堂评价提供定性数据。学习环境包括四种:社会环境,教育环境,个人环境和评价环境。四个环境通过学习任务相互连接,以学习为核心。本章然后简介了学习与语言学习。学本评估从社会建构主义视角理解学习概念,学习本质为社会进程,发生于话语交际中。同时学本评估定义了一系列与课堂互动的概念。语言学习理论与二语习得理论发展息息相关。语言学习目标为促进语言水平或课程目标。测试在学习中扮演重要角色,学本评估系统综合了水平测试、学业成绩测试、大规模测试和课堂测试等不同类型测试。



第二章


第二章介绍了学本评估相关理论。出于对测评对象有益的目的,剑桥英语引入了学本评估评方式。传统测试对象为语言学校学生,近些年有更多基础教育阶段学生参见剑桥系列考试。不同地区学本评估各有侧重点:英格兰ARG(Assessment Reform Group)相关文件关注了形成性评价;与英格兰情况相似,美国测试开发也从心理测量视角,转而关注传统多项选择题的替代题型和任务真实性;澳大利亚、新西兰、香港和苏格兰进行了不同程度的教师主导的测评(teacher-based assessment)和校本测评(school-based assessment)。作为学习的方式,动态评价(dynamic assessment)模式促进学习者语言能力在最近发展区内发展。



第三章


第三章探讨了什么是学习。通过对学习和形成性评价的文献综述,本章总结了建构主义和社会建构主义视角下的学习模式。从建构主义视角出发,作者分析了情境认知(situated cognition)概念如何将认知和社会两者兼顾,情境认知理论认为个体认知发展产生于社会环境下的互动和含义建构过程。社会建构主义为学本评估的核心理论。学习的核心就是互动,基于学习的课堂评价核心就是课堂互动,先关概念有任务、教学目标、支架(scaffolding)、反馈等。学习包含不同方面:转移(transfer)、深层学习和浅层学习。学习过程发生于学习者自身,其动机会影响学习持续性和效果。



第四章


第四章详细介绍了什么是语言学习。与其它学习不同,语言学习具有特殊性。语言学习情况又分为:一语学习、外语学习和教学语言(language of schooling)。同时语言本质为一种技能或者复杂作用的多种技能,在认知、心理运动和感情参与情况都与其它学科不尽相同。欧洲共同语言参考框架(CEFR)作为剑桥英语考试开发的参考依据,与学本评价体现的社会建构主义视角一致。大多数人能自然的习得母语,但在学校教学中自然习得却行不通。本章同时综述了二语习得研究,作为学本评估开发的理论基础。



第五章


第五章作者从三个方面介绍了语言教学目标:学习预期成果、构念界定和课程教学目标。学习预期成果就是学习者能使用语言交流并获益,学习预期结果可以从CEFR中对语言表现的具体表述中获得参考,同时学习不仅仅为内容掌握,而应该在个人发展中学习新的人生技能。构念界定指如何理解语言能力,反映的是语言能力观。在教授或测试语言能力之前,首先应该界定好语言能力。剑桥系列丛书对不同语言技能均作了详细介绍,如Shaw & Weir (2007), Khalifa & Weir (2009)分别对写作和阅读构念进行了详细论述。课程目标为学习的具体内容。基于不同开发标准,课程目标各部相同,如语法、词汇、交际任务或多种内容组合。



第六章


第六章介绍了大规模测评在学习中的作用。大规模测评的效度研究开始于测试构念界定,然后利用定性或定量的研究方法收集效度证据。与经典测试理论相比,IRT(Item Response Theory)理论参考测试者能力、题目难度等维度间关系,使分析数据更具有解释性。基于IRT理论可以应用Rasch模型对测试数据进行分析,获得效度验证的丰富证据。同时利用IRT模型,建设题库用于命题和提供分数解释。针对不同语言能力水平开发的测试在题库中建立联系,利用统一量尺衡量不同水平测评对象。针对口语和写作技能,作者分析了整体评分和分项评分的利弊。在平衡效度和信度的同时,大规模测评可以作为语言学习的重要证据。



第七章


第七章介绍了课堂中的学本评估。课堂学习的核心是互动,课堂环境中的学本评估即形成性评价过程,学习成果包括:特定领域技能、特定领域课程内容、独立领域可转换学习技能。根据性质,课堂活动分为学习为中心和内容为中心两种。学习为中心的课堂活动在交际互动中促进学习,是学本评估所推崇的。课堂评价可以提供学习的证据。学本评估体系是和谐的系统,课堂评价与其它环境下的评价可以融合为统一系统。



第八章


第八章介绍了大规模测试与课堂评价的连接。连接不同性质测试的前提是测试目标相同,评价标准一致。学本评估体系下,课堂所教与测试所考是一致的,确保不同测试目标一致;不同测试使用共同框架报告测试表现,确保共同标准。共同标准要具备可行性。尽管很多学者质疑使用共同标准理解不同测试的表现的可行性,但是教师、学习者及家长需要或希望了解国际通用的测试标准,如CEFR。在不同技能中,标准连接的难度不同。写作与口语标准的连接比较容易实现,因为课堂和大规模测试环境中评判学习者表现的标准相似。而阅读和听力都是通过题库中的试题间接考查,无法直接观察到。在课堂中使用测试题目可以用来促进学习,但是很难对学习有直接的反馈。CEFR中的“can do”表述可以帮助实现共同标准的确定,但2012年欧洲语言能力调查(European Survey on Language Competence)指出不同的国家或地区对于CEFR的解读存在差异,在某特定环境中师生是可以判断表现优劣的,但是无法准确对应到CEFR的相应级别。在不同技能中,支架理论认为接受技能(阅读、听力)为生成技能(口语、写作)提供支架。这种特性让连接不同技能的解释更加复杂。



第九章


第九章为学本评估的具体实践。学本评估的实践要涉及多个方面内容。建立统一测评体系的前提是具备统一的衡量标准,如具有国际影响力的语言能力量表CEFR等。因世界各地差异,本章同时预想了在不同地区应用学本评估可能遇到的困难。现代技术对学习互动的每个阶段都产生影响,如学习任务中提供中介的方式、收集记录数据方式、测试过程追踪记录、个性化反馈等。随着教学技术的发展营造新的学习环境,如在线学习环境。通过测试后效研究表明学本评估对学习产生积极影响。本章总结了学本评估的基本流程:基本立场、语言政策、理论基础、评估、应用、监控和结果评估七个步骤。


参考文献


Jones, N. 2014. Multilingual Frameworks: The Construction and Use of Multilingual Proficiency Frameworks, Studies in Language Testing volume 40. Cambridge: UCLES/ Cambridge University Press.


Khalifa, H., & Weir, C. J. (2009). Examining reading. Cambridge: Cambridge University Press.


Shaw, S. D., & Weir, C. J. (2007). Examining writing. Cambridge: Cambridge University Press.


掌握一手测评讯息

学习最新测评手段

长按关注外研测评

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存