查看原文
其他

专著推荐 | 帮你掌握量表研究方法——测验等值、量表制订和联结的方法与实践

The following article is from 思飞学术 Author 刘育明 译



 外教社外语测试与教学丛书 

ISBN:978-7-5446-5996-3

出版年月:2020-10

作者:Michael J. Kolen,

Robert L. Brennan著

刘育明 译

定价:128.00元


限时8折优惠:102.4





本书根据Michael J. Kolen(美)和Robert L. Brennan(美)所著Test Equating, Scaling, and Linking: Methods and Practices(Third Edition)翻译而成。内容包括:


  • 测验等值、量表制订和联结的目的及其在测量中的意义

  • 收集等值数据的设计(如随机组设计、单组设计和锚题非对等组设计)

  • 等值前或等值后对分数的分布进行平滑加工的方法(前平法和后平法)

  • 经典测验等值法[包括线性等值法(如均值/均值法、均值/标准差法、Tucker等值法、Levine等值法、链式线性等值法)和非线性等值法(如次数估计法和等百分位等值法)]

  • 项目反应理论等值法(包括IRT真分和观察分等值法)

  • 等值标准误估计(包括靴帮复位取样法和delta分析法)

  • 量表制订的不同观点和方法(包括在量表中加人常模信息、分数精确性信息和内容信息的方法)

  • 竖式量表法(包括Hieronymus统计法、Thurstone统计法和项目反应理论统计法)

  • 成套测验的编制、量表制订和维护

  • 测验联结的分类及统计方法(包括群体不变性)


本书系统、全面地阐述了测验等值和量表制订领域的最新成就,可供教育测量学、心理测量学和统计学等专业的教师和学生学习和参考,对教育测量、人力测量、行业资格测量工作也有重要意义。



Michael J. Kolen教授和Robert L. Brennan教授特意为本书中文版作前言。




外教社外语测试与教学丛书


丛书另已出版:

《语言测试社会学》

杨惠中 桂诗春 编


《教育评价范式转变中的英语教学评价实践》

唐雄英 


基于语料库的中国理工科大学生英语写作能力研究》

刘芹 张乐 许家骏




01

等值、量表制订和联结


等值、量表制订和联结是调节测量分数之间不同关系的三类方法。


等值(equating)是本书的重点,等值是调节一个或者几个测验试卷之间的难度、使不同测验试卷所获得的分数能够进行交替使用的统计方法。量表制订或量表化(scaling)是把考生的操作水平与代表考生操作水平的数字或者符号联系起来、把测验的原始分转换成量表分的统计过程。测验联结或对接(linking)是使测验内容不同和/或统计特性不同的测验分数用统计学的方法进行转换使之能够进行比较的过程。


等值、量表制订和联结三者之间有联系也有区别。等值所要求的测验条件比量表制订以及其他联结方法所要求的条件更严格。等值最重要的特征是参加等值的所有测验试卷必须根据同一个测验内容和统计细目表(content and statistical specifications,也称“双向测量细目表”)编制而成。等值的目的是对不同测验试卷之间的难度进行调节,不是对测验试卷的内容进行调节。联结的范围最广,既包括具有严格统计意义的等值,也包括根据某些人的主观判断对分数进行社会性调节。例如,三年级数学测验有两套平行试卷,二者根据同样的编题细目表编制而成,测验题的内容、每项测验内容在整个测验试卷中所占的比例、测验题的类型、各类题型在整个测验试卷中所占的比例、测验题的难易程度和区分度基本相当。用统计的方法对这两套试卷的难度进行调节,使参加任何一套试卷测试的考生的分数能够进行交替使用,这就是等值。对三年级到十年级之间各个年级的数学测验分数进行联结,把各个年级的分数放在同一个量表上,便于比较,追踪各个年级之间学生数学能力的发展轨迹,这就是量表制订,或者更准确地说,是竖式量表制订(vertical scaling),因为各个年级数学试卷的测验内容和统计细目表有所不同。同样,八年级语文测验中古文部分的分数与语文总分之间的联结,也不是等值而是量表化,因为古文部分是整个语文测验的一个子测验,二者的内容和统计特性不同。通过量表制订,把古文部分的子分数与语文总分联系起来。两个不同测验之间的联系,比如,英语测验分和中文测验分之间的联系或者物理测验分和数学测验分之间的联系,称为联结(linking),二者之间相似程度最低,一般用分数关联表(concordance)表述二者的联系。量表制订和建立测验之间联结关系所采用的统计方法和等值的统计方法没有根本的差别,许多等值的统计技术也可以用于量表制订和联结的研究。重点在于分数的解释和应用上的差别。如果等值的方法适当,两个测验试卷之间的分数就可以交替使用。但是无论采用什么方法,通过量表制订和其他方法对不同测验分数之间的关系进行联结,所得测验之间的分数都不能交替使用。


在测量实践中,最基本的等值设计是随机组设计、单组设计和锚题非对等组设计。所谓等值设计,就是为了减少等值误而设计的收集等值数据的方法。等值的方法可以分为经典等值法和项目反应理论等值法;也可以分为线性(如均值/均值等值法、均值/标准差等值法、Tucker 等值法、Levine等值法)和非线性等值法(如等百分位等值法、次数估计法、项目反应理论等值法);还可以分为观察分等值法(如均值/标准差等值法、Levine观察分等值法、等百分位等值法、项目反应理论观察分等值法)和真分等值法(如Tucker真分等值法、Levine真分等值法、项目反应理论真分等值法)。编制竖式量表的设计主要有量表卷设计、等组设计和锚题设计,编制竖式量表的方法主要有Hieronymus量表法、Thurstone量表法和项目反应理论量表法。本书对各类等值设计、等值方法以及量表制订的设计和方法都有详细介绍,还有详细的示例分析和说明,对于教育测验的实际工作者有很大的帮助和启发。


编制测量工具的过程

编制测量工具是一个复杂的过程,也是一个收集测量效度证据的过程。在编制测验的时候,一般从测量的目的入手。一个测量工具的效度如何,依赖于这个测量工具所获得的分数是不是能够达到测量的目的,是否能根据它推断出合适的结论。有了明确的目的,就可以编制测量的内容和统计细目表(content and statistical specification)。内容和统计细目表就是设计测量和编制测量试卷的蓝图,同一个测验的每一份试卷都必须尽可能满足各项测量细目的要求,这样,不同测验试卷之间的分数才能够有效等值。测量试卷编好以后,一般需要进行预测(pretesting)。预测以后,好的试题,可以挑选出来按照细目表的要求编制成正式的试卷(form)。如果采用锚题设计,必须按照锚题设计的要求,挑选适当的锚题。正式测验试卷编制完成以后,对考生进行正式测试(或者称为操作性测试,operational testing)。对操作性测试的数据进行项目分析,称为初步项目分析(preliminary item analysis,PIA),在初步项目分析过程中,一般对项目的难度、鉴别力、项目内容(比如答案是否准确)以及项目机能对不同群体的差异进行分析,剔除有问题的试题。等值和量表制订通常采用操作性测试的、经过初步项目分析以后的数据进行。通过等值把新试卷的原始分与量表分联系起来,做成原始分和量表分转换表。用这个转换表就可以给考生报告测验量表分。给考生报告分数以后,一般还要对测验数据进行最终项目分析(final item analysis,FIA),其目的一方面是为测验的总结报告提供统计数据,另一方面是为项目库建设和维持提供项目统计量。在编制测量试卷、进行预测和正式测试、收集测量数据、进行项目分析、检验项目的公平性,编制量表、进行等值、报告考生分数以及建立和维护项目库的各个环节中,有大量细致的工作,这些工作直接或者间接地影响到等值的质量,也影响到测量分数的效度。测量工作者需要参与各个环节的工作,维护测量分数的有效性。





02

本书结构和优点

本书大致分为三个部分,即等值(第二章到第八章)、量表制订(第九章)和联结(第十章)。第一章是全书的概论,第二章到第五章的重点是经典测验等值法,第六章和第七章介绍了项目反应等值法及等值误的估计,第八章讨论了许多等值的实际问题。第九章详细介绍了量表制订的方法,特别是竖式量表和成套量表制订的方法,也包括如何编制分数量表和怎样在分数量表中加入常模信息、分数精确性信息以及测验内容信息。第十章重点考虑了测验内容和统计特征不同的测验之间的联结问题,特别是群体不变性问题。本书每一章的后面附有一些练习题,还包括大量的参考资料。书末附录部分包括练习题的答案和原书作者编写的一些计算机软件介绍。练习题是为了帮助读者加深理解各章的重要概念,或帮助读者学习如何在测量实践中运用等值原理和统计技术。附录中所提供的所有计算机软件都可以从爱荷华大学的网站上免费下载,是帮助读者学习的好工具。参考资料包括本书第三版出版时有关测验等值的最新研究成果,对于读者进行有关等值的学习和研究非常有益。


总体来说,这本书的优点主要表现在:


01. 内容覆盖面广。这本书涉及了测验等值的几乎所有方面,包括等值的设计、测验内容的规划、施测管理、数据收集、等值方法的选择、量表的制订以及质量控制等。每项内容都有适度的介绍,有些内容比较深入,有些内容比较概括。有高中数学基础的人员就能学会。


02. 理论和实践并重。本书不仅详细介绍了在经典真分理论的框架下和项目反应理论框架下进行等值和量表制订的方法,还结合实际运用具体的数据资料详细演示和说明了如何运用这些方法以及在应用这些方法时需要注意的实际问题。尤其可贵的是两位原书作者都曾长期在ACT从事实际测量研究工作,也都是编程专家,他们根据理论和实际的需要,编制了许多可以免费下载的计算机软件,极大地方便了读者对本书的学习和理解。


03. 材料翔实、新颖,便于学习和研究参考使用。这本书的每一个版本,除了其前一版已经介绍过的研究成果外,还包括了几乎所有测量等值领域的最新研究成果。学习这本书,特别是参考每一章后面所提供的参考材料,使读者直接站在测验等值和量表化研究的最前沿,了解其他教育测验学家们对某个研究课题已经做过什么样的研究,还有什么样的研究需要加强。



03

目     录


统计符号

第一章 等值概论

第二章 运用随机组设计的观察分等值

第三章 随机组设计:在等百分位等值中对分布进行平滑加工

第四章 非对等组设计:线性等值法

第五章 非对等组设计:等百分位法

第六章 项目反应理论等值

第七章 等值标准误

第八章 等值的实际问题

第九章 分数量表

第十章 测验之间的联结

附录A:练习题答案

附录B:计算机程序

部分教育测量术语英汉对照表

索引

作者介绍


滑动查看更多,

可点击图片后放大

查看


测验等值、量表制订和联结的

方法与实践




04

作者、译者简介


Michael J. Kolen

美国Iowa大学教育学院教育测量和统计学退休教授。1973年获Iowa大学学士学位,1975年获Arizona大学硕士学位,1979年获Iowa大学博士学位。1979—1981年在纽约Hofstra大学任教,1981—1997年在美国大学测量中心(American College Testing,ACT)工作,1990—1997 年任ACT测量研究部主任。Kolen博士的主要著作就是由Springer公司出版的这本教材;此外,他还发表过许多有关教育测量和统计学的文章和书籍章节;其主要研究领域是教育测验等值和量表制订。Kolen博士曾任美国教育测量理事会(NCME)主席及教育测量杂志(Journal of Educational Measurement)主编。他是美国心理学会(APA)定量和定性研究法分会(第五分会)以及美国教育研究学会(AERA)的终身会员,也是教育和心理测量标准(Standards for Educational and Psychological Testing)改编联合委员会成员。Kolen 博士1997年获美国教育测量理事会颁发的杰出技术贡献奖,2008年获美国教育测量理事会颁发的教育测量终身成就奖。


Robert L. Brennan

美国Iowa大学教育学院测量和测验中心E. F. Lindquist主任、退休教授,也是测量与评估高级研究中心(CASMA)创始人和主任。1970年获哈佛大学教育学研究生院博士学位。随后在SUNY Stony Brook(纽约州立大学石溪分校)任教,1976年加入ACT,在那里担任过多种职务,包括高级资深科学家。1994 年被任命为爱荷华大学教育学院测量和测验中心E. F. Lindquist主任以及爱荷华测验项目(Iowa Testing Program)主任。他于2002年辞去该职,创立了测量与评估高级研究中心。Brennan博士单独或者与其他人合作发表过很多专业文章,出版的专著包括《概化论》(Generalizability Theory,2001)和本书,他还是《教育测量》(2006)第四版的主编。Brennan博士曾任Iowa 教育科学院院长、美国教育研究学会(AERA)测量和研究方法学分会副会长、美国教育测量理事会(NCME)主席。1997年获NCME颁发的教育测量杰出技术贡献奖,2000年获NCME颁发的终身成就奖,2004年获AERA和ACT联合颁发的E. F. Lindquist教育测量贡献奖,2011年获测量出版家协会终身成就奖。2017年美国大学委员会设立了Robert L. Brennan教育测量研究席位。


刘育明

湖南省武冈市人,曾就读于湖南师范大学、首都师范大学和美国爱荷华大学,分别获得学士、硕士和博士学位。曾在中央教科所(今中国教育科学研究院)、美国滨河出版社(Riverside Publishing)以及美国教育测量服务中心(ETS)从事教育研究和开发方面的工作。曾主译Reuven Feuerstein等(以色列)所著《思维工具强化——弗斯坦智力开发课程》(1989)。

QQ邮箱:2254488169@qq.com





(点击下方小程序进入详情页)


(本文主要内容来自原书译者前言,作者刘育明。摘录时有所删减。)


扫码学习“实证研究方法进阶”发票开具方法:提供增值税普通电子发票和会议通知。开票单位为北京思高乐教育科技有限公司。发票类目为会议费、网络会议费、信息服务费、咨询费。可在学术志APP中-我的-发票中心,或者学术志微信公众号中-学员服务-个人中心-发票中心,自行填写发票信息并核实修改后提交开票申请,申请后一周内可在所留邮箱中查收下载,如遇特殊情况,也可保证一个月内开具发送。


研究方法

科研助力 | 教育部人文社科项目这样写才能中!

科研助力 | 国家社科基金项目10讲:从选题到结项
科研助力 | 国际SSCI论文写作与发表策略

科研助力 | 在社会科学领域,怎样进行量表的开发?

科研助力 | “统计女王”和你讲:每一个文科生都能成为SPSS操作能手!

科研助力 | 耿曙. 打通社科发表之路:思路、方法和操作

科研助力 | 研究设计35讲重磅上线!浙江大学耿曙教授亲授

科研助力 | 香港中文大学的统计学课,搬到了互联网上,文科生再也不愁学统计

科研助力 | 扎根理论听不懂,NVivo实操做不出,科研论文没救了?

科研助力 | 王宁教授的方法课:30讲带你搞懂质性研究方法

科研助力 | 做民族志还在一个田野点上实地调查吗?你out了!

科研助力 | 刀熊博士带你玩转社会网络分析:从方法到实践

科研助力 | 加利福尼亚州立大学刀熊博士:7大实证研究方法逐个击破

科研助力 | 做前沿的科学知识图谱,不用CiteSpace怎么行?

科研助力 | “写论文,你们竟背着我用LaTex!”




欢迎留言




点个在看 你最好看



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存