查看原文
其他

张青根 沈红|中国本科生批判性思维能力增值再检验——兼议高等教育增值评价的实践困境

张青根、沈红 中国高教研究 2024-02-05

DOI:10.16298/j.cnki.1004-3667.2022.01.11

摘 要


探索增值评价是深化新时代教育评价改革的重要方向,也是促进高等教育高质量发展的可能方式。基于2016—2019年全国本科生能力追踪测评与调查数据,测度三年期间中国本科生批判性思维能力增值的程度,并量化评估高等教育对本科生批判性思维能力增值的影响。研究发现,中国本科生批判性思维能力增值存在显著的学科差异、院校组别差异、单个院校的个体差异以及边际递减效应,与本团队前期基于横截面数据的研究发现是一致的。同时从适切性理论基础、指标体系构建、工具研发、分析技术与结果应用等方面探讨高等教育增值评价可能面临的实践困境。

关键词


本科生;批判性思维能力;增值评价;实践困境

一、引言

  批判性思维是一种合理的、反省的思维,强调对观点、假说、论证等持审慎的态度,在敢于反省、谨慎论证的科学逻辑下寻求思想、制度、技术等方面的突破与创新。培养批判性思维人才,是高等学校的应有之义,更是促进高深知识更新、加快推动重大科技创新、为攻克“卡脖子”技术难题做准备的内生动力。批判性思维能力是可教可测的,许多机构或个人开发出了一系列的测试工具来测度大学生的批判性思维能力水平及其变化情况,并以此评估不同类型高校的教育教学成效。斯坦福大学研究团队对美、中、俄、印四国大学生的批判性思维能力水平及其变化情况进行了测试及比较,发现中国大学生批判性思维能力在大学期间反而下降。该研究在中国国内引发了巨大争议,争论主要集中在测试工具的内容效度及本土化适应、抽样代表性及结论可推广性、高等教育归因的科学性等问题上。尽管存在着诸多争论,但该研究却极大地推动了国内高等教育界对学生批判性思维能力的关注。本团队也曾于2016年利用本土化批判性思维能力测评工具,对全国83所本科高校15336名大学生进行批判性思维能力测试,并基于该横截面调查数据测度本科生在大学三年期间的批判性思维能力增值情况,但得出了相反的结论,认为中国大学生的批判性思维能力并未在大学期间降低,而是取得了一定程度的增长。两项研究在测试工具、测评对象、计量方法等方面均存在较大差异,研究结论出现不一致情况属正常现象,但这种差异性结论也促使本团队反思已有研究,以期深入探讨高等教育对大学生批判性思维能力发展的作用,为未来高等教育教学实践提供参考。

  首先,本团队的上述研究使用的是大一和大四两个年级的横截面数据,通过反向测度法来计算2016年年底时大四学生在三年大学期间的批判性思维能力增长情况。但这种测度方式对反向预测模型的要求较高,须有较高的样本量、基础信息变量、模型拟合优度等,研究结果需进一步检验。为此,本团队于2019年对参与过2016年基线调查的大一学生进行了三年后追踪测评与调查,获取了基线和追踪两期数据,从而直接测度本科生在大学三年期间的批判性思维能力增值情况,并再次评估高等教育对本科生批判性思维能力的增值作用。

  其次,上述两项研究均选择了代表性的核心通用能力来反映高等教育期间本科生的发展情况,从而评估高等教育的人才培养质量。从评价方式上看,这属于典型的增值评价方式。然而,两项研究的差异性结论也提醒我们进行反思:在高等教育阶段中实行增值评价时可能存在哪些困境?众所周知,增值评价是一种过程性与发展性评价,既关注高等教育入学时大学生的初始起点以及毕业时的发展结果,更关注大学生在高等教育期间的学习与投入过程,由此来评价高等教育如何影响大学生的学习与发展,并结合高等教育投入情况来评估高校人才培养的内部效率。2020年10月13日中共中央、国务院印发的《深化新时代教育评价改革总体方案》也明确提出,“坚持科学有效,改进结果评价,强化过程评价,探索增值评价”,这也为探索高等教育增值评价提供了政策空间。然而,高等教育是传播和发展高深知识的专业教育,大学生的学习与发展内涵极其多元复杂,如何在高等教育阶段实施增值评价则需深入讨论。

二、研究设计

  (一)数据来源

  数据来源于本团队开展的2016—2019年全国本科生能力追踪测评与调查。该测试旨在了解中国普通公立高校本科生的批判性思维等能力的水平及其在高等教育期间的增长情况,同时辅助大量的基础性信息及学生投入情况调查。本团队于2016年12月开展了对全国四年制本科院校进行10%抽样的基线调查,覆盖全国16省(直辖市、自治区)83所高校,有效样本为15336人,其中大一学生8245人。2019年10—12月,对基线调查中12省的5926名大一(追踪时为大四)学生进行追踪测试,有效追踪样本1409人,有效追踪率为23.8%。

  本研究聚焦于分析本科生在高等教育期间的批判性思维能力增值情况。由于本团队在执行基线与追踪调查时采用了不同的测度方式,具体而言:在基线调查中,使用33题完整版的批判性思维能力测试工具,而在追踪调查时则使用测试效果等效的、缩减为18题的简版批判性思维能力测试工具(18题均源于原来的33题)。为此,本研究在测度本科生批判性思维能力增值上主要存在两种方法:第一种,直接使用基线与追踪调查中均使用18题测试结果来反映本科生批判性思维能力增值;第二种,直接使用追踪与基线调查的测试结果差值来评判本科生批判性思维能力增值。两种测度方式都采用百分制。在有效追踪样本1409人中有1386人具有有效的批判性思维能力测试数据,其中,男、女生样本分别有676、701人(部分样本的性别信息缺失);文科、理科、工科、医科分别有496、309、455、126人;原“985工程”高校、原“211工程”高校、普通四年制大学、普通四年制学院分别有293、302、484、307人。

  (二)测试工具

  测试工具由来自哲学、心理学、教育学等多学科领域的学术团队研制开发。如前所述,在基线与追踪调查中存在两套测试工具,即33题完整版和18题缩减版,均为客观选择题且要求集中被试在规定时间内(时间分别为50和25分钟)独立闭卷完成。本团队基于经典测试理论和项目反应理论分别进行测试工具的质量分析,两套测试工具的效度较高,均表现出难度适中偏易、区分度较好、信度良好等特征,详细内容可向笔者索取或参见《我国高校本科生批判性思维能力测评工具的研制与检测》一文。

三、研究结果

  (一)描述性统计分析

  表1呈现了不同本科生群体的批判性思维能力增值情况。在此仅重点汇报第一种测度方式下的结果。从整体上看,大学三年期间,本科生的批判性思维能力增值均值为9.716分,表明平均而言,在高等教育期间,本科生批判性思维能力获得了提升。分学科上看,文科(10.663)、理科(9.978)、工科(8.926)、医科(8.201)本科生的批判性思维能力增值依次降低,但差异并不明显。分院校组别来看,普通四年制大学(10.262)、普通四年制学院(9.808)、原“985工程”高校(9.367)、原“211工程”高校(9.088)的本科生批判性思维能力增值依次降低,但差异并不显著。从单个院校来看,如图1所示,除极个别普通四年制大学(代号308)外,其他所有院校的本科生的批判性思维能力增值的均值均大于零,但不同院校之间的本科生批判性思维能力增值大小并无显著差异,且与学校层次之间并无明显序列,整体呈现出无序状态,具体而言,并非高层次大学的本科生批判性思维能力增值就一定比低层次大学的本科生批判性思维能力增值高,甚至出现部分相反的情况。从第二种测度方式上看,尽管在本科生批判性思维能力增值的绝对值分数上与第一种测度方式的结果有些微差异,但除性别差异外,其他结果基本一致。

  (二)回归分析

  表2呈现了本科生批判性思维能力增值的回归分析结果。在此仅重点陈述第一种增值测度方式下的结果。从学科类别来看,文科、理科、医科、工科本科生的批判性思维能力增值依次降低,但仅文科与工科的差异是显著的,文科生的批判性思维能力增值比工科生的批判性思维能力增值显著高出1.560分。

  从院校类型来看,相比普通四年制学院本科生而言,原“985工程”高校、普通四年制大学、原“211工程”高校的本科生的批判性思维能力增值分别显著高出7.712、3.050、2.283分,表明不同层次的院校对本科生批判性思维能力的增值作用存在异质性。分单个院校的增值作用来看,如图2所示,在控制其他变量下,相对普通四年制学院419而言,除了极个别院校(普通四年制大学306和336、普通四年制学院410)不显著外,其他所有院校对本科生批判性思维能力的增值作用均为高度正向显著的,但增值效应的大小程度呈现出明显的差异性,最大的增值效应为24.16分(原“985工程”高校106),最小的增值效应为5.80分(普通四年制学院410)。同时也发现,从单个院校上看,并非学校层次越高的大学,其对本科生批判性思维能力的增值作用就一定越大,如原“211工程”高校205的增值效应为20.31分,但不少原“985工程”高校(如111、112、104、113)的增值效应小于20分。同样的,很多普通四年制大学对本科生批判性思维能力的增值效应处于18~20之间,但依然不少原“985工程”高校、原“211工程”高校的增值效应处于18以下。整体而言,尽管普通四年制学院的增值效应最低,但也存在个别普通四年制学院(如405)的增值效应较为突出,达到了18分以上。由此说明,在控制其他变量情况下,从院校组别的整体而言,原“985工程”高校对本科生批判性思维能力的增值效应最高,其次是普通四年制大学,原“211工程”高校为第三,普通四年制学院最低。但具体到单个院校而言,增值效应呈现出无序状态。

  此外,考虑到本科生批判性思维能力的初始水平可能会影响到高等教育期间的增长情况,本研究将此纳入模型中,从表2可看出,本科生批判性思维能力初始水平的拟合系数为-0.564,且是高度显著的,表明在控制其他变量下,本科生批判性思维能力初始水平越高,其在高等教育期间的批判性思维能力增值程度越小,两者呈现出显著负相关关系。这也证明,在高等教育期间,本科生批判性思维能力增值存在着显著的边际递减效应,初始批判性思维能力水平每提高1分,本科生在高等教育期间的批判性思维能力增值将降低0.564分。

  从第二种增值测度方式的结果上看,除了在绝对值数值上存在些微差异外,整体研究结论是一致的,这也说明本研究结果是稳健的。

  (三)与2018年横截面研究的比较分析

  表3呈现了本研究与2018年横截面研究之间的对比分析结果。整体而言,本研究与2018年横截面研究的研究结果是相近的,均发现在控制其他变量下,大学教育对本科生批判性思维能力的增值效应存在学科差异、院校组别差异、单个院校差异和边际递减效应。但在更为细致的结论上,两项研究存在些微差异,如工科与医科的增值效应的顺序,原“211工程”高校与普通四年制大学的增值效应的顺序。由此说明,尽管存在微小差异,但在样本规模较大、基础性信息变量充足、模型拟合度较高等条件下,反向测度法是有效的,能够揭示大学教育对本科生发展的影响。这也证明,本团队的前期研究结论是可靠的,能够经受追踪调查数据的检验。

四、进一步讨论:

高等教育增值评价的实践困境

  增值评价是考察高等教育机构效率的有力抓手,也被认为是一种更公平的大学教育质量评价方法。增值评价改变了以往以“输入”或“输出”为依据的评价模式,强调以学生发展为中心,注重以可显现证据来评价教育教学质量,认为大学生在知识、技能和能力上取得的“增量”性进步才是教育教学质量的体现。这种方法避免了学生基础性学业水平及家庭背景等因素的干扰,直接测度大学教育对学生增值的“净贡献”,可用来准确评价学校教育教学质量,“净贡献”越大,学校教育教学质量越高。

  尽管在教育评价理念上高等教育增值评价有诸多优势,但在具体教育评价实践中也面临着不少挑战性难题,具体表现如下。

  (一)适切性理论基础缺失:西方高校影响力理论的泛用与本土大学生发展理论的荒芜

  从理论上看,20世纪60年代以来兴起于美国心理学界的大学生发展理论体系为增值评价在高等教育领域中的应用奠定了坚实的理论基础,其基本目标是解释大学生在四年的学习生活中怎样发展成为了解自我、他人及世界的成熟个体的过程。在大学生发展理论体系中,最具代表性的理论包括个体与环境互动理论、认知结构理论、社会心理与认同发展理论、类型理论、整合性理论。这种理论重点阐述高等教育期间大学生收获的多维成长,如身心健康发展、主体间人际关系和谐、认知或非认知能力提升等,也特别注重分析在大学生成长过程中高等教育所扮演的角色及其作用程度,为高等教育增值评价相关研究与实践提供了诸多借鉴。

  目前国内大学生发展相关研究大量应用了上述西方院校影响力理论,试图解释中国大学生的学习与发展问题。然而,中国高等教育具有特殊情境性,有特色鲜明的育人渠道、办学理念、文化熏陶及价值追求等,这些情境或氛围对中国大学生发展发挥着潜移默化的作用。代表性的,“立德树人”是中国高等教育的根本任务,需要集文化与价值传递、榜样塑造、育人环境构建、切身社会实践体悟等手段于一体,充分发挥多群体多部门的主观能动性,从而提升大学生的理想信念、道德责任感、集体主义精神、家国情怀等意志品质。而这种价值增值在西方高校影响力理论视域中很难找到适切的框架或路径来解释,这也要求中国高等教育研究生成具有中国特色的本土化大学生发展理论。

  (二)增值评价指标体系及其测度工具的壁垒:“大而全”的理想与“碎片化”的现实

  推进高等教育增值评价的首要任务是确定评价的具体内涵,要告诉利益相关者从哪些方面进行增值评估。这就要求对大学生成长与发展的核心目标与任务有清晰的认识。然而,大学生发展的内涵极其丰富,广义上讲,大学生发展是指学生参与一系列学习或实践体验后,个体自身获取的德智体美劳等多维成长。如通用知识与专门知识的增长,认知能力与非认知能力的发展,心理健康成熟、行为技能完善、意志品质优良等。理想中的高等教育增值评价体系应该涉及大学生发展的所有指标,形成“大而全”的指标体系架构,全面地反映大学生在高等教育期间的成长与发展。

  然而,受限于诸多客观因素,现实中的高等教育增值评价只能通过部分核心的“碎片化”指标来反映高等教育人才培养质量。从国际经验来看,高等教育机构或国际组织更多集中于“核心认知能力”或“一般技能”,如书面交流能力、人际交往能力、创造潜力、批判性思维能力等。然而,即使是只关注这些核心认知能力,也存在能力细类划分及其选择的问题。以本研究关注的批判性思维能力为例,在教育评价实践中,大学生批判性思维能力是否应该作为考核学校人才培养质量的指标纳入增值评价指标体系,这涉及多维因素的考量,如批判性思维能力是否重要、能否在本科教育期间得以提高、可否进行校际比较等。通过“碎片化”指标来评估高等教育增值是一种妥协的手段,在有力推进中国高等教育增值评价实践的同时,也不可避免地引来利益相关群体的责问与怀疑。

  更为甚者,即使在某些关键性、“碎片化”的核心指标确定后,如何科学、准确、便捷地度量出相应指标的真实水平是另一个充满质疑和争议的实践难题。一般而言,存在两种信息度量方式。一是间接评估法,主要通过询问大学生的高等教育参与经历,以及他们自我感知到的个体学业、技能、身心等的发展与收获情况,间接地反映出高等教育的作用。该方法施测较为简单,但受社会称许性影响,这种信息收集方式存在较大的测量效度问题。二是标准化测试,该方式能直接反映大学生的核心认知能力及其增值,数据具有较高的信度和效度,但在工具研发成本、施测难度、测度内容等方面存在劣势,且易受测试组织形式、学生参加测试的动机等影响。为此,如何获取公认科学有效且真实便捷的测度工具是具有挑战的课题,也是高等教育增值评价进展过程中难以逾越的工具壁垒。

  (三)增值评价技术困境:多样化的分析技术及其应用中的潜在局限

  在增值评价实践中,即使有了相对适切的指导理论和科学的测试工具,并测度大学生在高等教育期间的发展情况后,如何将高等教育的净影响从纷繁复杂的家庭、个人、社会等因素中剥离出来也是个艰巨任务。事实上,这种净影响才是高等教育质量的真正体现。而这种剥离技术取决于实践中获取的数据及其结构。在现实评价实践中,经常只能收集到横截面数据,这种情况下往往只能采用反向测度法、基于OLS或HLM模型的残差差异分析法等。前文已阐述了反向测度法的适用条件及其局限,而残差差异分析法也存在着诸多前提假设与应用条件,且只能落实到高等教育增值评价中的组间效应,将高等教育视为一个黑箱,并未回答高等教育如何促进大学生发展,因此无法深入探究学生个体在高等教育阶段的增值情况,无法分析个人或家庭背景特征、学习投入或参与、人际或社会交往等如何影响学生个体的增值。而这对未来个人教育选择及高等教育机构人才培养方案完善等更有政策意义。

  现实中,即使在耗费巨大经费、人员等投入下获得较大规模的追踪调查数据后,也面临评价技术困境。从已有文献看,常用的方法是在控制其他变量下将高等教育作为一个整体变量,纳入回归模型后,通过模型的拟合系数来判断不同高等教育的作用。这种方法离严格意义上的因果推断也相距甚远,剥离出的高等教育增值效应也并非纯粹的。首先存在的问题是,如何排除内生性等因素的干扰,如大学生发展不仅与高等教育相关,也与个人自身基础能力相关,他们在高等教育期间取得的发展究竟是高等教育带来的,还是自身基础能力致使的?这在评价方法中永远是个技术难题。再如有研究者在评价高等教育增值时将大学生入学成绩的平均值、大学生社会经济地位的平均值等纳入模型中,试图剔除学校总体平均初始水平或家庭经济地位的影响。这种做法的潜在假设是这些因学生集聚而产生的高等教育群体特征对大学生学习和能力发展的影响不能纳入高等教育增值效应之中。然而,这种假设是值得商榷的,一方面,学生集聚特征是学生群体的外在表现,体现出学校给在读学生创造的整体学术水平、学习风气、氛围等,也间接反映出学生间交流学习效果的差异性和层次性等。另一方面,学生集聚特征很大程度上受学校声誉、学科实力、学习风气、地理位置等因素影响,并不是完全外生的。因此,学生集聚特征所引致的学习和能力发展不能完全撇离高等学校的作用。

  (四)应用陷阱:增值评价结果的解读、应用及其负外部性

  在准确利用相关技术测度出增值结果后,如何结合实际情况进行解读与应用同样是现实难题。在此,以大学生批判性思维能力增值评价结果为例进行讨论。

  第一,如何解释大学生批判性思维能力的增值评价结果。本研究发现,绝大部分高校能够提升大学生批判性思维能力,但并非学校层次越高,大学生批判性思维能力提升越大,部分低层次院校的增值作用甚至远大于高层次院校的增值作用,形成该结果的可能原因至少有三种:一是,不可否认,在现实高等教育环境中,客观存在着部分顶尖层次院校并未重视学生批判性思维能力培养,相反,部分较低层次院校在人才培养模式中注重培养学生的批判性思维能力;二是,存在“边际递减效应”,学生批判性思维能力的增长并不呈直线方式,可能初始能力较高的学生在后期批判性思维能力增长会比较缓慢,呈现出边际递减现象,而原“985工程”高校的学生初始能力相对较高,这样的话便会致使学生后期增长并不明显;三是,存在“天花板效应”,学生的批判性思维能力在一定阶段具有相应的“天花板”,对于那些批判性思维能力基础本来就不错的学生而言,即使进入顶尖大学就读,其批判性思维能力增长可能因触及阶段性的“天花板”而不再增长。

  在高等教育评价实践中使用增值性评价的目的在于评价人才培养成效并进行院校间比较,对于上述第一种情况而言,增值评价结果能够直接指出哪些院校需要改进教育教学、提升人才培养质量。但对于后两种情况而言,使用增值评价结果考察高校教育教学质量则需慎重,对于部分顶尖大学本科生来说,初始进入高等教育时,个人的批判性思维能力已经较高,留给他们的增长空间并不大,或者说,需要他们破除特定阶段的天花板之后才能取得明显变化,也可以说,在相同的批判性思维能力增长幅度下,他们需要付出更多的努力才能达到,高校也需要付出更高的资源。在不考虑院校间学生能力的起点差异、学校资源投入差异、学生学习投入精力等因素,通过简单比较增值幅度的院校间差异来评价高等教育质量,可能会得出错误结论。此外,受限于数据的时间、校际、课程间跨度,这种增值评价结果更多体现的是短期跨度的增值效应,研究结果的有效性、代表性和可推广性被打折扣,且与高等教育增值的历时性、积累性和滞后性等是相违背的。

  第二,如何在实践中应用大学生批判性思维能力增值结果。如大学生批判性思维能力的增值评价结果是否应该与学校绩效表现、财政拨款、高校排名、学科评估等相关联;是否应该成为大学生的学业绩点及评奖评优、高校教师绩效考核及职称晋升等相关考核的关键指标。若采用自上而下的制度性增值评价,并进行相关绩效考核和学校财政资源奖励或惩罚的话,高校很有可能受此指挥棒的影响,沦为大学生批判性思维能力考试培训机构,大学生也会因外部强制性压力、参与动机等影响,侧重于批判性思维技巧性训练,而忽视了培养批判性思维的习性、态度或心智模式等,最后很有可能培养的只是大学生应试技能而非真正的批判性思维能力。倘若借鉴西方国家的第三方机构评价方式,由高校自主参与批判性思维能力测评,形成自愿问责系统,评价结果不纳入绩效考核及财政资源分配等指标体系中,仅面向社会开放,帮助利益相关者了解、评价和监督高校教育质量。如此方式下也可能面临着高校参与意识不强、学生敷衍了事、第三方评价机构成熟度不高、社会利益相关者专业性不强等问题。在这两种模式之间如何权衡选择是未来高等教育管理与研究实践亟需回应和解答的难题。

  【本文系国家自然科学基金青年项目“本科生批判性思维课程有效性及其实现机制:基于准自然实验的追踪研究”(71904054)、教育部人文社会科学研究青年基金项目“‘双一流’建设高校本科生批判性思维能力增值的影响机制研究:来自追踪调查的证据”(19YJC880134)的研究成果】

作 者


张青根,华中科技大学教育科学研究院副教授,湖北武汉 430074

沈 红,通讯作者,南方科技大学高等教育研究中心讲席教授,广东深圳 518055

原文刊载于《中国高教研究》2022年第1期第69-75页

栏 目


大学生学习与发展研究


中国高教研究

微信公众号:zggjyj1985

投稿平台:

http://editor.cahe.edu.cn/

继续滑动看下一个

张青根 沈红|中国本科生批判性思维能力增值再检验——兼议高等教育增值评价的实践困境

张青根、沈红 中国高教研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存