考研分数“信度”如何?其实,这两项本科成绩至关重要

考研分数“信度”如何?其实,这两项本科成绩至关重要

文 | 刘进 陈恺哲

再过几天,2023年全国硕士研究生招生考试将迎来初试。作为国家选拔人才的重要方式,考研选拔中的“唯分数论”导向一直受到学术界质疑。追根溯源,这主要是对研究生招生考试预测准确性的怀疑。

考研分数能否代表学生日后的学业表现,又在学业表现的哪些方面起到作用?除考分外,是否有更好的预测指标选拔研究生?这些问题亟待解答。

三点原因致研究生“高分低能”

硕士研究生入学考试作为研究生教育的起点,对研究生培养起着至关重要的作用。近年来,通过研究生选拔考试脱颖而出的人才,往往受到“高分低能”的诟病,即只有高分数,却缺乏创新意识和科研实践能力。

比如,有研究者提出,当前研究生考试没有跳出应试教育的窠臼,其命题原则实际上鼓励学生对考题死记硬背。这种方式很难挑选出有才能的学生,往往导致善于考高分的人进入宝塔顶尖,真正有潜力的学生却被埋没。

从已有研究结果看,考研分数对研究生学业表现的预测准确性确实不容乐观。比如,有学者曾对国内某“双一流”高校546名硕士生的毕业论文成绩与入学考试初试成绩进行过研究,发现二者之间甚至呈现出显著的负相关关系。

至于原因,学界一般认为有如下几个方面。

一是考试命题问题。根据教育部2021年出台的《2022年全国硕士研究生招生工作管理规定》,研究生入学考试中,全国统一考试的全部或部分考试科目由教育部考试中心统一命题,其他考试科目由招生单位根据大纲自行命题。

由于采取自命题笔试的高校较多,水平参差不齐,导致在试题质量与管理规范性上与统考存在差距。同时,初试笔试科目各不相同,复试阶段却采取统一划线,导致初试分数的可比性变差。

二是研究生选拔过程重笔试、轻复试,学生非认知能力因素(如考生考研动机、意志品质)较难得到考查。近年来,劳动力市场“学历门槛”的上升,导致大量学生的考研目的只是为拿到硕士文凭、改变工作处境,对学术科研毫无兴趣。虽然复试环节可以考查学生的动机和兴趣,但生源一般的招生单位为满足扩招需要,往往采取等额复试的方式,或者重初试分数,淡化复试表现,导致学生的考研动机和创新能力难以得到有效甄别。

三是高校对学生本科学业表现考查不足。国外大学对于申请人认知因素的考查方式,主要是本科成绩和标准化入学考试(如GRE)。虽然国内高校在研究生复试阶段也会要求学生提交本科成绩单,但由于复试周期较短,招生单位往往没有充分时间核实材料的真实性,也无法发挥本科成绩的评价作用。

同时,国外高校在研究生选拔过程中,往往采用“本科院校竞争性水平”的概念衡量学校间教学质量水平的差异。有研究者认为,如果将这一概念作为学生平均学分绩点(GPA)的权重因素,可进一步提升本科GPA的参考价值。在我国,鉴于现行研究生招考制度难以分辨学生是否具备科研潜力,部分招生单位在自主招生时,也会看重申请者的本科院校水平。

然而,对此也有人提出质疑。

北京大学教授岳昌君曾对北京市高校硕士研究生创新能力进行过调查。发现来自原“985工程”高校学生的创新精神得分高于原“211工程”高校的学生,两者均高于普通本科高校学生,但这几种差异在统计上并不显著。

那么,到底是考研分数对研究生未来学业表现预测更准确,还是本科学校层次和学业成绩对研究生综合素质反映更全面,抑或有其他因素会产生影响?对这些问题的回答将有助于我们未来制定更科学、有效的研究生人才选拔制度。

生源高校层次与答辩分数关系不大

为探寻相关答案,笔者和研究团队收集了北京某高校某学院2015年—2020年间所有硕士研究生的数据,并对这些学生入学前提交的原始本科成绩单、2015年—2020年研究生入学考试数据,以及其入学后学业表现数据进行了分析。

结果发现,推免生的平均GPA要高于统考生,但在同类型硕士生中,本科学校的层次不影响其学业表现。原“985工程”高校统考学生在研究生阶段的平均GPA为83.62,原“211工程”高校统考学生的平均GPA为82.24,而“双非”高校统考学生平均GPA为82.26。近似的对比关系也出现在三种类型高校的推免生中。

可以看出,上述数值与学生的本科院校层次的相关性非常弱。同时,虽然推免生在学业表现上要高于统考生,但两者在科研表现上却无显著差异。其原因可能是由于获得推免资格的学生在本科阶段学业优异,因此在研究生阶段比统考生更擅长拿高分。

从平均GPA与毕业论文答辩分数的关系上看,来自不同层次高校的学生仍无明显差异。然而,如果单独分析推免生的科研表现,会发现来自原“211工程”高校的推免生中,有学术论文发表或竞赛得奖经历的学生比例显著高于来自原“985工程”高校的推免生——后者在本科阶段有获奖经历的学生占比为80.7%,前者则高达98.2%。

这与常理似乎并不一致。

究其原因,可能是由于原“985工程”高校对来自原“211工程”高校推免生的要求更为严格,学生需同时拥有优异的学业成绩和科研获奖经历才能通过筛选,而这些因素都对学生的科研潜力具有显著影响。反之,原“985工程”高校对推免生,特别是本校生源的推免生条件较为宽松。

如果将研究生考研分数细分为各个单科,会发现研究生阶段的平均绩点与其入学前的所有考试因素均无显著关系,但大学英语四级分数与研究生复试的面试分数越高的硕士生,越倾向于在毕业论文答辩中获得高分。

这可能由于毕业论文的答辩涉及多方面因素,除学生查阅文献与写作能力外,也受到学生临场发挥和表达能力的影响。因此,研究生面试中取得高分可在一定程度上帮助该生在答辩环节获得更好表现,而英语能力有助于学生在论文写作时的文献查阅。

同时,这也能在相当程度上说明,统考学生的考研分数并不能保证其在研究生阶段取得更好成绩。

此外,硕士研究生在科研方面的表现依然与其入学考试各单科成绩无关,只与学生在本科阶段的各项表现有关。那些在入学考试中取得高分的统考学生,虽然会在研究生阶段获得更高的GPA,但在科研能力或综合学术创新能力上,其表现并不强于入学成绩较低的学生。

缩小初试占比,更重本科学业考查

通过上述研究,我们发现当前的研究生选拔机制重知识、轻实践创新的现象依然很明显,通过考试分数筛选出的学生与当前的研究生培养教育宗旨也并不吻合。与此同时,学生在本科阶段的学业表现却对其研究生阶段表现有着至关重要的影响,尤其是本科获奖经历与大学英语四级成绩。

此外,正如前文所言,目前本科学校竞争性在推免生群体中还出现了“反向作用”——具备科研潜力的学生比例在原“211工程”高校群体中更高,这一点也需要引起我们的注意。

基于上述研究结果,笔者认为要提升研究生的学科表现,需从以下方面进行政策调整。

首先,改革研究生入学考试内容,增加综合能力考查,促进初试命题的统一性。当前的研究生入学考试更注重对基础知识和通识知识的考查,容易导致高分考生只会考试,不会做学术研究。因此,在命题时增加专业能力和创新能力试题尤为重要。同时,初试中众多高校采取自命题形式,难以保证笔试环节的公平性与科学性,应逐步采取国家统一初试命题、复试由各校自行组织的统分结合形式。

其次,缩小初试分数占比,采取多种形式的考核策略。研究生入学考试的目的是选拔专业能力与科研潜力强的学生,但这些能力在笔试分数中无法得到全面反映。研究发现,面试表现更好的学生易获得更高的论文答辩分,这与学生的表达沟通能力相关。高校应在复试中更多体现出多样性和自主性选拔,使用多种策略考查学生专业能力,比如在复试中增加学生外文文献阅读、现场实验操作以及学术汇报等。

最后,加大对学生本科学业表现的考查。当前,各高校一般会在复试环节要求学生提交本科成绩单及获奖经历,但该制度往往流于表面。反观国外,相关材料往往在申请环节就提交给学校,这种做法值得借鉴。

在笔者看来,我们也应要求学生在报名之初就提交本科成绩单,从而给目标院校更多将其量化比较的时间,甚至可以将其作为初试分数的加分项,给予小部分本科学业优异却不擅长考试或发挥失常的考生一次复试机会。而在复试或推免过程中,除学生本人提交本科成绩单外,本科高校也应提供对该学生的综合评价,包括学生具体的获奖、处分记录和教师推荐信等内容,保证高校对学生本科学业表现评价的真实性和多样性。

(作者单位:北京理工大学人文与社会科学学院,《中国科学报》记者陈彬整理)