2012年考研英语一难度(2012年考研英语一难度系数)

2012年考研英语一难度，2012年考研英语一难度系数

感谢您关注“永大英语”！

北京市中考英语阅读理解命题素材文本难度研究

葛星捷赵连杰

摘要：阅读素材是阅读命题的重要基础，其文本难度是影响命题质量的关键因素。本研究运用自然语言处理工具Coh-Metrix，对2012-2021年北京市中考英语阅读理解的50篇命题素材的文本难度进行量化分析。研究发现，历时来看北京市中考英语阅读理解命题素材的总体文本难度基本持平，但在阅读量、句法和衔接上存在显著性差异；北京市中考英语阅读理解各分项命题素材之间仅有部分年份存在较明显的文本难度差异，且难度分布并不规律。本研究对中考英语阅读理解命题素材的选择和调控提供了实证支持和参考依据。

关键词：文本难度；命题素材；中考英语；阅读测试

一、引言

2019年11月，《教育部关于加强初中学业水平考试命题工作的意见》指出，要提升试题的科学化水平，规范命题难度，拓宽试题材料选择范围，丰富材料类型等。陶百强（2019）指出，“命题素材或文本是命题的起点,命题素材或文本的选择与科学搭配影响甚至决定了试题质量与试卷难度”。显然，命题素材及其文本难度的控制对于科学化试题命制的重要性不言而喻。然而，笔者通过文献梳理发现，关于命题素材的文本难度研究并不多见，在语言测试领域更是鲜有实证研究支撑。鉴于此，本研究拟采用自然语言处理工具Coh-Metrix，从多个维度对2012-2021年的北京市中考英语阅读理解命题素材的文本难度进行分析，梳理提炼其文本难度特点，旨在为中考英语阅读理解部分命题素材的选择及难度一致性的保持提供借鉴和启示。

二、文献综述

在阅读理解测试中，命题素材的文本难度对测试的难度有直接的影响。文本难度是指文本可以被读者理解和接受的程度，确定文本难度可以为处于不同语言能力等级的读者选择适合的阅读文本提供帮助（Fulcher,1997）。文本难度的测量研究起源于20世纪90年代，有研究者提出可以运用词汇复杂度和句子长度去预测阅读语篇的难度（Chen，2016）。此后，研究者开始采取单一的可读性指标，例如弗莱士易读度、阅读能力等级（Degrees of Reading Power, DRP）和蓝思分级（LexileScores）等（江进林，韩宝成，2018）对文本难度进行量化，但这些量化指标通常仅与词汇和句法相关。实际上，对文本难度的精确测量要比单纯通过词汇和句子指标进行计算复杂得多（Liao，2020）。

进入21世纪后，人工智能教育的发展为文本分析提供了如“Coh-Metrix”“英语阅读分级指南针”等更加精密且全面的工具，方便研究者对文本进行深入的量化研究。Coh-Metrix是一款由美国孟菲斯大学的McNamara等人研发的基于网络的量化文本分析工具，目前可以在线对书面文本的描述性统计量、文本易读性主成分得分、指称衔接、潜语义分析、词汇信息、词汇多样性、连词、情景模式、句法复杂度、句法形式密度和可读性共计11个模块、106个变量进行自动分析（江进林，2016）。这个工具在文本难度的量化研究上用处广泛，在外语教育领域主要以教材文本以及命题文本分析为主。在教材文本分析方面，相关研究主要聚焦于探索高校外语教材和外语考试的文本难度特征（Green, et al.，2010；Plakans, Bilkis, 2016；江进林,韩宝成，2018；陈安妮，郭爱萍，2019）。在命题文本分析方面，黄丽燕和王嘉樱运用Coh-Metrix和Python对浙江高考“一年两考”阅读理解文本进行复杂度分析，归纳出浙江高考英语阅读文本复杂度的特点，并对高考试题命制、课堂教学和题库简体提出启示；黄丽燕和史碧冰（2020）借助Coh-Metrix从考试目标、试题结构、题目编写等方面对我国7个城市的中考英语进行分析，并结合2018年中考的实际情况对当前中考英语命题工作提出改进意见等，但这些研究并未对中考英语阅读理解命题文本的文本难度进行充分的量化分析。

在借鉴上述研究成果的基础上，本研究借助Coh-Metrix，从可读性、阅读量、词汇、句法以及衔接5个层面，对2012-2021年北京中考英语阅读理解命题素材进行量化分析，以期发现近十年北京中考英语阅读理解命题素材的文本难度特征。

三、研究设计

（一）研究问题

本研究通过量化分析，旨在回答以下两个研究问题：

1. 2012-2021年北京中考英语阅读理解命题素材的文本难度有何历时性特点？

2. 2012-2021年北京中考英语阅读理解各命题素材之间文本难度是否有显著性差异？

（二）研究对象

本研究选取2012-2021年北京中考英语阅读理解的命题素材为研究对象。由于近四年北京中考取消了五选五题型的设置，本研究并未统计2012-2017年五选五题型的命题文本，仅对2012-2021年北京中考英语阅读理解A篇、B篇、C篇、D篇以及阅读回答问题共计50篇命题文本进行量化分析。

（三）文本难度分析框架

本研究借鉴了黄丽燕和史碧冰（2020）的分析框架，运用Coh-Metrix从可读性、阅读量、词汇、句法和衔接五个层面共计27个指标对所选取的50篇命题素材进行分析，分析框架如表3.3.1所示：

可读性可以通过数值从整体上体现文本难度。其中，弗莱士易读度的取值范围为0-100，其数值越高，文本难度越低；Coh-Metrix二语可读度越高，文本难度越低（Graesser, et al., 2004）。Flesch（1948）对弗莱士易读度的值以及相对应的文本难度做出了清晰的界定（见表3.3.2），为文本难度的定义提供参考。

在阅读量上，本研究运用词汇数量以及句子数量两个指标对命题文本的阅读量进行分析。词汇数量、句子数量越多，阅读量越大，文本难度越大。

在词汇层面上，命题素材的词汇特点对其文本难度有直接的影响。命题素材所用词汇越复杂，其文本难度越高，即命题素材的平均词汇长度、词汇习得年龄、类符形符比越高，其文本难度越高；实词词频、所有词词频、词汇熟悉度、词汇具体性、词汇象性、词汇意义性越高，命题素材的文本难度越低（Graesser, et al., 2004；Graesser, et al., 2007）。

在句法层面上，句法的特征可以直接影响学生对文本的理解过程，从而影响命题素材的文本难度。从指标上看，命题素材的平均句子长度、名词短语密度文本、主要动词前的词汇数量越高，文本难度越高；相邻句句法相似度和所有句句法相似度越高，文本难度趋于降低（Graesser, et al., 2004；Graesser, et al., 2007）。

衔接在促进理解层面上起着重要作用，对于文本难度有直接的影响。从指标上看，连词（因果连接词指数、附加连接词指数、时间连接词指数）可以促进句子之间的连接，帮助读者理解文本，其指标越高，文本难度越低（Ryu, Jeon，2020）；在语义衔接（相邻句语义重叠、所有句语义重叠）上，语义重叠值越高，文本衔接性越好，文本难度越低（Graesser, et al., 2004）；指称衔接体现在相邻句逻辑重叠指标以及所有句逻辑重叠指标上，如果一篇文章的衔接值越高，其文本难度也随之变低，意味着这篇文章更易被理解（Graesser, et al., 2007）；在情景模式（因果衔接指标、目的衔接指标）上，文本的目的性和因果关系越强，文本难度越大，读者在阅读时需要的认知处理过程也就越多（Graesser, et al., 2004）。

（四）数据分析

基于文本难度分析框架，本研究首先运用Coh-Metrix将50篇阅读理解命题素材进行量化分析，并运用SPSS26对收集到的所有数据进行单因素组间方差分析，从而探究2012-2021年北京中考英语阅读理解文本有何历时性的文本难度特征。其次，为了解2012-2021年各年北京中考英语阅读理解各命题素材之间文本难度是否有明显差异，本研究将各命题素材的弗莱士易读度数值进行整理，运用Excel计算每年各语篇之间文本难度的标准差，并将标准差高于10的年份以折线图的形式进行呈现和分析，以期直观地呈现历年各命题素材之间的文本难度差异和变化。

四、研究结果与分析

（一）北京中考英语阅读理解命题素材文本难度历时性特点

1.可读性

在可读性方面，通过对命题素材的易读度进行单因素组间方差分析，发现2012-2021年北京中考英语阅读命题素材在弗莱士易读度（p=0.990）和Coh-Metrix二语可读度（p=0.967）方面均无明显差异。由此可见，2012-2021年北京中考英语阅读理解命题素材的文本难度从整体上看并无显著变化。

此外，根据Flesch（1948）对弗莱士易读度指数的解释，2012-2021年北京中考英语阅读理解命题素材的弗莱士易读度基本在69.73-75.78之间，文本难度基本处于“较易”范围（70-79）。

2.阅读量

在命题素材阅读量方面，单因素组间方差分析结果显示，2012-2021年北京中考阅读理解文本的难度在词汇数量（p=0.946）上无显著差异，但在句子数量上存在显著差异（p=0.000）。

如图4.1.2.1所示，2012-2017年命题素材的句子数量指标基本持平。2018年之后，句子数量呈现升高的趋势，2019年的指标达到巅峰，在此之后句子数量指标开始有下降趋势。从数据上看，2019年句子数量指标显著高于2012-2017年的指标，2018-2021年的句子数量无显著差异。总之，2012-2021年北京中考英语阅读命题素材在阅读量上从2018年开始有明显升高，在2019年达到顶峰，近两年阅读量开始有所下调，命题素材的文本难度也随之变化。

3.词汇

在词汇层面，单因素组间方差分析结果显示，命题素材的平均词汇长度（p=0.645）、实词词频（p=0.850）、所有词词频（p=0.262）、词汇习得年龄（p=0.958）、词汇熟悉度（p=0.742）、词汇具体性（p=0.770）、词汇象性（p=0.819）、词汇有意义性（p=0.531）、类符形符比（p=0.616）上均未存在显著差异。由此可见，词汇对2012-2021年北京中考阅读理解素材的文本难度并无显著影响。

4.句法

句法复杂度可以直接影响命题素材的文本难度。单因素组间方差分析结果显示，北京中考英语的阅读理解命题素材在名词短语密度（p=0.881）上未见显著差异，而在平均句子长度（p=0.011）、相邻句句法相似度（p=0.002）上存在显著差异。

由图4.1.4.1可以看出，2012-2021年北京中考英语阅读理解命题素材在平均句子长度和相邻句句法相似度两个指标上存在显著差异。其中，在平均句子长度上，从2015年起，命题素材的平均句子长度呈现出了明显的下降趋势，2020年之后指标稍有上升，但基本与2018年持平。从数据上看，2019年的平均句子长度也显著低于2015-2016年；在相邻句句法相似度上，2017年后，命题素材的句法相似度呈现出了显著的增长趋势，2020年之后相邻句的句法相似度开始降低。从指标上来看，2019年的句法相似度显著高于2015-2017年，2018年的句法相似度显著高于2015-2016年。

由于主要动词前词汇数量以及所有句句法相似度两个指标在方差齐性检验中并不成齐性，故采用Kruskal-Wallis检验进行进一步检验，结果发现命题素材在主要动词前词汇数量（p=0.079, df=9,H=15.474）无显著差异，而在所有句句法相似度（p=0.002，df=9，H=25.589）上存在显著差异，结果如表4.1.4.1所示：

从数值上看，在命题素材的所有句句法相似度上，2018年的句法相似度显著高于2012、2014、2015、2016、2017年，2019年的句法相似度显著高于2012-2017年，2020年的句法相似度显著高于2015年，2021年的句法相似度显著高于2015年，2012-2017年间句法相似度无显著差异，2018-2021年间句法相似度无显著差异。

综合这三个指标，2012-2021年的北京中考英语命题素材的文本难度受到句法的影响，在句法复杂度层面呈现出降低的趋势。其中，2019年的句法复杂度最低，近两年句法复杂度略有上升。

5.衔接

在衔接层面，单因素组间方差分析显示，2012-2021年北京中考英语阅读理解命题素材在因果连接词指数（p=0.756）、附加连接词指数（p=0.997）、时间连接词指数（p=0.574）、相邻句逻辑重叠指标（p=0.080）上均无显著差异，由于所有句逻辑重叠指标在方差齐性检验中并不成齐性，无法进行单因素组间方差分析，故采用Kruskal-Wallis检验对其进行进一步数据分析，结果发现并无显著差异。

2012-2021年北京中考英语命题素材在相邻句语义重叠（p=0.002）和所有句语义重叠（p=0.019）上存在显著差异，单因素组间方差分析结果如图4.1.5.1所示：

如图4.1.5.1所示，就相邻句语义重叠指标而言，从图形上看，2012-2020年无明显起伏，整体呈现一个轻微先升高再下降的趋势，但在2021年出现了一个明显升高的趋势；从数据上看，2021年的相邻句语义重叠显著高于2012、2017、2018、2019、2020年。就所有句语义重叠而言，从图形上看，2012-2020年无明显起伏，整体呈现一个下降的趋势，但在2021年出现了一个明显的升高趋势；从数据上看，2021年的所有句语义重叠显著高于2020年和2019年。

2012-2021年北京中考英语命题素材在因果衔接指标（p=0.037）和目的衔接指标（p=0.002）上同样存在显著差异，单因素组间方差分析结果如图4.1.5.2所示。在因果衔接指标上，2012-2021年所得数值呈现出了先升高、再降低、后显著升高、最后有所回落的变化过程；从数值上看，2019年的指标显著高于2012年以及2016年的指标；在目的衔接指标上，2012-2021年所得数值呈现出先升高、再降低、后显著升高、再有所回落、最后略微升高的变化过程；从数据上看，2019年的指标显著高于2012年、2015年以及2016年。

综合上述四个指标来看，2012-2021年北京中考英语阅读命题素材在衔接上并未造成明显的文本难度变化，仅在2019和2021年出现了显著的文本难度差异。

（二）北京中考英语阅读理解各命题素材之间文本难度差异

弗莱士易读度可以从整体上体现各语篇的难度，而标准差可以体现一组数据的离散程度。在本研究中，各年份的命题素材标准差越高，该年的5篇命题素材文本难度差异越大。表4.2.1显示历年各命题素材的弗莱士易读度指数以及各命题素材间的标准差。

从表4.2.1可以看出，2012、2014、2016、2017、2020年的5篇命题素材之间的弗莱士易读度标准差均小于10，即各命题素材之间的文本难度差异较小，其中2014年的文本难度差异最小，基本处于“标准”到“较易”范围内。而2013、2015、2018、2019年、2021年的5篇命题素材的弗莱士易读度标准差均高于10，即各命题素材之间的文本难度差异较大，其中2018年的文本难度差异最大（见图4.2.1）。

从图4.2.1可以看出，在命题素材有较明显差异的五年中，每一年的各命题素材文本难度差异特点也是不同的。2013年、2015年的A篇、B篇、C篇以及阅读回答问题相对比较简单，基本处于“较易”难度，而D篇的文本难度明显高于其它几篇，到了“较难”的难度层级，2015年甚至到了“难”的难度层级。2018年的B篇文本难度显著低于其它几篇命题素材，到了“非常易”的难度层级，而C篇的文本难度也明显高于其它的命题素材，居于“较难”的难度层级，其它如A篇、D篇以及阅读回答问题的文本难度较低，居于“较易”的难度层级，且这5篇命题素材的难度存在较大的波动。到了2019年和2021年，A篇以及阅读回答问题的命题素材的文本难度较低，基本处于“较易”的难度层级，B篇的文本难度显著低于其它文本，处于“非常易”的层级，C篇和D篇难度并未有特别大幅度的上升，且两篇基本持平，处于“标准”的难度层级内。

总之，历年的命题素材的文本难度并不呈规律性排列，部分年份命题素材的文本难度并没有很大的差距和区分，也未呈现出规律的增长或降低趋势。一般而言，C篇、D篇的文本难度相对较高，大多数年份会明显高于其他语篇，但近两年的C、D篇文本难度基本持平，并且与其它命题素材的文本难度区分度降低；A篇、B篇以及阅读回答问题的文本难度相对较低，通常B篇文本难度最低，基本处于“易”和“非常易”的难度层级。此外，有的年份，如2013年、2015年和2018年，会出现一篇命题素材的文本难度明显高于或低于其它命题素材，即命题素材难度变化波动较大的现象；而部分年份的5篇文本难度无特别明显的差异。

五、结果与讨论

本研究分别从整体的难度变化和各年的文本难度差异对2012-2021年北京中考英语命题素材的文本难度进行量化分析，基于上述分析得出以下两点结论。

首先，从整体上看，2012-2021年北京中考英语阅读理解命题素材的文本难度基本持平。通过进一步分析可以发现，在可读性层面，这十年间50篇命题素材的整体文本难度基本处于“较易”的层级；在词汇层面上并无显著的变化，在衔接层面上呈现出一些波动，表现在2019年的文本在衔接层面显著高于其它9年的命题素材，而2021年的命题素材因为语义重叠程度高在衔接层面显著低于其它年份。此外，2012-2021年阅读理解命题素材在阅读量、句法层面则有显著变化，主要表现在这十年间命题素材的阅读量有显著提升，句法复杂度有所下降，句法相似度有所提升。这些变化从整体上进行了“互补”，保持了命题素材文本难度的一致性。

其次，2012-2021年各年北京中考英语阅读理解各命题素材之间难度差异并不显著，且这五篇命题素材的排列在文本难度上呈现出无规律的变化。具体而言，大多数年份的5篇命题素材没有显著的文本难度差异，基本处于“标准”或“较易”的难度层级，文本难度较高的命题素材基本集中在C篇和D篇，A篇、B篇、阅读回答问题的命题素材相对简单。在命题素材的布置上，各年的5篇阅读命题素材并不是按照文本难度由易到难进行排列的，而是呈现出无规律的排布。

基于以上两点结论，本研究对中考英语阅读命题素材的选择提出两点建议：第一，为了保证中考英语阅读命题素材文本难度的稳定性，考试命题者在选择文本时要运用科学技术手段，对命题素材的各项指标进行综合全面的分析，并结合分析结果对文本进行改编，在提高阅读量的趋势下适当降低其它层面的难度；第二，北京中考英语阅读理解部分在部分年份存在个别命题素材文本难度过高或过低的现象。因此，在选择和排布命题素材时，命题者应先对各命题素材进行文本难度评估，避免出现极难或者极易的现象，再根据难度以先易后难的原则有规律地对命题素材进行排布，以保证考生有好的阅读体验。

六、结语

本研究运用Coh-Metrix综合分析了北京中考英语阅读理解命题素材的文本难度的特点，发现近10年北京中考英语阅读理解部分命题素材的文本难度基本持平，部分年份的个别命题素材存在文本难度过高或过低的现象。本研究对于中考英语阅读命题素材的选择以及历年难度一致性的保持具有参考价值，但由于条件受限，本文仅聚焦了北京中考英语阅读理解文本本身，并未与其他省市中考英语试卷进行横向对比，后续研究可以在此基础上进行深入分析，以促进中考英语阅读命题素材选择的科学性。

参考文献

［1］Chen, A. A critical evaluation of text difficulty development in ELT textbook series: A corpus-based approach using variability neighbor clustering［J］. System, 2016, 58: 64-81.

［2］Flesch, R. A new readability yardstick［J］. Journal of Applied Psychology, 1948, 3: 221-233.

［3］ Fulcher, G. Text difficulty and accessibility: reading formulae and expert judgement［J］. Pergamon, 1997, 25 (4): 497-513.

［4］Graesser, A. C., Jeon, M., Yan, Y. & Cai, Z. Discourse cohesion in text and tutorial dialogue［J］. Information Design Journal, 2007, 15 (3): 199-213.

［5］Graesser, A. C., McNamara, D. S., Louwerse, M. M. & Cai, Z. Coh-Metrix: Analysis of text on cohesion and language［J］. Behavior Research Methods, Instruments & Computers, 2004, 36 (2): 193-202.

［6］Green, A., Unaldi, A. & Weir, C. Empiricism versus connoisseurship: Establishing the appropriacy of texts in tests of academic reading［J］. Language Testing, 2010, 2: 191-211.

［7］Liao, L. A Comparability Study of Text Difficulty and Task Characteristics of Parallel Academic IELTS Reading Tests［J］. English Language Teaching, 2020, 13 (1): 31-42.

［8］Plakans, L. & Bilki, Z. Cohesion features in ESL reading: Comparing beginning, intermediate and advanced textbooks ［J］. Reading in a Foreign Language, 2016, 28 (1), 79-100.

［9］Ryu, J. & Jeon, M. An Analysis of Text Difficulty across Grades in Korean Middle School English Textbooks Using Coh-Metrix ［J］. The Journal of Asia TEFL, 2020, 17 (3): 921-936.

［10］陈安妮, 郭爱萍. 基于Coh-Metrix的大学英语教材难易度研究——以《新视野大学英语》第三版为例［J］. 教育理论与实践, 2019, 39(6).

［11］黄丽燕, 王嘉樱. 基于Python和Coh-Metrix高考英语“一年两考”阅读文本复杂度分析［J］. 外语测试与教学, 2020 (3).

［12］黄丽燕, 史碧冰. 加强我国英语中考命题工作的思路与方法［J］. 中小学外语教学, 2020, 43 (7).

［13］江进林. Coh-Metrix工具在外语教学与研究中的应用［J］. 中国外语, 2016 (5).

［14］江进林, 韩宝成. 基于Coh-Metrix的大学英语六级与托福、雅思阅读语篇难度研究［J］. 中国外语, 2018, 15 (3).

［15］陶百强. 高考英语命题文本研究与思考——以2018年高考英语全国卷为例［J］. 中国考试, 2019 (2).

A Study on the Text Difficulty of the Reading Materials in the Reading Comprehension Section of Beijing High School Entrance Examination

Ge Xingjie Zhao Lianjie

Abstract: The reading materials in proposition are the foundation of the reading tests and the text difficulty of the materials is a key factor that affects the quality of proposition. This study uses the natural language processing tool Coh-Metrix to quantitatively analyze the text difficulty of 50 reading materials in reading comprehension section of the 2012-2021 Beijing Senior High School Entrance Examination. The study finds out that the overall text difficulty of the English reading comprehension proposition materials in the Beijing Senior High School Entrance Examination is basically the same over the reading materials in 2012-2021, but there are significant differences in reading volume, syntax, and cohesion; There exists obvious differences on text difficulty in some years, and distribution of the reading materials is irregular on the text difficulty. This study provides empirical support and reference for the selection and regulation of English reading comprehension materials in the High School Entrance Examination.

Key words: text difficulty; reading material; High School Entrance Examination; reading test

（本文首次发表在《基础教育外语教学研究》2022年第4期）

2012年考研英语一难度(2012年考研英语一难度系数)