社会学研究方法,社会学研究方法论有哪些
【刊载信息】周炫余,陈丽,郭玉娟,郑勤华,李璇. 2022. 数量和质量并重的社会交互网络构建方法创新及验证研究[J].中国远程教育(9):61-68.
【摘要】学习者交互形成的社会网络是联通主义学习形成的重要网络,但传统的社会网络构建方法仅考虑学习者之间交互的数量,未体现交互质量,对于联通主义学习的解释度存在局限,因而迫切需要创新研究方法。本研究从创新方法的视角,提出数量与质量并重的社会交互网络构建方法,以国内首门cMOOC为研究情境,实际应用了该方法,并基于等距时间切片分别从整体网络、子群网络、个体学习者三个层面挖掘社会网络特征。结果表明:①质量与数量并重的学习者社会交互网络是多中心、自组织的复杂网络,更能体现学习者之间交互的紧密程度;②社会网络存在多个凝聚子群,子群内学习者持续的交互有利于深层次交互的生成;③学习者地位在一定程度上可以预测学习者学习是否成功,且学习者的交互质量与数量相互促进。本研究创新性地提出质量和数量并重的社会交互网络构建方法,发展了社会网络分析方法,为进一步揭示在线学习规律提供了方法借鉴。
【关键词】联通主义;联通型慕课;学习者交互;社会网络;社会交互网络;子群网络;教学交互;学习规律
一、
问题提出
教学交互是联通主义学习的核心,也是其取得成功的关键。连接的建立和网络的形成都依赖于交互的开展,交互不仅促进人与人之间的连接,也能提升人与内容之间的连接(王志军, 等, 2014)。交互的过程就是学习的过程,社会网络是联通主义学习者交互形成的重要网络(Siemens, 2005; Siemens, 2011)。为促进在线教育中深层次学习的发生,实现高质量的学习,挖掘社会网络的特征与规律尤为必要。
交互本质上可以从交互数量和交互质量两个方面进行分析(郑勤华, 等, 2016)。目前国内外关于社会网络的构建与分析大多通过人为标注学习者之间的交互关系,形成邻接表和邻接矩阵,将其直接导入已有的社会网络分析软件(如Gephi、UCINET、NetDraw等)从而绘制社会网络(徐亚倩, 等, 2019; 郭玉娟, 等, 2020; 王慧敏, 等, 2019; 杨业宏, 等, 2020; 田浩, 等, 2020)。上述方法能够在一定程度上探究联通主义学习者外部社会网络规律,但仅考虑了学习者之间交互的数量,忽视了对交互内容质量的分析,缺失对交互数量和交互质量的综合探讨,因而对联通主义学习规律的解释度存在局限,迫切需要创新研究方法。
基于此,本研究从创新方法的视角出发,以cMOOC“互联网+教育:理论与实践的对话”为研究情境,试图提出一种数量与质量并重的社会交互网络构建方法,并对联通主义学习规律进行探究。研究问题主要包括:①如何构建联通主义学习中数量和质量并重的社会交互网络?②运用数量和质量并重的社会交互网络分析方法,学习者的社会网络在宏观层面、中观层面和微观层面上分别具有哪些新特征?③相较于传统静态网络分析方法,联通主义学习者动态的社会交互网络又具有哪些特征与规律?
二、
数量与质量并重的社会交互网络构建方法
数量与质量并重的社会交互网络构建方法可以分为数据采集和预处理、权重融合计算、整体社会网络构建和子群挖掘三个子模块。数据采集主要根据交互规则从cMOOC后台获取学习者交互数据,分别用于训练交互质量自评定模型和构建社会网络。数据预处理主要包括对原始数据的清洗和整理,便于后续模型的训练和社会网络的构建。权重融合计算模块主要是通过加权公式对学习者交互数量和质量进行融合计算。其中,学习者的交互数量利用交互行为数据统计得到,交互质量通过训练科学合理的交互内容质量自评定模型获取。而交互内容质量自评定模型由时序模型和深度学习文本分类模型构成,利用此模型可以自动判别出学习者交互文本的交互层级属于“操作交互”“寻径交互”“意会交互”“创新交互”四类中的哪一类。得到权重后,根据学习者和交互的权重构建以学习者为节点、含有权重的交互为边的社会网络,并在社会网络的基础上利用Louvain算法挖掘子群网络,具体构建流程图如图1所示。
图1 数量与质量并重的cMOOC学习者社会网络构建流程图
(一)数据采集和预处理
研究数据来源于cMOOC后台学习者交互数据。研究者从后台选取两期课程数据,一期作为交互质量自评定模型的训练数据,另一期作为社会网络构建数据。对模型训练数据的预处理主要包括学习者交互文本数据的清洗和增强。数据清洗主要为删除文本中无关符号和链接等,数据不足时使用数据增强技术增加数据量。构建网络数据的预处理主要包括删除无关数据和整理数据格式。整理网络构建数据具体流程如下:首先将学习者交互总表、学习者发布资源表、学习者评论表、学习者回帖表、话题表五个表中的数据导入SQL Server数据库,然后利用总表中的post_id、comment_id、reply_id、topic_id与各分表中id对应,获得学习者交互的具体内容,最终当交互者与被交互者相同时,利用文档中未出现符号将其交互的内容合并,以便于后期计算交互数量。
(二)社会网络边的权重
为使得社会网络更能够表现出交互者之间交互的紧密程度,社会网络边的权重考虑交互数量和交互内容质量两个部分。交互数量利用统计法进行统计,交互内容质量则利用交互质量自评定模型自动判断其交互水平层级。交互内容质量判定的理论基础来源于基于认知参与度的联通主义教学交互分层模型(简称“CIE模型”)(Wang, Anderson, Chen, & Barbera, 2017; 王志军, 等, 2016)。CIE模型将教学交互分为操作交互、寻径交互、意会交互和创生交互四层,四层交互层级体现学习者的交互水平依次上升。交互水平的判断过程可以看作对文本进行分类的过程,由于文本长度相差过大会大大影响文本分类的效果,因此,根据课程中第二期交互文本数据长度分布情况和自然语言处理文本划分规则,研究以50字为阈值,大于50字判定为长文本,小于50字判定为短文本。短文本采用TextCNN模型,长文本选择FastText模型进行训练,两种模型统称为“交互质量自评定模型”。故重新定义社会网络中节点与节点之间的权重关系计算方法如公式(1)所示:
定义节点与节点的亲密度(刘瑶, 等, 2015)如公式(2)所示:
定义节点与节点交互的质量如公式(3)所示:
式中:α为常数,范围为0~1;ki表示节点i的度,kj表示节点j的度;kij为节点i与节点j之间的交互的次数;n为交互层次级别,在研究中为4,表示4种交互层级;根据不同交互层级生成的文本质量不同,设置f1∶f2∶f3∶f4 =1∶2∶3∶4;xnij表示节点i与节点j之间第n个交互层级文本的数目。
(三)社会网络构建和子群挖掘
社会网络构建主要分为网络节点的选取以及节点之间边的权重设定。选取学习参与者作为网络节点,统计学习者之间交互的次数,通过训练好的交互质量自评定模型得到交互内容质量判定的结果,并利用定义的公式(1)计算节点与节点之间边的权重。结合上述节点和边的权重,构建最终的社会网络。
构建完社会网络后,研究采用Louvain算法(Blondel, Guillaume, Lambiotte, & Lefebvre, 2008)在整体网络中挖掘子群。Louvain算法通过增加节点或删除节点观察子群的模块度变化从而挖掘子群,并利用最终网络的模块度来度量子群的好坏。模块度Q是节点之间的权重与随机情况下的权重之差,计算公式如(4)所示。一般来说,模块度Q值在0.3~0.7表明效果较好(Newman,2006)。
式中:Aij表示节点i和节点j之间边的权重;表示所有与节点i相连的边的权重之和;ci表示节点i所属的子群;表示所有边的权重之和。
三、
数据分析与发现
(一)研究数据
研究数据来自于cMOOC “互联网+教育:理论与实践的对话”(课程网址:https://cmooc.bnu.edu.cn/)。课程迄今共开设五期,每期课程开展时长约两个月,期间学习者围绕特定主题通过撰写博文、论坛发帖等进行深入交流。本研究选取第五期五个主题的学习者交互数据作为研究数据。数据经过预处理后最终如表1所示,包含节点1、节点2、交互内容三列的数据集。
表1 学习者交互关系与内容汇总表(举例)
注:*为特殊符号,用于多次交互文本之间的连接。
(二)试验分析结果
1. 宏观层面:整体社会网络具有小世界、多中心、动态发展的特征,属于复杂网络
研究主要基于cMOOC学习者数据。由于课程引导者和课程促进者在学习者交互中主要起引导作用,为更好地研究学习者社会网络的普适特点,本研究剔除掉课程引导者和课程促进者,采用深度学习方法构建数量和质量融合加权的学习者整体社会网络,如图2所示。其中网络节点大小依据节点的中心度设置,节点上的标签为学习者id,边的粗细由学习者之间的交互次数决定,边的颜色则依据交互数量和质量融合的权重w(范围为0~5)划分为四个等级,从高到低依次为深黑(w>2)、中黑(1.5
图2 学习者整体社会网络图(去除度为5以下的节点)
整体社会网络由107个节点、267条边构成,即第5期课程共有107名学习者参与博客撰写、论坛讨论等,建立了267条连接;将权重归一化后,计算社会网络密度为0.047,表明网络仅有4.7%的连接率;同时算得网络的平均路径长度为3.15,平均聚类系数为0.21,计算同等规模的随机网络15次,算得平均路径长度为3.01,平均聚类系数为0.042,可以发现整体社会网络的平均路径长度小于随机网络的平均路径,平均聚类系数远远大于随机网络,说明数量和质量融合加权的学习者整体社会网络表现出“小世界”特性。
进一步分析整体社会网络发现,交互数量多且交互质量高的学习者可能会形成闭环结构,如以深黑为连边的学习者5579、2409、797与以中黑为连边的学习者5931、5928、5919都各自形成了闭环,各自闭环中的连边颜色表明他们之间的联通度较高,能够促进对方交互水平的发展,同时也说明闭环中学习者的交互质量都较高,在社会网络中都处于重要地位。由图2可知,未形成闭环的id为3201和1866等多个学习者的节点都较大,其中心度都比较高,表明这些学习者也都属于社会网络的核心节点,处于整个网络中较高的地位,在信息交流中发挥着重要的作用。因此,交互数量和质量融合加权的学习者整体社会网络表现出“多中心”特性。
由于cMOOC主题学习时每个主题之间会相互影响,不便于探究主题与主题之间的变化,因此在探究不同时间段学习者所形成的社会网络的变化时,研究只选取其中一个主题进行探究。同时,分析第五期数据可知,主题三学习时间为一周且该主题的交互数据最为完备,因此研究选取主题三数据探究网络的动态变化规律。
研究按照时间切片将时长为一周的主题三平均分成前期和后期两部分,将前期和后期形成的学习者交互网络的整体网络进行对比,具体如图3所示。主题三后期形成的学习者社会网络中的节点增多,同时社会网络的连边次数也在增加,表明加入联通的学习者数量在不断增多,学习者之间的交互范围在不断地扩大,网络连边的粗细变化说明学习者之间的交互次数也在不断提升。经研究发现,原本处于中心地位的学习者(如id为5919、5579、797等学习者)在后期学习中仍处于中心地位,同时在交互的过程中也会有新的学习者处于中心地位,如id为5696、4475的学习者等。这表明在社会网络中没有绝对的中心节点存在,即任何一位学习者都可以通过主动与其他学习者发生交互并联通,从而在社会网络中实现由边缘节点向中心节点转变。因此,网络中节点数量、连边次数、节点地位等属性的不断变化,表明学习者社会网络处于动态发展的状态。
图3 主题三学习者网络发展对比图
2.中观层面:学习者网络存在着多个凝聚子群,且持续的交互有利于深层次交互的生成
整体网络的分析在于了解课程中学习者整体交互情况,便于对课程的总体情况进行评价;中观层面上的子群分析能够更加深入探究学习者内的小团体,更有利于从可视化、中心性角度发现cMOOC整体社会网络“自组织”“多中心”的特征(熊潞颖, 等, 2019)。因此,研究基于交互数据对整体网络进行子群挖掘分析,为进一步说明质量和数量融合加权构建子群的有效性,将其与基于交互数量构建的子群图进行比对。借助matplotlib模块绘制子群图,同时去除度为5及以下的节点,如图4所示。图4左边是交互数量和质量融合加权构建的子群图,其模块度Q值为0.39,共划分为15个子群;图4右边是基于交互数量构建的子群图,其模块度Q值为0.34,共划分成13个子群。根据对比可知,数量和质量融合的方法相较于传统方法能够在保证子群划分的质量(模块度较好)的情况下更加精确地划分学习者子群,由此验证了此种方法的可行性。
图4 子群对比图
通过绘制子群图可以发现子群间存在“桥梁”节点,表明整体社会网络具有“自组织”特征。
从交互数量和质量融合加权构建的学习者子群图4和划分的子群成员分布表2可知,尽管学习者在社会网络内部划分为多个不同子群,主要的信息交流也在子群内体现,但是在子群与子群间仍有几个节点之间的距离小于其对子群内其他成员的距离,如处于子群5的节点5530和处于子群8的节点5928与899,研究将这些学习者看作两个子群间的“桥梁”。通过这些学习者可以将两个子群连接起来,促进两个子群间的相互交流与信息沟通。因此,学习者可以自由选择其他学习者进行交流,并不因为子群的存在而拘束于子群内部,整体社会网络呈现“自组织”特征。
表2 子群成员表
将整体网络的中心性属性应用于子群研究,从子群中心性角度验证了整体社会网络“多中心”“自组织”的特点以及cMOOC开放自由的特性。
中心度一般用于描述学习者的中心性,而中心势一般用于描绘整体网络的中心性。研究将每个子群看成一个单位,剔除成员较少的子群后,计算其度数中心势、中间中心势、接近中心势,可以发现社会网络具有“多中心”特性,体现出cMOOC具有开放自由的特点。
度数中心势能够表现网络的中心趋势,当网络的度数中心势较高时,表示网络整体中心性大。计算各子群度数中心势如表3所示,可以看出子群2、子群5、子群12的度数中心势都在0.5以上,说明这三个子群整体的交互次数多,呈现出明显的集中趋势。三个子群也处于整个学习者整体社会网络的核心位置,表现为子群成员积极参与论坛、博客等互动交流,主动与他人建立连接。结合图3可以发现,每个子群都没有明显的中心点。如id号为5579、2409、1866、797的学习者,他们在同一个子群内,与子群间成员的交流比较多,都处于整个网络的中心度较高位置。总的来说,整个网络并未出现明显的围绕某一位学习者或某一个子群聚集的情况,而是子群内部有多位中心成员,子群与子群间的发展也不分伯仲,表明学习者整体社会网络具有“多中心”的特点。
表3 子群的中心性
接近中心势表示子群内成员联系的紧密程度。从表3可以看出:接近中心势最高的两个子群分别为子群12和子群2,说明两个子群的学习者自由程度较高;这几个子群成员之间直接的交流也较少,可能主要是通过子群中的核心成员进行信息交流;子群9、子群8的接近中心势较低,说明子群中全体成员对于学习者整体社会网络而言处于较核心的位置。同时可以发现,各子群的中间中心势总体较低,接近中心势总体较高,说明大部分学习者学习较为独立,很少存在过于依赖其他学习者的情况。从子群的角度来看,学习者的整体社会网络呈现出“自组织”的特点。
中间中心势表示子群在整体网络中的重要程度,即某一子群对其他子群的影响程度。中间中心势越高,说明此子群成员与其他子群成员的差距越大。计算各个子群的中间中心势如表3的第三列所示,可以发现子群的中间中心势整体偏低,其中最高的子群6也仅为0.192,表明子群对其他子群的控制能力较低,进一步说明子群间成员、子群与子群之间的交互自由度也较大,表现为学习者可以自由参与博客、论坛等讨论,并不会受到对方身份等因素的限制,验证了cMOOC的开放自由特性。
对子群进行时间切片分析,利用网络颜色、粗细的变化可以发现持续的交互有利于深层次交互的生成。
基于时间切片得到的学习者子群网络发展对比图如图5所示。观察图5发现,学习者子群连边增多、变粗,甚至变成另一种颜色,这表明子群内部联系不断增强,交互质量不断提升,也进一步说明子群是动态发展的,并不是一成不变的,且一般来说会发展得越来越复杂。如子群6,在前期只有两个学习者5508和116,后期增加至6个学习者,在发展的过程中学习者116也从与5508平等的地位发展至后期子群的中心。由图5也可以发现,子群不仅会增加节点,也会变更节点,比如前期节点5969与节点5977在同一个子群中,但是在主题二结束时两个节点并不处于同一个子群中,这是由于部分学习者在后期的交互中与其他学习者联系密切,因此被划分到另一个子群中。由子群连边和节点的变化可知,学习者持续的交互有利于深层次交互的生成。
图5 主题二学习者子群网络发展对比图
3. 微观层面:学习者地位在一定程度上可以预测学习效果,且学习者交互的数量与质量相互促进、呈正相关
学习者个人交互的权重为网络中所有与其节点相连的边的权重之和。观察学习者交互的权重分布,将学习者按照1∶1∶3的比例分为核心联通者、次要联通者、普通联通者三类。最终在107名学习者中,21名为核心联通者,22名为次要联通者,64名为普通联通者。
分析学习者的网络地位以及对应的学习效果。发现其地位在一定程度上可以预测学习效果。同时根据学习者所获证书类型,发现数量、质量融合的社会网络的构建更有利于判定学习者地位。
该cMOOC的学习成效有一定的评判标准,并会在每期课程结束后对相应的学习者颁发不同的证书。第5期课程学习者共颁发7种证书,分别是互动型学习者、创新型学习者、问题解决者、优秀问题解决者、优秀协作小组、联通主义学习者、创新型联通主义学习者。本研究主要以学习者个人为分析对象,不讨论小组情况。课程结束时共有20位学习者获得证书,具体证书类型以及学习者地位对应关系如表4所示。从表4中可以发现,获得证书的大部分学习者属于核心联通者,少部分属于次要联通者和普通联通者,说明学习者交互融合交互质量与数量的社会网络地位和角色可以在一定程度上预测学习是否成功,并且联通学习者在社会网络中确实起到核心的联通作用。同时也可以发现,创新型联通主义学习者、创新型学习者皆属于核心联通者,获得创新型证书表明学习者交互质量较高,也进一步说明将数量与质量融合可以很好地表示学习者的学习效果。
表4 获得证书的学习者社会网络地位
分析学习者交互的数量与交互的质量,发现不同学习者建立的管道不同,且交互的数量与交互的质量呈正相关。
学习者之间进行交互其实就是在建立学习者之间的管道,为探究交互的数量与质量之间的关系,利用公式(3)计算学习者与学习者交互的质量,最终统计学习者交互频次与学习者交互质量,排名前10的学习者如表5、表6所示。
表5 交互质量排名前10的学习者
表6 交互频次排名前10的学习者
从表5、表6中可以看出,交互质量排名前10的学习者集合与交互频次排名前10的学习者集合基本相似,表明交互频次高的人其交互质量也较高,这些学习者能够主动与其他学习者联系,发表较高质量的观点,与学习者整体网络图(图2)所描述的现象基本一致,即学习者交互的次数与交互质量是相互促进的。在后续研究中发现,在数量、质量排名都较前的学习者更容易获得证书,这在一定程度上也验证了证书的标准性。
四、
总结与展望
(一)研究总结
基于国内首门cMOOC学习者的交互数据,本研究构建了数量与质量并重的学习者社会交互网络,从实验结果上来看,在交互次数的基础上引入交互质量,一方面能够更加直观地通过观察整体网络中节点的地位预测学习者的学习效果,另一方面也能够在保证子群划分的结构较为合理的情况下更加准确地发现整体社会网络中隐含的规模更小的子群,这验证了数量与质量融合加权构建学习者社会网络方法的可行性和有效性。
本研究从宏观、中观、微观三个层面对学习者社会网络特征进行分析,并突破传统静态网络分析方法,采用等距时间切片对动态的社会网络特征进行了分析。研究发现:从宏观角度看,数量与质量并重的社会网络更能体现学习者之间交互的紧密程度,该网络具有多中心、自组织的特征,且始终处于动态发展的状态;从中观角度看,学习者社会网络具有多个凝聚子群,连续多次的交互有利于深层次交互的生成;从微观角度看,学习者地位与学习者学习效果、学习者所建立的交互数量与质量呈正相关。
(二)未来展望
教学交互是网络学习的关键,也是联通主义学习的关键和重点。本研究提出了数量与质量并重的社会交互网络构建方法,在已有社会网络研究中仅考虑交互数量的基础上引入文本分析的方法。该方法打破原有方法仅考虑交互次数的局限,发展了社会网络分析方法,有利于从语义的角度进一步揭示在线学习规律,为认识联通主义理论和挖掘网络时代教与学规律提供了启示。未来考虑将该方法运用到更多样、更复杂的联通主义学习情境中,进一步修订、丰富和发展该方法。同时,基于数量与质量并重的社会交互网络方法,开发联通主义学习者自动化评价工具,为真实情境中的学习评价提供参考。
参考文献
郭玉娟,陈丽,许玲,高欣峰. 2020. 联通主义学习中学习者社会网络特征研究[J]. 中国远程教育(2):32-39,67,76-77.
刘瑶,康晓慧,高红,等. 2015. 基于节点亲密度和度的社会网络社团发现方法[J]. 计算机研究与发展,52(10):2363-2372.
田浩,陈丽,黄洛颖,等. 2020. cMOOC学习者知识流动特征与交互水平关系研究[J]. 中国远程教育(8):15-24,76.
王慧敏,陈丽. 2019. cMOOC微信群社会网络特征及其对学习者认知发展的影响[J]. 中国远程教育(11):15-23,92.
王志军,陈丽. 2014. 联通主义学习理论及其最新进展[J]. 开放教育研究,20(5):11-28.
王志军,陈丽. 2016. cMOOCs中教学交互模式和方式研究[J]. 中国电化教育(2):49-57.
熊潞颖,郭幸君,蒋琪,郑勤华. 2019. 基于在线行为数据对学习者学业拖延的研究[J]. 电化教育研究,40(12):29-35,50.
徐亚倩,陈丽. 2019. 联通主义学习中个体网络地位与其概念网络特征的关系探究——基于cMOOC第1期课程部分交互内容的分析[J]. 中国远程教育(10):9-19.
杨业宏,张婧婧,郑瑞昕. 2020. 联通主义学习中社会交互与话题交互的网络化特征[J]. 现代远距离教育(1):36-45.
郑勤华,李秋劼,陈丽. 2016. MOOCs中学习者论坛交互中心度与交互质量的关系实证研究[J]. 中国电化教育(2):58-63.
Blondel,V. D., Guillaume, J. L., Lambiotte, R., & Lefebvre, E. (2008). Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, 2008(10):2-8.
Newman, M. E. J. (2006). Modularity and Community Structure in Networks. Proceedings of the National Academy of Sciences of the United States of America, 103(23):8577-8582.
Siemens, G. (2005). Connectivism: A Learning Theory for the Digital Age. Instructional technology & distance learning, 2(1): 3-10.
Siemens, G. (2011). Orientation: Sensemaking and wayfinding in complex distributed online information environments. PhD diss., University of Aberdeen.
Wang, Z. J., Anderson, T., Chen, L., & Barbera,E. (2017). Interaction pattern analysis in cMOOCs based on the connectivist interaction and engagement framework. British Journal of Educational Technology, 48(2): 683-699.
作者简介
周炫余,博士,副教授,硕士生导师,北京师范大学远程教育研究中心博士后,湖南师范大学基础教育大数据研究与应用重点实验室(410006)。
陈丽,博士,教授,博士生导师,本文通讯作者,北京师范大学远程教育研究中心(100875)。
郭玉娟,博士研究生,北京师范大学远程教育研究中心(100875)。
郑勤华,博士,教授,博士生导师,北京师范大学远程教育研究中心(100875)。
李璇,硕士研究生,湖南师范大学基础教育大数据研究与应用重点实验室(410006)。
基金项目:本文系国家自然科学基金委员会管理学部重点课题“‘互联网+’时代的教育改革与创新管理研究”(课题编号:71834002)的研究成果。
责任编辑:郝丹
2022年第9期目次
社会学研究方法(社会学研究方法论有哪些)