2019年12月17日下午,浙江工商大学外语学院博士生导师李文中教授应邀到我院文科楼824学术厅开展了题为《语料库与R统计应用之数据准备与类型数据分析》的工作坊,此次工作坊为我院语言学系列学术讲座暨第六次广东省高校“英语教育与评价”教学团队研修活动,主持人为我院副院长徐曼菲副教授。
李文中教授
工作坊中,李文中教授以ETS托福写作语料库为数据来源、以R为数据处理和统计平台,围绕以下四个方面进行了详细的讲解和示范:1)语料库定性数据的提取和处理步骤;2)R的数据结构讲解及数据准备流程;3)定性数据的基本分析手段、可视化方法和解读技巧;4)变量分析的方法和CA对应分析的操作示范。
李文中教授首先以R自带的泰坦尼克号生还情况为基础,讲解了R的基本数据类型,数据结构和常用的表达方式,以及如何进行将定量数据转换成定性数据并进行可视化处理,深入浅出地讲解了R处理数据的流程。接着,李教授以ETS托福写作语料库为例,讲解了从语料到R的数据准备、数据分析的过程。
在场观众仔细聆听
最后,李文中教授重点提及了CA对应分析的优势:可以清楚看到各个定性变量之间的关系距离和强弱,能解释大部分的数据,还能弥补多变量分析仅能解释部分数据的不足。此外,李文中教授还分享了许多语料处理的软件、R统计需要用到的数据包、以及与R相关的各类书籍。
本次讲座让在场观众都获益颇丰,不仅对R语言的数据准备和分析方法有所了解,也对语料库定性数据的分析路径和解读有所启发。
作者/通讯员: 徐伟玲 |来源:外国语言文化学院 |编辑: 朱明琦