你的位置: 首页 > 英语口语学习

基于大型可比语料库的中国学者(科学家)学术英语现状研究

2023-01-06 11:15:10 | 人围观 | 评论:


2.语料加工
对语料进行了适用于不同目的的多种加工与标注。对全部文本进行了元信息标注和词类信息赋码,获得了pos(part of speech)tagged语料库。并对部分语料进行句法分析和语篇特征标注。
3.短语序列计算工具开发与数据库建设
开发了新一代的短语序列计算工具(new mi等),用于学术英语短语的自动识别、提取。我们综合多种计算技术,包括频数、内部联结力(in-ternal association)、边界熵(boundary entropy)等,突破了传统互联网信息只能计算二元序列的限制,实现了基于多种统计手段的短语序列提取方法,并研制开发了相应的系统。实验结果表明,该系统能够在普通计算机上支持千万词级规模的大型语料库运算,并能显著提高短语序列的提取质量。在此基础上,我们提取了大量的n元序、短语单位、常用型式,形成了丰富的学术英语数据资源。对学术英语研究、学术话语分析的方法论建设做了有益的建设性工作。
4.尝试开发了适用于学术英语研究的“局部语法”(local grammar)、语义序列(semantic sequence)等分析技术
形成了分析学术文本意义方式、话语策略、态度意义的新的分析框架和视角。对开辟新的研究方向具有一定的引领作用。
(二)重要观点
基于beijing care语料库,我们对中西学者论文的高频短语序列、共选形式、局部功能和局部语法特征进行了系统的跨文化群体、跨学科对比分析,主要发现包括以下三个方面。
1.局部功能
不同于传统研究所述语言系统层级上的抽象/泛化功能,局部功能是有限类别文本或局部语境下的具体话语行为。局部功能不直接相关于语言系统,而与局部文本环境下的语

言共选形式紧密相连。局部功能探索是将功能研究引向深入,增强了描述详尽性和解释详尽性。我们通过缜密检查高频词语共选形式,发现了中国学者论文的一系列局部功能,如概指名词(general nouns)形式的局部功能有“呈现当前研究”、“报道结果/发现”、“提出方法”、“评价方法”、“表述效应”、“时间/条件定位”等;动词模糊语序列的局部功能有“解释数据”、“表述声言”、“验证模型/理论”、“推理”、“转述”等。
2.局部语法
不同于传统语言学描述的通用语法,局部语法是关于有限类别文本或受限意义下语言使用规律描写的一条新路径;局部语法不直接相关于语言系统,而是对具体语境下意义/功能实现方式的结构化。我们建构了适用于学术话语研究的局部语法分析框架。如“评价局部语法”的构架包括:(1)评价形式(evaluative pattern);(2)功能范畴(functional category);(3)语义参量(semantic parameter);(4)局部语法形式(local grammar pattern);(5)特征性局部语法形式(characteristic local grammar pattern)。以此对比分析了中西法律学者的评价局部语法异同,发现中国学者的局部语法形式频数显著低于西方学者,且多联结于最高频的n v-link adj to-inf.形式,揭示其评价意义表达方式十分局限。两组学者局部语法形式中的语义参量有着明显差异:西方学者趋于评价与外部物质世界相关的命题与对象;中国学者更关注与自身经验密切相关的事物以及语内对象(discourse-internal object);等等。母语文化的认识论、传统修辞习惯影响、有限的二语英语水平制约是位于深层的制约因素。
3.话语策略
话语策略是成熟社团成员在论文中使用的有效构建知识、传播信息的方法和手段。我们基于动词模糊语序列的研究发现,中国学者常用四种学术话语策略:准确表述策略(accurate

presentation strategy)、共识策略(consensus-seeking strategy)、声言责任策略(claim commitment strategy)和介入策略(engagement strategy)。准确表述策略与论文的客观性知识紧密联系,用于方法描述、数据呈述、结果报道;声言责任策略紧密联系于数据解释和观点表述;共识策略和介入策略面向读者和话语社团,旨在与同行沟通,引导读者解读数据。四种策略交替使用、相辅相成,旨在构建合格专业知识、明确个人贡献且降低责任风险,以及赢得社团成员认可。
4.意义方式
对中西学者学术论文中高频it评价形式的对比研究表明,两组学者共享4个特征性it形式。但是,除it v-link adj fornto形式外,中国学者的其他形式频数均显著低于西方学者,表明他们表达主观态度意义的能力较弱。两个群体所用it形式的语义分布差异显著。中国学者尤其不善于评价事件或命题的重要性和似然性。中国学者趋于使用形式表达命题或事件的难易度和确定性意义,而西方学者趋于表达重要性和似然性意义。对n that-cl形式的对比研究表明,西方学者重视研究过程,包括观点分析及逻辑推理,而中国学者更重视研究结果。这些区别反映了两组学者“经常述说之事”不同、站位与价值观不同,亦即意义方式不同。
5.认识论与文化制约
认识论、母语文化、学科文化是学术语言使用的重要制约因素。中国学者的独特用法形式可追溯至母语文化认识论、传统修辞习惯、二语英语水平制约。跨学科对比分析则表明,学科认识论与学科文化是学术话语特征的底层制约。纯理型硬学科、应用型硬学科、纯理型软学科及应用型软学科论文中的分布数据和意义表达折射出各自典型的知识结构、知识发展与构建方式、研究客体的不同特征,等等。具体而言,软硬学科的对比:知识的结构特征(原子型vs整体型)、知识发展方式(累积型vs迭代型)、知识构建方式(实验vs论述)、研究客体(自然物体/规律vs社会现象/概念)等制约了作者的形式选择。如硬学科通过科学观察与实验构建知识,因而趋于使用it v-link adj to,以对特定的研究活动或方法做出评判;软学科主要依靠阐释与论述构建知识,故更倾向于使用it v-link adj that,从而易于评价命题信息。纯理学科侧重逻辑论证与理论分析,同样频繁使用it v-link adj that;应用学科强调对接现实需求,则更趋于使用itv-linkadjfornto。由此,认识论与学科文化制约着话语行为和意义方式,具有相同或相似认识论的学科往往具有相似的形式使用趋势。
三 成果的价值
该项目的研究成果具有较高的学术价值与应用价值。其学术和应用价值在于:(1)尝试性使用了“局部功能”和“局部语法”的概念和分析框架,从新的视角和层面探讨学术论文的意义方式、话语策略、话语行为及结构特征,发现了大量新的语言事实和语言形式。对以往的普通语法研究和一般功能研究形成互补。这应当是国内学界首个系统探索局部功能和局部语法的实证研究,有望引领、发展新的研究方向。(2)关于学术论文意义方式、话语策略、知识构建方式的探索都是本领域比较新颖的探索话题和分析角度,对(学术)话语分析下一步的发展走向具有启示和建设性作用。(3)该成果开发的学术英语短语序列计算与自动提取工具(new mi等)极大地提高了数据提取的准确率和召回率,对短语计算具有实用价值。(4)所进行的学术论文跨文化群体、跨学科对比研究及其数据发现对外语教学,尤其是学术英语写作教学提供有益反馈和参照,具有现实的指导意义。