随着人工智能和大数据技术在语言服务领域的深度渗透,培养既精通语言又掌握数智技术的复合型人才成为外语类院校的新使命。上海外国语网络学院(以下简称“上外网院”)针对这一需求,将语料库建设作为连接语言教学与数智能力培养的关键枢纽,探索出一条“以用促建、建用结合”的创新路径。
上外网院首先明确了语料库构建的核心目标:服务于数智化语言人才的实践能力培养。传统语料库多侧重于语言研究,而上外网院构建的语料库则突出“教学-实训-应用”一体化特色。在创新路径上,学院采取了“多维聚合”与“动态迭代”的策略。所谓“多维聚合”,是指语料来源不局限于经典文本,而是广泛纳入跨境电商谈判、国际社交媒体评论、专业技术文档、多模态音视频转写文本等真实应用场景下的语言数据,确保语料与现实数智语言服务需求同步。而“动态迭代”则依托学院自身的在线教学平台,将学生在模拟项目、虚拟仿真实验中的语言产出,经脱敏和标注后,合规地反哺至语料库,使其成为一个持续生长、充满活力的“活体”资源池。
在技术路径上,学院构建了人机协同的标注体系。基础性的词性、句法标注由算法初步完成,而涉及文化内涵、修辞策略、情感倾向、行业术语等深层语言知识的标注,则由教师带领学生以项目制形式完成。这一过程本身就成为学生理解语言细微差异、掌握语料处理工具(如Python、正则表达式、标注软件)的实训课堂。语料库因此不再是静态的“藏品”,而是动态的“教具”和“练兵场”。
在实践应用层面,该语料库深度融入教学与实训环节。第一,驱动课程内容改革。例如,《商务笔译》课程基于真实的跨境电商纠纷调解语料库设计案例分析;《计算语言学导论》课程直接利用库中已标注语料讲解自然语言处理模型原理。第二,支撑学生创新实践。学院设立“语料库赋能数智创新”项目,学生团队利用该语料库训练简单的聊天机器人、开发垂直领域文本分类工具,或进行特定类型的舆情分析,将语言学知识与数据分析、算法应用能力有机结合。第三,反哺区域语言服务。学院与相关企业合作,利用脱敏后的语料资源,共同开发定制化的术语管理工具和机器翻译后编辑方案,使人才培养成果直接服务于产业需求。
上外网院的实践表明,面向数智人才培养的语料库,其构建逻辑已从“资源储备”转向“能力孵化平台”。它通过整合真实应用场景、融入人机协同标注、贯通教学实训流程,成功将语料库这一传统语言学工具,转变为锻造学生语言数据处理、智能语言工具应用及跨文化数智解决方案设计能力的核心基础设施。这一创新路径不仅提升了语言人才的数智素养,也为外语学科的数字化转型提供了可操作的实践范例。