智能校对-人工智能专家正在攻克更具挑战性的要塞——自动语法错别字检查

编辑:pitaya02        日期:2020-12-15

对英语学习者而言,计算机自动语法错误检查作文技术已不再是新鲜事,全球人工智能专家正在攻克更具挑战性的要塞——中文作文语法错误检查。火龙果智能语法检查

十二月初,第六届中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)公布了最终成绩,作为第一支参赛队伍,有道 AI自然语言处理(NLP)团队斩获语法纠错Top3赛段冠军,并在其他两支赛段(语纠错Top1,错误定位)中名列前三位,标志着 AI AI在中文作文语法错误检查方面的又一重大进步。火龙果智能语法检查


(第一次参加网易有道 AI团队获得了一份令人惊叹的成绩)

目前, CGED竞赛已进入了第六个年头,竞赛方式是由电脑自动对外国人写的中文句子进行错别字检测和纠错,分为错别字检测、错别字位置、错别字类型、错别字纠正等6个环节。今年共有14个国内外团队参加,其中,科大讯飞、阿里、上海交大、南京大学、外研社、日本东京都立大学、台湾朝阳科技大学、新华社等名列前茅,成为前三甲的常客。火龙果智能语法检查


英文文法错误诊断:有道已实现产品全面落地

人工智能作文语法错误检查技术应用于英语学习,网易有道早已实现落地。

2020年中,网易有道将 AI作文语法错误检查功能正式上线网易有道词典 App,随后成功应用于有道初中英语精品班系统,用户反馈良好。

最近,网易推出了“有道写作”,将 AI文章的语法错误检查功能嵌入网易有道词典 App,扩展到网页浏览器、 Word插件、 PC词典等端口,以满足用户的多场景使用需求。

基于 Transformer体系结构的核心引擎,多年来在神经网络机器翻译任务上的数据积累和快速更新的深度学习技术,使用户的英语作文评分、评语和纠错能力得到提高,有效地满足了不同年龄英语学习者的自助学习需求。火龙果智能语法检查


中文版难英文:作文语法错误检查面临更大的技术障碍

与英文相比,中文语法纠错任务的研究相对较早,无论是任务本身的特点,还是与英文的数据积累都存在着较大的差异。火龙果智能语法检查


一是中文字符连写,传统的语义理解和分析方法基本上需要依靠分词等前置处理模块;二是文本错误会放大语言的歧义性,导致基础模块识别质量下降;三是中文语法与英文语法不同,具有更多的随意性和复杂性,难以用定义规则来处理。相对于英语语法纠错任务,比赛方所能提供的中文训练数据非常有限,因此直接利用较复杂的深度学习模型进行完整学习建模比较困难。

虽然有道 AI团队长期积累了智能修改错误的经验,但对技术团队来说,这项任务仍面临着不小的挑战。

通过一个小学生的作文片段来说明:

只有在积累了足够的语料之后,人工智能才能理解高复杂性的语法错误,进而作为产品功能投入使用。据网易首席科学家段亦涛介绍,网易有道多年来深耕教育和学习场景,在 OCR (光学字符识别)、 NMT (神经网络翻译)、语音识别技术等领域均取得了良好的技术落地成果,且对用户口碑和体验的评价一直不错。

机械语法错误检查的构思: Precision (精确度)更适合于工程实践

值得一提的是,本次比赛中,有道 AI团队在CorrectionTop3和CorrectionTop1综合指标(F1)分别获得第一名和第三名的情况下,相应的 Precision (准确率)明显高于其他队伍。对于用户体验来说,这在教学场景中更加重要。火龙果智能语法检查


(Precision数值对比图,CorrectionTop1)

(Precision数值对比图,CorrectionTop3)

竞赛综合指标F1将 Precision与 Recall (召回率)相结合,作为模型准确率和召回率的调和平均值。前一种是指参赛系统给出的所有修改片断中,正确修改片断的比例;后一种是指参赛系统给出所有需要正确修改片断的比例。

在 Precision中,有道绝对领先,这源于有道 AI写作助手的设计理念:错误的修改会误导用户进行错误的修改,极大地影响用户的体验。此外,在用户本身缺乏识别能力的商业场景中(例如:低龄儿童的教育业务),这一问题会进一步扩大。

所以 F0.5经常被用来衡量英文语法错误纠正任务(如CoNLL-2014和BEA-2019英文语法错误纠正任务)。这一指标的计算方法与F1指标相似,但与 Recall相比,它给予 Precision更高的权重。火龙果智能语法检查


网易有道在获得 CGED奖前,曾尝试过第七届 NLPCC “中文语法错误修正”分享任务大赛,力压5个全球著名的研究团队,包括阿里、北京大学等,斩获冠军。凭借技术优势的积累,K12业务的扩展,网易有道在语文写作修改领域的技术升级进展迅速。火龙果智能语法检查


当前,网易有道在产品矩阵中已经针对 CSL (以中文为第二语言)的学习者设计了不少课程和应用。段亦涛表示,除了为中文学习者设计学习工具外,未来网易有道还可以与中小学校合作,实现辅助教师语法错误检查作文等功能,进一步拓展有道 AI技术在K12商务领域的应用场景。


 火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。火龙果错别字检查

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代



智能写作-AI历史