一篇200字不到的作文,机器人用几十秒时间找出了8处语法和用词错误。最近,在浙江外国语学院国际学院,来自俄罗斯、韩国、赞比亚等6个国家的11位外国留学生完成了一份特别的中文试卷,他们成为了全球首批用人工智能(AI)来阅卷的学生...

  一篇200字不到的作文,机器人用几十秒时间找出了8处语法和用词错误。最近,在浙江外国语学院国际学院,来自俄罗斯、韩国、赞比亚等6个国家的11位外国留学生完成了一份特别的中文试卷,他们成为了全球首批用 在中文语法错误自动诊断大赛上夺得冠军,我们就试着邀请这个‘AI老师’帮助外国留学生学中文。没想到得到了回应。”

  工程师透露,这款AI学习了几十万的中文语言体系,通过扫描仪读取试卷信息,使用OCR技术将其转换成文本,之后启动自然语言处理算法进行分析,并识别出错位类型和位置,最后批注在试卷上。整个过程大概只需约5秒。从目前的测试情况来看,“AI老师”在准确率和细致程度都是接近甚至超乎人类的水平。

  事实上,把AI应用到外国人学中文试卷批改上,是全球首例。11月24日,iDST在中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)三个level中全面夺得冠军。

  CGED是自然语言处理领域的权威赛事。比赛的背景是:学习中文的外国人数不断增加,由于中文的博大精深,外国友人在中文写作中会出现各种错误。主办方挑选了一些外国友人写的中文作文片段,希望参赛者用人工智能算法自动识别里面的语法语义错误。

  iDST自然语言处理首席科学家司罗说,中文语法诊断的挑战性在于,中文语言知识丰富、语法多样;人在判断一句话是否有错误的时候,会用到长期积累的知识体系(比如一句话是否通顺、两个词是否可以搭配、语义上是否成立等)。相比之下,比赛提供的训练数据非常有限,仅通过训练数据来识别错误是很困难的。


中国教育信息化在线订阅号二维码
中国教育信息化在线微信服务号