Duolingo用AI和记忆力赛跑,加强沉浸式语言学习体验_上海市第一中学

2019-09-11 13:35:12 外语培训 122

智东西(公众号:zhidxcom)

编 | 韦世玮

导语:近日,Duolingo的AI研究人员对他们如何运用人工智能,来为用户制定虚拟化和个性化的语言课程进行了详细介绍。

智东西7月6日消息,最近,语言学习软件Duolingo的AI研究负责人Burr Settles,对他们如何运用人工智能为用户制定个性化的学习课程进行了详细介绍,主要包括数据跟踪、统计模型、技能人才和沉浸式体验四个方面。

Duolingo是一款跨平台应用,用户可以通过该平台游戏化和小规模的课程,学会阅读、倾听和说几十种语言,包括汉语、印地语和阿拉伯语,甚至像克林贡语这样的虚构方言。

目前,Duolingo在全球拥有3亿用户,并筹集了超过1亿美元的资金,市场估值约为7亿美元,其中知名支持者包括Alphabet的CapitalG和Kleiner Perkins。

近日,外媒VentureBeat在伦敦举行的人工智能峰会上,对Burr Settles进行了采访。Settles表示,Duolingo人工智能战略的核心是尽可能接近人与人之间的体验。

Duolingo用AI和记忆力赛跑,加强沉浸式语言学习体验_上海市第一中学

▲Burr Settles

一、尝试创建预测模型跟踪数据

如今,许多像Duolingo这样的公司已经利用智能手机的普及和无处不在的网络连接,为世界各地的用户们提供语言学习服务。

据市场研究公司的数据显示,2018年全球在线语言学习市场的规模达到了90亿美元,2026年有可能超过200亿美元。

在此背景下,Duolingo一直在投资人工智能和机器学习,做到像人类教师一样为每个人量身定制自动化课程。

Settles在美国卡耐基梅隆大学(Carnegie Mellon University)担任博士后研究科学家后,于2013年加入Duolingo,负责从前端到后端的所有工作。

在加入Duolingo不久后,Settles和团队就开始寻找改变Duolingo学习模型构建模块的方法,这些模型基于70年代的闪存卡调度算法。

Settles表示,这项工作的挑战之一,是那些利用人工智能进行实际教育的机构很少。但Duolingo拥有大量的学习数据,可以用来从头开发新的模型和算法。

Settles还表示,他接受这份工作的部分原因是数据量、数据类型和数据的唯一性。

他和团队一直用启发式方法,收集关于学生们做语言练习和练习时长的数据,并尝试创建预测模型来跟踪这些统计数据。

二、半衰期回归模型制定个性化课程

由于对用户数据统计和跟踪的需求,Duolingo一直在开发自己的统计和机器学习模型,并结合了像间隔重复的学习技术,以优化和提供个性化课程。

间隔重复的理论是,用户间隔重复短课比在短时间内填满相同的信息效果要更好。与此相关的是“滞后效应”,如果练习课之间的间隔次数逐渐增加,用户的学习效果将能进一步提高。

但是,系统自动提供语言学习课程的主要问题是,用户现有的语言知识、个人情况和性情差异很大,机器学习模型往往是二元的,难以考虑到个体的细微差别。

这就是Duolingo“半衰期回归”统计模型的来源,该模型能分析数百万语言学习用户的错误模式,以预测个人长期记忆中每个单词的“半衰期”。

在语言学习中,半衰期指人们脑中的词汇或语法知识。如果人们一天都没有练习新语言,那么它有50%的机会忘记这一课。

因此,“半衰期回归”就是系统深入一个人的大脑,弄清楚人们知道什么或不知道什么,并针对性地制定课程。

Settles发现,当他们将“半衰期回归”统计模型投入使用时,用户的参与度提高了12%。

另外,定位内容的方法很重要,例如,像人类教师一样考虑对学生受半衰期回归的影响。但内容本身也同样重要,因此Duolingoy也转向人工智能,帮助团队建立适合不同用户的内容课程。

对此,Settles表示:“英语中有数百万个单词,也许有10000个高频词,你教他们的顺序是什么?你怎么把它们串在一起?”于是他们建立了一套系统,以帮助内容创作者制定初级、中级和高级材料。

还有一个挑战是,尽管Duolingo只有40%的用户在学习英语,但公司用来训练人工智能系统的大部分教学数据,都是为英语开发的。

因此,Duolingo需要将它的系统移植到其他语言上,称为迁移学习(Transfer Learning)。

Duolingo用AI和记忆力赛跑,加强沉浸式语言学习体验_上海市第一中学

三、招揽AI+语言+认知科学技能人才

目前,尽管人才储备在缓慢增长,但AI技能人才依旧短缺,许多大型科技公司一直在努力收购有潜力的人工智能创企。