阿里AI模型摘下世界大赛桂冠 阅读理解能力测试刷新世界纪录

近日,在斯坦福等机构和机构发起的“多轮对话阅读理解评估”(QuAC)中,阿里巴巴的人工智能模型“TransBERT”击败了全球对手,不仅赢得了评冠,还刷新了该项目。世界测试记录。这也意味着阿里巴巴AI所代表的机器阅读理解能力向前迈进了一步。

QuAC(多重会话阅读理解评估)由华盛顿大学,斯坦福大学和艾伦人工智能研究所等研究机构共同赞助,也称为SQUAD(文本理解挑战)和CoQA(对话机阅读理解)挑战)。世界级的阅读理解比赛吸引了来自世界各地的顶尖科学家和技术团队的参与。本次比赛的难点在于参与阅读更长轮对话所需的AI模型,标题也有“引用”和“省略”,甚至原文中也存在模糊问题没有相应的答案,这需要AI模型必须具有像人类一样“连接上下文”的能力,并测试关联和推测的能力。

阿里巴巴的智能服务业务单元算法专家季峰表示,在这次测试中,“他”和“他们”有很多第三人称参考,要求机器进行主动关联,做出综合判断;在原始文本中找不到开放式问题。测试是,除了基于文本的阅读理解之外,AI模型还将日常储备数据库称为思考能力,几乎无限接近人类思维模型。

组织者还认为,基于对话的多语言阅读理解是人工智能对话领域中最复杂,最自然的语言理解技术,它接近人类日常交际的真实场景。

img_pic_1562054386_0.png

图:评估案例接近人类日常交流的真实场景,并高度测试人工智能模型的关联和推测能力

通过自主开发的“TransBERT”AI模型,阿里巴巴智能服务部和计算平台部加入浙江大学人工智能研究所,打败国内外竞争对手,并以三项指标总分144.1获得第一次测试。最高记录,其中两个显着超过第二个。

img_pic_1562054386_1.png

图:“TransBERT”AI模型位居榜首,三项指标总分为144.1,两项指标显着超过第二名

人工智能技术面临多轮对话,“参考”,“遗漏”和“模糊语义问题”的场景长期以来不仅发生在测试环境中,而且还发生在客户服务机器人的日常应用中。 “阿里小米”在阿里巴巴平台上。在这种情况下,这种复杂的阅读理解场景长期以来一直是AI机器人发挥重要作用的“种族”。

在阿里巴巴早些时候发布的视频中,阿里小米已经能够以言语和声音的形式与消费者进行多轮复杂的对话。问题包括售前和售后服务,常见中断,引用,忽略,转换主题和其他现实。

这也是阿里巴巴人工智能技术与学术竞争对手之间的最大区别。通过Ali Xiaomi系列产品的长期实际应用,阿里AI模型得到了完善和打破。它的技术能力基于现实场景,侧重于与人类对话的真相。因此,在QuAC等测试中,交互式体验能够达到人类对话的水平。

img_pic_1562054386_2.png

图:基于人工智能客户服务小米产品现实服务场景的阿里AI模型技术能力

这不是阿里巴巴人工智能技术首次打破机读数领域的世界纪录。在斯坦福大学于2018年初发起的机器可读领域的SQUAD(文本理解挑战)中,阿里巴巴的智能服务部门凭借Ari Dharma赢得了冠军,实现了人工智能首次超越人类的阅读能力。在2019年初,阿里小米因其在物流和智能助手方面的出色表现被选为“世界十大突破技术”之一。他被认为是AI助手伟大演变的代表。

在人工智能的推动下,客户服务行业也在经历快速升级迭代。 2018年,阿里小米共进行了14亿次对话,为4.9亿消费者提供服务。基于实际场景的算法技术不断改进阿里小米所代表的智能客户服务,以前所未有的速度和智能解决消费者和商家的痛点,提高业务效率。