CHN强国网下载APP
犯我中华者 虽远必诛

成立两年,传说中的阿里达摩院都做了什么?

2019-07-22 12:34:00 | 来源: 记者站 | 参与: 0

  

500

  整理 | Jane

  出品 | AI科技大本营(ID:rgznai100)

  2017 年 10 月的杭州云栖大会上,阿里巴巴正式宣布成立达摩院,未来三年将投入将超过 1000 亿人民币用于基础科学和颠覆式技术创新研究。达摩院官网正式上线后,我们看到达摩院重点布局机器智能、数据计算、机器人、金融科技以及X实验室五大领域,相应设置有 14 个实验室,共有近 70 名海内外专家坐镇。

  AI 技术是达摩院目前重金押注的技术领域之一,即将成立两年,人们可能都比较好奇达摩院在AI上到底布局了哪些技术领域?又在哪些技术方向上取得了突破?本文将一一盘点达摩院在AI技术上的重大进展。

  阿里AI 的技术发展及平台建设

  阿里拥有全面的 AI 技术布局,涵盖语音智能、语言技术、机器视觉、决策智能等方向,建成了完善的机器智能算法体系, 不仅囊括语音、视觉、自然语言理解、无人驾驶等技术应用领域,还不断深化AI基础设施建设,重金投入研发AI芯片、超大规模机器学习平台,并建成了单日数据处理量突破 600PB 的超大计算平台。

  下面,我们主要围绕语音智能、语言技术、机器视觉三大技术领域与平台化建设的最新发展与成绩,一览阿里 AI 技术这两年的进展。

  (一)语音智能

  语音识别

  2018年6月,阿里达摩院开源了自主开发的新一代语音识别模型(DFSMN),在世界最大的免费语音识别数据库 LibriSpeech 上进行公开测试。对比目前业界使用最为广泛的 LSTM 模型,DFSMN 语音识别模型训练速度更快、识别准确率更高。基于 DFSMN 模型,阿里 AI 又研发了 DFSMN-CTC 模型,语音错误率大幅下降,解码效率提升6倍。

500

  此外,阿里巴巴机器智能技术实验室正在研发高工业噪声环境下的语音识别及传输技术。以后,众多车间工人将告别“通讯靠吼”的境况,简单的交流言语会转换成文字。目前,在85分贝工业噪声下,可以实现将一米处正常音量语音转换为文字,准确率达94.6%,能够解决大部分工厂里的噪声聋问题。这项工作仍在继续,未来团队希望可以实现 95 分贝工业噪声下进行语音识别。

正在加载

精彩阅读

热点排行
  • 日排行
  • 周排行
评论排行
  • 周排行
  • 月排行

-->