保存成功
保存失败,请重试

阿里巴巴语音识别模型 DFSMN 的使用指南

作者/分享人:Enzo
向 Ta 提问
目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。

阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

  1. 语音识别流程简介;
  2. Kaldi 的部署使用;
  3. 如何训练基于中文的 DFSMN 声学模型;
  4. 语音特征提取 MFCC 算法源码解读;
  5. 语音识别工具对比。
已有490人预订
预订达标
文章出炉
     
18.10.27
18.11.12
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Enzo的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
shanyong.y 
完全就是跑了一遍thchs30好吗,跟DFSMN有半毛钱关系吗???,唯独有关系的地方就是说了一句,‘把dfsmn对应的代码复制到run.sh里’,复制你脸上去了吧!!
长颈鹿
哪里可以举报退款……
Axero
垃圾文章,哪里可以举报
JustJiang
哪里可以举报???
李烨
不错,可惜原理讲解不完整
Enzo: 原理方面还需多像李老师请教,本次chat还是以操作为主,原理深入讲解敬请期待。
牛仔很忙
骗人的 和阿里巴巴 的模型没有任何关系
Aaron
根本没有跑DFSMN,看exp目录就知道,单纯只是跑了一遍thchs30. local/nnet/run_fsmn_ivector.sh DFSMN_S不是简单复制过来就行的,随便看一下里面的脚本就知道。
李小凡
讲的很仔细!比较容易懂!
Forest
DFSMN是阿里的?作者在说笑把。
你可能还喜欢
恕我直言,90% 的程序员都扛不住这波 MQ 的面试四连炮!
王码农
被动收入 101 :使用云开发和 Taro 开发一个小程序
白宦成
Apollo 5.0 障碍物行为预测技术
Apollo开发者社区
教了一年少儿编程,说说感想和体验
叶蒙蒙
抢先阅读 Kubernetes 1.15 新特性解读
张晋涛
非科班前端面试大厂的实操指南
修言
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效