阿里巴巴语音识别模型 DFSMN 的使用指南

作者/分享人:Enzo
向 Ta 提问
目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。

阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

  1. 语音识别流程简介;
  2. Kaldi 的部署使用;
  3. 如何训练基于中文的 DFSMN 声学模型;
  4. 语音特征提取 MFCC 算法源码解读;
  5. 语音识别工具对比。
已有427人预订
预订达标
文章出炉
     
18.10.27
18.11.12
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Enzo的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
李烨
不错,可惜原理讲解不完整
Enzo: 原理方面还需多像李老师请教,本次chat还是以操作为主,原理深入讲解敬请期待。
shanyong.y 
完全就是跑了一遍thchs30好吗,跟DFSMN有半毛钱关系吗???,唯独有关系的地方就是说了一句,‘把dfsmn对应的代码复制到run.sh里’,复制你脸上去了吧!!
牛仔很忙
骗人的 和阿里巴巴 的模型没有任何关系
长颈鹿
哪里可以举报退款……
Aaron
根本没有跑DFSMN,看exp目录就知道,单纯只是跑了一遍thchs30. local/nnet/run_fsmn_ivector.sh DFSMN_S不是简单复制过来就行的,随便看一下里面的脚本就知道。
Axero
垃圾文章,哪里可以举报
李小凡
讲的很仔细!比较容易懂!
Forest
DFSMN是阿里的?作者在说笑把。
JustJiang
哪里可以举报???
你可能还喜欢
解读《阿里巴巴 Java 开发手册》背后的思考
Hollis
LeetCode 刷题指南以及常见算法题解题思路总结
kerry
初探 Kafka
阿福
大数据开发面试指南
王知无
高并发系统缓存实战入门
饿了么物流技术团队
7 天从 Java 工程师转型为 Go 工程师
DIU哥
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!