阿里巴巴语音识别模型 DFSMN 的使用指南

作者/分享人:Enzo
向 Ta 提问
目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。

阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

  1. 语音识别流程简介;
  2. Kaldi 的部署使用;
  3. 如何训练基于中文的 DFSMN 声学模型;
  4. 语音特征提取 MFCC 算法源码解读;
  5. 语音识别工具对比。
已有459人预订
预订达标
文章出炉
     
18.10.27
18.11.12
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Enzo的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
shanyong.y 
完全就是跑了一遍thchs30好吗,跟DFSMN有半毛钱关系吗???,唯独有关系的地方就是说了一句,‘把dfsmn对应的代码复制到run.sh里’,复制你脸上去了吧!!
长颈鹿
哪里可以举报退款……
Axero
垃圾文章,哪里可以举报
JustJiang
哪里可以举报???
李烨
不错,可惜原理讲解不完整
Enzo: 原理方面还需多像李老师请教,本次chat还是以操作为主,原理深入讲解敬请期待。
牛仔很忙
骗人的 和阿里巴巴 的模型没有任何关系
Aaron
根本没有跑DFSMN,看exp目录就知道,单纯只是跑了一遍thchs30. local/nnet/run_fsmn_ivector.sh DFSMN_S不是简单复制过来就行的,随便看一下里面的脚本就知道。
李小凡
讲的很仔细!比较容易懂!
Forest
DFSMN是阿里的?作者在说笑把。
你可能还喜欢
近距离接触 DDD
文贺
Python 常见的 170 道面试题全解析:2019 版
陈祥安
Apollo 轨迹规划技术分享
Apollo开发者社区
Docker 快速入门
技术人的突破
如何利用碎片时间,提升自己的职场竞争优势
代码GG陆晓明
爬虫开发入门:使用 pyspider 框架开发爬虫
凯哥
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
添加小助手微信×