阿里巴巴语音识别模型 DFSMN 的使用指南

作者/分享人:Enzo
向 Ta 提问
目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。

阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

  1. 语音识别流程简介;
  2. Kaldi 的部署使用;
  3. 如何训练基于中文的 DFSMN 声学模型;
  4. 语音特征提取 MFCC 算法源码解读;
  5. 语音识别工具对比。
已有384人预订
预订达标
文章出炉
     
18.10.27
18.11.12
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Enzo的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
李烨
不错,可惜原理讲解不完整
Enzo: 原理方面还需多像李老师请教,本次chat还是以操作为主,原理深入讲解敬请期待。
shanyong.y 
完全就是跑了一遍thchs30好吗,跟DFSMN有半毛钱关系吗???,唯独有关系的地方就是说了一句,‘把dfsmn对应的代码复制到run.sh里’,复制你脸上去了吧!!
牛仔很忙
骗人的 和阿里巴巴 的模型没有任何关系
长颈鹿
哪里可以举报退款……
Aaron
根本没有跑DFSMN,看exp目录就知道,单纯只是跑了一遍thchs30. local/nnet/run_fsmn_ivector.sh DFSMN_S不是简单复制过来就行的,随便看一下里面的脚本就知道。
Axero
垃圾文章,哪里可以举报
你可能还喜欢
MyBatis 枚举全面使用指南
逆流而上/isea533
有关微服务的简介和经验分享
Yang
大型 Java 应用后台重构技术策略详解
驰骋
如何采用一套程序代码,实现系统的“千人千面”
白公
如何在繁重工作间隙保持良好的自学节奏和效能?
大妈
微服务网关 Spring Cloud Gateway 的应用实战
aoho求索
微信扫描登录