保存成功
保存失败,请重试
提交成功

阿里巴巴语音识别模型 DFSMN 的使用指南

作者/分享人:Enzo
目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。

阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

  1. 语音识别流程简介;
  2. Kaldi 的部署使用;
  3. 如何训练基于中文的 DFSMN 声学模型;
  4. 语音特征提取 MFCC 算法源码解读;
  5. 语音识别工具对比。
已有505人预订
预订达标
文章出炉
     
18.10.27
18.11.12
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Enzo的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
JustJiang7 个月前
哪里可以举报???
Forest8 个月前
DFSMN是阿里的?作者在说笑把。
李小凡8 个月前
讲的很仔细!比较容易懂!
Axero9 个月前
垃圾文章,哪里可以举报
Aaron10 个月前
根本没有跑DFSMN,看exp目录就知道,单纯只是跑了一遍thchs30. local/nnet/run_fsmn_ivector.sh DFSMN_S不是简单复制过来就行的,随便看一下里面的脚本就知道。
你可能还喜欢
Redis 难题突破,最经典 36 题含详细解析
慕容千语
送卫衣:GitChat 1024 留言有奖活动来啦!
GitChat 内容组
如何依靠副业赚钱,应对人到中年的职场危机
代码GG陆晓明
数据结构算法常见的 100 道面试题全解析:2019 版
攻城狮
Redis 面试题全解析
驰骋
【有奖活动】用一句话证明你是程序员
🐡赵小胖
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效