阿里巴巴语音识别模型 DFSMN 的使用指南

作者/分享人:Enzo
向 Ta 提问
目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。

阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

  1. 语音识别流程简介;
  2. Kaldi 的部署使用;
  3. 如何训练基于中文的 DFSMN 声学模型;
  4. 语音特征提取 MFCC 算法源码解读;
  5. 语音识别工具对比。
已有282人预订
预订达标
文章出炉
     
10月27日
11月12日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Enzo的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
李烨
不错,可惜原理讲解不完整
Enzo: 原理方面还需多像李老师请教,本次chat还是以操作为主,原理深入讲解敬请期待。
shanyong.y 
完全就是跑了一遍thchs30好吗,跟DFSMN有半毛钱关系吗???,唯独有关系的地方就是说了一句,‘把dfsmn对应的代码复制到run.sh里’,复制你脸上去了吧!!
牛仔很忙
骗人的 和阿里巴巴 的模型没有任何关系
长颈鹿
哪里可以举报退款……
你可能还喜欢
如何设计一个灵活的 MySQL 数据表,应对灵活多变的需求
李岩
Jenkins 自动化构建部署实战
火币集团研发中心
Java 程序员应掌握的 Nginx 实战应用
JPM
带你玩转 JSON
能量架构师
实战剖析 Java 秒杀系统的实现
虎口脱险
小程序从入门到进阶
loonglong
微信扫描登录