从 Word Embedding 到 BERT:一起肢解 BERT!

作者/分享人:武博士
向 Ta 提问
双一流大学人工智能方向博士,中国移动集团IT架构师。科研方向:自然语言处理、计算机视觉、强化学习。已经发表 SCI 论文多篇,CSDN 专栏文章近百篇(机器学习专栏、深度学习专栏和强化学习专栏)。

在 NLP 中,BERT 最近很火,是 NLP 重大进展的集大成者,是最近最火爆的 AI 进展之一。对最新的 Google BERT 模型我们有这样的疑问:

  1. 什么是 BERT,这个模型是怎么来的;
  2. 刷新了很多 NLP 任务的最好性能,有些任务还被刷爆了,BERT 值得这么高的评价吗;
  3. 它有重大的理论或者模型创新吗?

这篇 Chat 中除了得到以上疑问的答案,您可以得到:

  1. 从图像预训练为例,解释预训练的过程和意义;
  2. Word Embedding 的发展历程;
  3. Embedding from Language Models,ELMO 模型讲解;
  4. Generative Pre-Training,GPT 模型讲解;
  5. BERT 的诞生和“肢解”(ELMO 和 GPT 的优势集成)。
已有190人预订
预订达标
文章出炉
     
18.12.05
18.12.24
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张武博士的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
进击的豆沙包
看了看 发现还没知乎上讲的好呢。。。。
薛定谔之猪
全水
idea
水的一比
你可能还喜欢
大型 Java 应用后台重构技术策略详解
驰骋
微服务网关 Spring Cloud Gateway 的应用实战
aoho求索
Docker 的基础知识整理
假不理
如何采用一套程序代码,实现系统的“千人千面”
白公
JVM 常见面试题指南
驰骋
用领域驱动实现供应链系统商品录入和出入库设计
GIM
微信扫描登录