从零开始实现 AlphaGo(一)

作者/分享人:武博士
向 Ta 提问
双一流大学人工智能方向博士,中国移动集团IT架构师。科研方向:自然语言处理、计算机视觉、强化学习。已经发表 SCI 论文多篇,CSDN 专栏文章近百篇(机器学习专栏、深度学习专栏和强化学习专栏)。

围棋作为人类的娱乐游戏中复杂度最高的一个,它横竖各有 19 条线,共有 361 个落子点,状态空间高达 10 的 171 次方 $(注:宇宙中的原子总数是 10 的 80 次方,即使穷尽整个宇宙的物质也不能存下围棋的所有可能性),但是谷歌的 AlphaGo 做到了!

作为 AlphoGo 的带头人,David Sliver 及其团队可以说盛名远扬,其以前沿的目光发表了人工智能的终极目标是: AI = DL(Deep Learning)+ RL(Reinforcement Learning)。

这篇 Chat 主要带领大家一起:

  1. 了解 AlphaGo 的最基础原理:强化学习的概念;
  2. 了解强化与机器学习之间的联系与区别;
  3. 学习强化学习的组成和模型。

未来的 Chat 中我们会由浅入深,最终编程实现 AlphaGo Zero!

已有106人预订
预订达标
文章出炉
     
02月15日
03月01日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张武博士的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
高并发、低 RT 的风控系统架构及技术架构的实现
火币集团研发中心
高效构建 Docker 镜像的最佳实践
张晋涛
全栈开发入门实战:后台管理系统
鲁鹏
程序员副业赚钱的 8 种模式
安晓辉
每一个开发人员都应该懂的 UML 规范
码匠笔记
Python 协程模块 asyncio 使用指南
陈祥安
“花式吊打”系列之逻辑回归讲透透
天马行空
批量任务处理神器:Spring Batch
天涯阁主
多线程基本概念简述及常用操作 JVM 源码透析
哈比
Java 实现一个远程控制客户端思路附源码
愚凡
手把手封装 Java 分布式锁
香烟
设计模式架构解析
疯狂的架构
理理 Java 开发中常见的设计模式
woodwang
深度学习卷积神经网络架构设计核心技术
言有三
带你全面了解高级 Java 面试中需要掌握的 JVM 知识点
当年明月
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
添加小助手微信×