从零开始实现 AlphaGo(一)

作者/分享人:武博士
向 Ta 提问
双一流大学人工智能方向博士,中国移动集团IT架构师。科研方向:自然语言处理、计算机视觉、强化学习。已经发表 SCI 论文多篇,CSDN 专栏文章近百篇(机器学习专栏、深度学习专栏和强化学习专栏)。

围棋作为人类的娱乐游戏中复杂度最高的一个,它横竖各有 19 条线,共有 361 个落子点,状态空间高达 10 的 171 次方 $(注:宇宙中的原子总数是 10 的 80 次方,即使穷尽整个宇宙的物质也不能存下围棋的所有可能性),但是谷歌的 AlphaGo 做到了!

作为 AlphoGo 的带头人,David Sliver 及其团队可以说盛名远扬,其以前沿的目光发表了人工智能的终极目标是: AI = DL(Deep Learning)+ RL(Reinforcement Learning)。

这篇 Chat 主要带领大家一起:

  1. 了解 AlphaGo 的最基础原理:强化学习的概念;
  2. 了解强化与机器学习之间的联系与区别;
  3. 学习强化学习的组成和模型。

未来的 Chat 中我们会由浅入深,最终编程实现 AlphaGo Zero!

已有97人预订
预订达标
文章出炉
     
02月15日
03月01日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张武博士的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
110 道 Python 面试笔试题超强汇总
嘉美伯爵
Redis 实战场景详解
驰骋
轻松搞定机器学习中的概率统计知识
Evan
架构师成长之路之服务治理漫谈
飞狐
打造高效「Mac 工具栈」,提高工作效率
易水寒
操作系统基础: C 语言实现用户态线程(实战)
Allen()
手把手教你做人脸搜索系统
天马行空
Java 与底层操作系统的交互细节
小强
架构师成长之路之限流
飞狐
架构师成长之路之服务发现与注册
飞狐
Java 进阶之路:异常处理的内在原理及优雅的处理方式
应书澜
人工智能物联网极简入门
Peter Liu
百无一用是管理:从技术到管理的 3 个典型困惑释疑
Paullin
如何使用谷歌云搭建你的高性能免费服务器
罗忠浩
Java 电商秒杀高并发实战一
air
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!