增强学习之蒙特卡洛树搜索

作者/分享人:李宁宁
向 Ta 提问
双985研究生学历软件工程出身,曾从事于Android、Linux嵌入式开发。对人工智能有狂热兴趣,现专注机器学习与深度学习,有丰富机器学习实战经验,希望帮助更多的同学走进人工智能的世界。

前不久 Google 已经宣布在某些领域通过了图灵测试, IO 大会 A I订餐着实让人吃了一惊。虽然人工智能领域各种算法各有所长,但我始终认为增强学习是这里面最好玩、最有趣的一个分支!今天,就让我们来一起学习下增强学习里面著名的蒙特卡洛树搜索(MCTS)算法,从理论与实践中了解其前世今生。

MCTS 是大部分 AI 的基础,比如著名的 AlphaGo。实战部分会用 MCTS 实现五子棋 GoBang AI,并讲解关键代码逻辑。不说了,我要和 GoBang 再去切磋切磋了!

希望通过这篇文章,让大家掌握 MCTS 的来龙去脉,并通过代码实战加深理解。MCTS,看这一篇就够了!

本场 Chat 主要内容包括:

  • 理论
    • 蒙特卡洛的原理、发展、应用;
    • MCTS 的发展、演进;
    • Multi-armed Bandit 问题;
    • MCTS 和 MB 问题的关系;
    • MCTS 的原理:MinMax、UCB、UCT
    • MCTS 的优缺点、改进;。
  • 实战
    • Tkinter 基本使用;
    • 代码实战:五子棋 GoBang AI。
活动取消
已有44人预订
预订达标
文章出炉
交流日期
     
05月23日
06月06日
06月13日
退款保证:
• 05月23日前,预订人数未达标,您将获得全额退款。
• 作者未按时完成文章,您将获得全额退款。
• 作者未按时间进行分享,您将获得全额退款。
你可能还喜欢
基于深度学习的计算机视觉技术在无人驾驶中的应用
美团技术团队
1小时搞懂 Git 版本控制
Fengy
AutoML 在推荐系统中的应用
第四范式技术团队
Kibana Canvas 初探
medcl
今夜,我们聊聊中国的开源
开源社
统一认证与授权在微服务架构中的设计与实战
CANGWU
再谈基于 Kafka 和 ZooKeeper 的分布式消息队列原理
应书澜
Elasticsearch 实战应用系列
桃花惜春风
RabbitMQ:并发、应用解耦(异步)、分发任务调度那都不是事
灵动的艺术
Fizz-Buzz-Whizz 小游戏算法解析
氢氧化钠
老系统微服务改造经验谈
老顽童
Java 进阶之路:从 Lock 指令前缀切入,解读 Java Volatile、CAS 及 Automic 包
Dora
分布式锁的最佳实践之:基于 Etcd 的分布式锁
应书澜
Java 网络编程基础篇
追梦
如何构建游戏安全护城河
网易移动安全技术团队
微信扫描登录