增强学习之蒙特卡洛树搜索

作者/分享人:李宁宁
向 Ta 提问
双985研究生学历软件工程出身,曾从事于Android、Linux嵌入式开发。对人工智能有狂热兴趣,现专注机器学习与深度学习,有丰富机器学习实战经验,希望帮助更多的同学走进人工智能的世界。

前不久 Google 已经宣布在某些领域通过了图灵测试, IO 大会 A I订餐着实让人吃了一惊。虽然人工智能领域各种算法各有所长,但我始终认为增强学习是这里面最好玩、最有趣的一个分支!今天,就让我们来一起学习下增强学习里面著名的蒙特卡洛树搜索(MCTS)算法,从理论与实践中了解其前世今生。

MCTS 是大部分 AI 的基础,比如著名的 AlphaGo。实战部分会用 MCTS 实现五子棋 GoBang AI,并讲解关键代码逻辑。不说了,我要和 GoBang 再去切磋切磋了!

希望通过这篇文章,让大家掌握 MCTS 的来龙去脉,并通过代码实战加深理解。MCTS,看这一篇就够了!

本场 Chat 主要内容包括:

  • 理论
    • 蒙特卡洛的原理、发展、应用;
    • MCTS 的发展、演进;
    • Multi-armed Bandit 问题;
    • MCTS 和 MB 问题的关系;
    • MCTS 的原理:MinMax、UCB、UCT
    • MCTS 的优缺点、改进;。
  • 实战
    • Tkinter 基本使用;
    • 代码实战:五子棋 GoBang AI。
活动取消
已有44人预订
预订达标
文章出炉
交流日期
     
05月23日
06月06日
06月13日
退款保证:
• 05月23日前,预订人数未达标,您将获得全额退款。
• 作者未按时完成文章,您将获得全额退款。
• 作者未按时间进行分享,您将获得全额退款。
你可能还喜欢
哪些算法和数据结构是需要程序员必须掌握的?
zhen.guo
ACT 敏捷教练培养体系
Chat 三人行
Spring Cloud Consul 从入门到精通
如梦技术 dreamlu
Spring Data JPA 晋级提升篇:复杂场景实战用法与优化
张振华
高并发、高性能 Web 架构解决方案
Array老师
程序员的自我进化:学习之道,如何更有效的学习
Soyoger
Spring 注解是如何实现的
飞翔
深入理解领域驱动设计中的聚合(aggregates)
张刚
分布式事务原理探究
追梦
技术部门 Leader 与团队那些事
Eason
如何正确使用 Spring Cloud?
老顽童
基于 Redis 的分布式锁实现及踩坑案例
应书澜
微服务概述及微服务文档输出实战应用
thinkers
Spring 事务配置解惑
追梦
本地事务原理探究
追梦
微信扫描登录