AlphaGo Zero 设计思路及应用实践(上)

作者/分享人:赵英俊(Enjoy)
向 Ta 提问
从事互联网技术相关行业5年,目前专注于产业智能互联网的研究和实践,在NLP,AutoML领域有研究和实践,并会持续的推出技术分享和研究成果。

本次 Chat 是想通过对 AlphaGo Zero自我对抗学习围棋智能体的设计思路的解析,综述性的与各位分享一下这种以 AlphaGo Zero 为代表的自我对弈、自我学习、自我升级基于深度神经网络的智能化应用系统的设计思路和中心思想,总结出一套让深度学习和神经网络研究者都能够理解和受益的算法设计指导方法论。当然,纯理论的解释和算法公式推到从来不是我的强项,而且这些理论解析和算法推到在网上可以找到很多,而本次的 Chat 还是想从动手实践的方面为大家深度总结和讲解一下如何将这种先进的设计思想应用到实际的业务中。

本次 Chat 重点是在应用实践和解决方案层面的分享,分为上下两篇,上篇是讲AlphaGo Zero的设计思路,下篇是讲应用实践。不会有过多纯理论和算法的推导,建议大家可以提前补充相关的知识。

已有133人预订
预订达标
文章出炉
交流日期
     
02月11日
02月28日
03月06日 20:30
查看文章评论/提问
Q.IAN
人类是根据自己日常生活的经验来评估自己做了某件事之后可能带来的后果,而蒙特克洛树搜索也是对自己行为的后果评估,那蒙特克洛树搜索需要学习吗?
HiddenLogic
策略跟<土拨鼠之日>中男主追女主的过程类似:)
你可能还喜欢
Docker 入门之个人博客搭建教程
一念成魔
JVM 精华知识点汇总
胡玉洋
美团客户端响应式框架 EasyReact 开源
美团技术团队
MySQL 数据同步双机互备
小闲丶
前端游戏框架哪个好
cba
Spring Boot 最佳入门实践
老王
微信扫描登录