炼数成金 商业智能强化学习
订阅

强化学习

OpenAI详解进化策略方法:可替代强化学习
OpenAI详解进化策略方法:可替代强化学习
进化策略(ES:evolution strategy)是一种已存在了数十年的优化技术,其在现代强化学习基准(如 Atari/MuJoCo)上的表现可以比肩标准的强化学习技术,同时还能克服强化学习的许多不便。特别的几点包括:进化策略的 ...
增强学习的解释——学习基于长期回报的行为
增强学习的解释——学习基于长期回报的行为
一个机器人向前迈了一大步然后跌倒了。下一次它就往前走一小步并可以保持平衡了。机器人就像这样尝试了很多次,最终它成功学会了正确的步伐大小并能够稳定地行走了。我们看到的上述例子被称为增强学习。它将一个机器 ...
田渊栋总结:强化学习跳过“认识世界”,直指“改变世界”
田渊栋总结:强化学习跳过“认识世界”,直指“改变世界”
2016年是波澜壮阔的一年。这一年人工智能领域最抢眼的莫过于AlphaGo与李世石的五番棋对决。这一战,极大地扭转了大众对人工智能的认知,注定会载入史册。我有幸参与了历史。先是开了DarkForest这个项目,在计算机围 ...
专访谷歌Jeff Dean:强化学习适合的任务与产品化应用
专访谷歌Jeff Dean:强化学习适合的任务与产品化应用
最近在接受 Fortune 杂志采访时,Google 联合创始人兼领导人之一 Jeff Dean 谈到了最前沿的人工智能的研究、其中的挑战和人工智能在产品当中的应用。下次你在 Google 搜索引擎中输入问题或者使用谷歌地图服务以获取 ...
深度学习漫游指南:强化学习概览
深度学习漫游指南:强化学习概览
还记得你是如何学习骑自行车的吗?一般都有一个大人在你旁边或你后面帮助你,并鼓励你骑出你自行车生涯的第一步,在你绊倒或摔倒的时候还会帮助你再次尝试。解释儿童学习骑自行车的方式是很困难的,而即使很好的解释 ...
强化学习的复兴
强化学习的复兴
最近几个月,DeepMind 每次宣布在玩游戏的计算机上取得惊人的成果时总会获得人们的关注。起先,这家谷歌旗下在伦敦的人工智能研究中心宣称世界上有了一个能自学玩上世纪八十年代以来从 Pong 和 Breakout 到 Pac-Man ...
谷歌深度学习大神带你认识强化学习
谷歌深度学习大神带你认识强化学习
强化学习(Reinforcement learning)灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领 ...
123

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-11-14 01:42 , Processed in 0.104863 second(s), 16 queries .