炼数成金 商业智能强化学习
订阅

强化学习

全文解析:如何用强化学习解决实际生活中的问题规划?
全文解析:如何用强化学习解决实际生活中的问题规划?
强化学习(RL)是一个测试过程,通过基本的试错法(trial and error)测试哪种动作对环境的每个状态都是最好的。该模型引入了一个随机策略进行启动,每执行一个动作时,一个初始数量(称为奖励)就被馈送到模型中。 ...
Google提出自监督表征学习方法,让智能体通过观察认识世界
Google提出自监督表征学习方法,让智能体通过观察认识世界
现如今,在用于各种计算机视觉任务的最先进方法中包含一个视觉表征学习步骤。而在本文中,Google提出了一种用于连续控制任务的自监督表征学习方法。通过在嵌入空间中联合嵌入多个帧,扩展了从视觉观察中进行学习的时 ...
DeepMind发Nature子刊:通过元强化学习重新理解多巴胺
DeepMind发Nature子刊:通过元强化学习重新理解多巴胺
比起人类,深度学习算法已经在很多任务上的表现更优秀。但它们的学习效率很低。一个电子游戏,人类玩一个下午大概就会了,而算法得花上百个小时。DeepMind认为,这可能是人类的元学习能力占了优势。据昨天DeepMind在 ...
UC Berkeley提出新型「zero-shot」方法
UC Berkeley提出新型「zero-shot」方法
一般来说,模仿学习的当前主流范式依赖于对专家动作(expert action)的强有力的监督,以学习模仿什么和如何模仿。我们追求的是另一种范式,即:一个智能体首先在没有任何专家监督的情况下探索这个世界,然后将其经 ...
对抗深度强化学习是如何解决自动驾驶汽车系统中的安全性问题的?
对抗深度强化学习是如何解决自动驾驶汽车系统中的安全性问题的?
对于自动驾驶汽车(AV)而言,要想在未来的智能交通系统中以真正自主的方式运行,它必须能够处理通过大量传感器和通信链路所收集的数据。这对于减少车辆碰撞的可能性和改善道路上的车流量至关重要。然而,这种对通信 ...
通过机器学习发现神经网络优化器
通过机器学习发现神经网络优化器
如今,许多 Google 产品(例如搜索、翻译和照片)中都已部署深度学习模型。在训练深度学习模型时,优化方法的选择至关重要。例如,随机梯度下降法在许多情况下都很有效,但如果有更先进的优化器,速度可以更快,特别 ...
DeepMind提出SPIRAL:使用强化对抗学习,实现会用画笔的智能体
DeepMind提出SPIRAL:使用强化对抗学习,实现会用画笔的智能体
人类眼中的世界不只是角膜映射出的图像。比如,当我们看一幢建筑,赞美其设计精巧复杂时,我们能够欣赏到它的精巧工艺。通过创造事物的工具来解读事物是帮助我们理解世界的一项重要能力,也是人类智能的重要组成部分 ...
AI能有多污?要看你喂它吃什么
AI能有多污?要看你喂它吃什么
一直感觉,GAN (生成对抗网络) 这个名字隐隐有些污,还以为是我自己的问题。但这一次,发现开车不止不分国界,也能在人类和AI之间薪火相传。这是一种无需言传的技能Robbie Barrat虽然刚刚高中毕业,但驾龄已经不短了 ...
DeepMind强化学习进展:可执行多个任务的高度可扩展智能体
DeepMind强化学习进展:可执行多个任务的高度可扩展智能体
DMLab-30是我们用开源RL环境DeepMind Lab设计一个新的任务集合,其中后者是我们不久前刚发布的人工智能研究实验平台,它提供了一系列富有挑战性的3D导航和解题任务,特别适合深度强化学习系统的部署。而DMLab-30的意 ...
从Q学习到DDPG,一文简述多种强化学习算法
从Q学习到DDPG,一文简述多种强化学习算法
强化学习(RL)指的是一种机器学习方法,其中智能体在下一个时间步中收到延迟的奖励(对前一步动作的评估)。这种方法主要用于雅达利(Atari)、马里奥(Mario)等游戏中,表现与人类相当,甚至超过人类。最近,随着 ...
如何让强化学习走进现实世界?DeepMind要用“控制套件”推动
如何让强化学习走进现实世界?DeepMind要用“控制套件”推动
火遍全球的AlphaGo让我们知道了强化学习打游戏究竟有多6,这么强大的算法什么时候才能打破次元壁,走进现实、控制物理世界中的物体呢?DeepMind已经开始往这方面努力。他们昨天发布的控制套件“DeepMind Control Sui ...
深度强化学习的 18 个关键问题
深度强化学习的 18 个关键问题
原文归纳出深度强化学习中的常见科学问题,并列出了目前解法与相关综述,我在这里做出整理,抽取了相关的论文。 这里精选 18 个关键问题,涵盖空间搜索、探索利用、策略评估、内存使用、网络设计、反馈激励等等话题 ...
论文结果难复现?本文教你完美实现深度强化学习算法DQN
论文结果难复现?本文教你完美实现深度强化学习算法DQN
过去几年来,深度强化学习逐渐流行,因为它在有超大状态空间(state-spaces)的领域上要比先前的方法有更好的表现。DQN 几乎在所有的游戏上超越了之前的强化学习方法,并在大部分游戏上比人类表现更好。随着更多的研 ...
DeepMind为明年的AAAI,准备了一份各种DQN的混血
DeepMind为明年的AAAI,准备了一份各种DQN的混血
DeepMind公开了一篇最近投递到AAAI 2018的新论文,这篇论文的主角,依然是这家公司四年前就开始研究的DQN,配角,依然是雅达利(Atari)游戏。DQN,全名Deep Q-Network(深度Q网络),是DeepMind在2013年NIPS Deep L ...
TensorFlow Agents日前开源,在TensorFlow中构建强化学习算法
TensorFlow Agents日前开源,在TensorFlow中构建强化学习算法
用于在TensorFlow中构建并行强化学习算法的高效基础架构范例TensorFlow Agents日前开源,这个项目是由谷歌的两位研究员James Davidson、Vincent Vanhoucke,以及Danijar Hafner共同研发的。TensorFlow Agents为强化 ...
12下一页

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-6-18 16:00 , Processed in 0.085643 second(s), 16 queries .