忘记密码
免费注册
全部
课程
文章
帖子
用户
快捷导航
徽章
好友
帖子
收藏
道具
任务
充值
提现
课程
奖学金
抵价券
企业
学习中心
|- 我的课程
|- 我的专才计划
|- 我的普班
|- 我的快班
|- 我的关注
|- 我的专业
|- 我的求职
|- 我的招聘
|- 我的云实验室
首页
业界
培训
专才计划
特训营
课程
专业
企业服务
入职特训
创想基地
论坛
产品廊
大数据
商业智能
专家团
关于我们
入职特训计划
黄校长前沿人才培养计划
王文峰计算机视觉精英培训计划
郭一军“新DBA”精英培养计划
葛一鸣JAVA精英培养计划
人工智能专业
数据分析师专业
大数据攻城狮专业
Hadoop大数据攻城狮专业
Python数据分析师专业
全栈程序猿专业
DBA专业
企业菁英小团队培养计划
企业内训
炼数成金
›
商业智能
›
强化学习
订阅
强化学习
Dota2团战AI击败人类最全解析:能团又能gank,AI一日人间180年
GG。随着人类喊出这两个字母,一切都结束了。OpenAI研发的人工智能战队,首次在5v5的Dota2开黑团战对战中,击败人类玩家战队。这真是一个里程碑式的事件。这个能打团战的AI名叫OpenAI Five,是OpenAI最新的研发成果 ...
OpenAI Dota2 5v5模式击败人类,AI每天训练量抵人类180年
今天凌晨,OpenAI通过官方博客宣布了其在Dota对抗上的新进展——由五个神经网络组成的团战AI团队,在5v5中击败了业余人类玩家,并表示,将有望挑战顶级专业团队。打Dota乍一听可能没什么了不起的,但这可以被视作Alp ...
全文解析:如何用强化学习解决实际生活中的问题规划?
强化学习(RL)是一个测试过程,通过基本的试错法(trial and error)测试哪种动作对环境的每个状态都是最好的。该模型引入了一个随机策略进行启动,每执行一个动作时,一个初始数量(称为奖励)就被馈送到模型中。 ...
Google提出自监督表征学习方法,让智能体通过观察认识世界
现如今,在用于各种计算机视觉任务的最先进方法中包含一个视觉表征学习步骤。而在本文中,Google提出了一种用于连续控制任务的自监督表征学习方法。通过在嵌入空间中联合嵌入多个帧,扩展了从视觉观察中进行学习的时 ...
DeepMind发Nature子刊:通过元强化学习重新理解多巴胺
比起人类,深度学习算法已经在很多任务上的表现更优秀。但它们的学习效率很低。一个电子游戏,人类玩一个下午大概就会了,而算法得花上百个小时。DeepMind认为,这可能是人类的元学习能力占了优势。据昨天DeepMind在 ...
UC Berkeley提出新型「zero-shot」方法
一般来说,模仿学习的当前主流范式依赖于对专家动作(expert action)的强有力的监督,以学习模仿什么和如何模仿。我们追求的是另一种范式,即:一个智能体首先在没有任何专家监督的情况下探索这个世界,然后将其经 ...
对抗深度强化学习是如何解决自动驾驶汽车系统中的安全性问题的?
对于自动驾驶汽车(AV)而言,要想在未来的智能交通系统中以真正自主的方式运行,它必须能够处理通过大量传感器和通信链路所收集的数据。这对于减少车辆碰撞的可能性和改善道路上的车流量至关重要。然而,这种对通信 ...
通过机器学习发现神经网络优化器
如今,许多 Google 产品(例如搜索、翻译和照片)中都已部署深度学习模型。在训练深度学习模型时,优化方法的选择至关重要。例如,随机梯度下降法在许多情况下都很有效,但如果有更先进的优化器,速度可以更快,特别 ...
DeepMind提出SPIRAL:使用强化对抗学习,实现会用画笔的智能体
人类眼中的世界不只是角膜映射出的图像。比如,当我们看一幢建筑,赞美其设计精巧复杂时,我们能够欣赏到它的精巧工艺。通过创造事物的工具来解读事物是帮助我们理解世界的一项重要能力,也是人类智能的重要组成部分 ...
AI能有多污?要看你喂它吃什么
一直感觉,GAN (生成对抗网络) 这个名字隐隐有些污,还以为是我自己的问题。但这一次,发现开车不止不分国界,也能在人类和AI之间薪火相传。这是一种无需言传的技能Robbie Barrat虽然刚刚高中毕业,但驾龄已经不短了 ...
DeepMind强化学习进展:可执行多个任务的高度可扩展智能体
DMLab-30是我们用开源RL环境DeepMind Lab设计一个新的任务集合,其中后者是我们不久前刚发布的人工智能研究实验平台,它提供了一系列富有挑战性的3D导航和解题任务,特别适合深度强化学习系统的部署。而DMLab-30的意 ...
从Q学习到DDPG,一文简述多种强化学习算法
强化学习(RL)指的是一种机器学习方法,其中智能体在下一个时间步中收到延迟的奖励(对前一步动作的评估)。这种方法主要用于雅达利(Atari)、马里奥(Mario)等游戏中,表现与人类相当,甚至超过人类。最近,随着 ...
如何让强化学习走进现实世界?DeepMind要用“控制套件”推动
火遍全球的AlphaGo让我们知道了强化学习打游戏究竟有多6,这么强大的算法什么时候才能打破次元壁,走进现实、控制物理世界中的物体呢?DeepMind已经开始往这方面努力。他们昨天发布的控制套件“DeepMind Control Sui ...
深度强化学习的 18 个关键问题
原文归纳出深度强化学习中的常见科学问题,并列出了目前解法与相关综述,我在这里做出整理,抽取了相关的论文。 这里精选 18 个关键问题,涵盖空间搜索、探索利用、策略评估、内存使用、网络设计、反馈激励等等话题 ...
论文结果难复现?本文教你完美实现深度强化学习算法DQN
过去几年来,深度强化学习逐渐流行,因为它在有超大状态空间(state-spaces)的领域上要比先前的方法有更好的表现。DQN 几乎在所有的游戏上超越了之前的强化学习方法,并在大部分游戏上比人类表现更好。随着更多的研 ...
1
2
3
4
/ 4 页
下一页
热门频道
大数据
商业智能
量化投资
科学探索
创业
即将开课
•
Oracle SQL Tuning(DSI系列Ⅲ)(第11期)
•
基于Flink流处理的动态实时亿级电商全端用户画像系统(第一期)
•
python网络爬虫应用实战(第15期)
•
Web全栈开发理论与实践(第11期)
•
Spark企业级大数据项目实战(第17期)
•
Python3入门到精通实战特训(第13期)
•
金融的人工智能革命(第17期)
•
计算机视觉:从入门到精通,极限剖析图像识别学习算法(第12期)
•
Java落地方案之构建亿级微服务秒杀系统(开发+测试+部署)(第二期)
•
Python数据处理实战:基于真实场景的数据(第五期)
•
深入浅出Git(第13期)
•
快速成为深度学习全栈工程师(第七期)
•
企业级大中台从设计到实现(第三期)
•
Python机器学习Kaggle案例实战(第19期)
•
高并发高可用的亿级微服务电商平台全实现(第六期)
•
跟Py sir一起学Excel(第二期)
•
Qt编程快速入门(第十期)
•
Architecting on AWS架构与实践(第六期)
•
并行化计算与CUDA编程(第三期)
•
企业级大中台从设计到实现(下)(第二期)
•
反内卷神器之RPA特训(第一期)
热门文章
社区热帖
GMT+8, 2021-1-26 22:17
, Processed in 0.092120 second(s), 16 queries .
关于我们
新手指南
企业合作
联系我们
订阅号
服务号
关于我们
教育模式
企业会员
电话:4008-010-006
讲师招募
选课流程
内训合作
邮箱:kefu@dataguru.cn
校园大使
学费返还
媒体合作
客服QQ:
版权声明
奖学金激励
代理合作
售后QQ:
关于我们
手机版
友情链接
站点统计
文本模式
小游戏