忘记密码
免费注册
全部
课程
文章
帖子
用户
快捷导航
徽章
好友
帖子
收藏
道具
任务
充值
提现
课程
奖学金
抵价券
企业
学习中心
|- 我的课程
|- 我的专才计划
|- 我的普班
|- 我的快班
|- 我的关注
|- 我的专业
|- 我的求职
|- 我的招聘
|- 我的云实验室
首页
业界
培训
专才计划
特训营
课程
专业
企业服务
入职特训
创想基地
论坛
产品廊
大数据
商业智能
专家团
关于我们
入职特训计划
黄校长前沿人才培养计划
王文峰计算机视觉精英培训计划
郭一军“新DBA”精英培养计划
葛一鸣JAVA精英培养计划
人工智能专业
数据分析师专业
大数据攻城狮专业
Hadoop大数据攻城狮专业
Python数据分析师专业
全栈程序猿专业
DBA专业
企业菁英小团队培养计划
企业内训
炼数成金
›
商业智能
›
强化学习
订阅
强化学习
DeepMind为明年的AAAI,准备了一份各种DQN的混血
DeepMind公开了一篇最近投递到AAAI 2018的新论文,这篇论文的主角,依然是这家公司四年前就开始研究的DQN,配角,依然是雅达利(Atari)游戏。DQN,全名Deep Q-Network(深度Q网络),是DeepMind在2013年NIPS Deep L ...
TensorFlow Agents日前开源,在TensorFlow中构建强化学习算法
用于在TensorFlow中构建并行强化学习算法的高效基础架构范例TensorFlow Agents日前开源,这个项目是由谷歌的两位研究员James Davidson、Vincent Vanhoucke,以及Danijar Hafner共同研发的。TensorFlow Agents为强化 ...
全新强化学习算法详解,看贝叶斯神经网络如何进行策略搜索
首先,在这里,介绍一下我们最近在ICLR(International Conference on Learning Representations)上发表的论文《利用贝叶斯神经网络进行随机动力系统中的学习与策略搜索》(ICLR 2017)。点击此处查看论文代码和视 ...
智能体要找不着北了,UCL汪军团队提出环境设计的新方法
能够达到期望的环境是需要设计的,但是很难分析性地用标准设计方法处理这类复杂的对象与环境交互问题,对整个解空间进行穷举演算的计算成本又太高。环境设计任务:智能体与环境交互,智能体是相对固定的,环境学习一 ...
强化学习族谱
强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试, 从错误中学习, 最后找到规律, 学会了达到目的的方法. 这就是一个完整的强化学习过程.
阿里巴巴为什么要选择星际争霸作为AI算法研究环境?
首先可能大家有疑问,为什么选择《星际争霸》这个游戏来做我们 AI 研究的一个平台。我们这个认知计算实验室目前是挂靠在搜索事业部下面,我们团队的成员基本都是做搜索、广告、推荐、算法这样的背景,之前我们主要做 ...
英特尔通过预测变量实现策略性强化学习,夺冠 Doom 游戏竞赛
来自英特尔实验室(Intel Labs)的两名研究员Alexey Dosovitskiy和Vladlen Koltum提出了一种在沉浸式环境中实现感觉运动控制(Sensorimotor control)的方法。据悉,该方法有效地综合利用了高维度的感官流(high-dim ...
从强化学习基本概念到Q学习的实现,打造自己的迷宫智能体
强化学习其实也是机器学习的一个分支,但是它与我们常见监督学习和无监督学习又不太一样。强化学习旨在选择最优决策,它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。该学 ...
OpenAI详解进化策略方法:可替代强化学习
进化策略(ES:evolution strategy)是一种已存在了数十年的优化技术,其在现代强化学习基准(如 Atari/MuJoCo)上的表现可以比肩标准的强化学习技术,同时还能克服强化学习的许多不便。特别的几点包括:进化策略的 ...
增强学习的解释——学习基于长期回报的行为
一个机器人向前迈了一大步然后跌倒了。下一次它就往前走一小步并可以保持平衡了。机器人就像这样尝试了很多次,最终它成功学会了正确的步伐大小并能够稳定地行走了。我们看到的上述例子被称为增强学习。它将一个机器 ...
田渊栋总结:强化学习跳过“认识世界”,直指“改变世界”
2016年是波澜壮阔的一年。这一年人工智能领域最抢眼的莫过于AlphaGo与李世石的五番棋对决。这一战,极大地扭转了大众对人工智能的认知,注定会载入史册。我有幸参与了历史。先是开了DarkForest这个项目,在计算机围 ...
专访谷歌Jeff Dean:强化学习适合的任务与产品化应用
最近在接受 Fortune 杂志采访时,Google 联合创始人兼领导人之一 Jeff Dean 谈到了最前沿的人工智能的研究、其中的挑战和人工智能在产品当中的应用。下次你在 Google 搜索引擎中输入问题或者使用谷歌地图服务以获取 ...
深度学习漫游指南:强化学习概览
还记得你是如何学习骑自行车的吗?一般都有一个大人在你旁边或你后面帮助你,并鼓励你骑出你自行车生涯的第一步,在你绊倒或摔倒的时候还会帮助你再次尝试。解释儿童学习骑自行车的方式是很困难的,而即使很好的解释 ...
强化学习的复兴
最近几个月,DeepMind 每次宣布在玩游戏的计算机上取得惊人的成果时总会获得人们的关注。起先,这家谷歌旗下在伦敦的人工智能研究中心宣称世界上有了一个能自学玩上世纪八十年代以来从 Pong 和 Breakout 到 Pac-Man ...
谷歌深度学习大神带你认识强化学习
强化学习(Reinforcement learning)灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领 ...
1
2
3
4
/ 4 页
热门频道
大数据
商业智能
量化投资
科学探索
创业
即将开课
•
Oracle SQL Tuning(DSI系列Ⅲ)(第11期)
•
基于Flink流处理的动态实时亿级电商全端用户画像系统(第一期)
•
python网络爬虫应用实战(第15期)
•
Web全栈开发理论与实践(第11期)
•
Spark企业级大数据项目实战(第17期)
•
Python3入门到精通实战特训(第13期)
•
金融的人工智能革命(第17期)
•
计算机视觉:从入门到精通,极限剖析图像识别学习算法(第12期)
•
Java落地方案之构建亿级微服务秒杀系统(开发+测试+部署)(第二期)
•
Python数据处理实战:基于真实场景的数据(第五期)
•
深入浅出Git(第13期)
•
快速成为深度学习全栈工程师(第七期)
•
企业级大中台从设计到实现(第三期)
•
Python机器学习Kaggle案例实战(第19期)
•
高并发高可用的亿级微服务电商平台全实现(第六期)
•
跟Py sir一起学Excel(第二期)
•
Qt编程快速入门(第十期)
•
Architecting on AWS架构与实践(第六期)
•
并行化计算与CUDA编程(第三期)
•
企业级大中台从设计到实现(下)(第二期)
•
反内卷神器之RPA特训(第一期)
热门文章
社区热帖
GMT+8, 2021-1-26 23:18
, Processed in 0.127367 second(s), 16 queries .
关于我们
新手指南
企业合作
联系我们
订阅号
服务号
关于我们
教育模式
企业会员
电话:4008-010-006
讲师招募
选课流程
内训合作
邮箱:kefu@dataguru.cn
校园大使
学费返还
媒体合作
客服QQ:
版权声明
奖学金激励
代理合作
售后QQ:
关于我们
手机版
友情链接
站点统计
文本模式
小游戏