强化学习_内存溢出

技术

CB Insights：2019年人工智能行业25大趋势

知名创投研究机构CB Insights调研了25种最大的AI趋势，以确定2019年该技术的下一步趋势，他们根据行业采用率和市场优势评估了每种趋势，并将其归类为必要、实验性、威胁性、暂时性。

镂空图案

2022-8-17

34 0 0 0

技术

Facebook开源Horizon主要是为了推进AI强化学习的发展

11月1日，Facebook开源了Horizon，一个由Facebook的AI研究人员、推荐系统专家和工程师共同搭建的强化学习平台，其框架的构建工作开始于两年半前，在过去一年中一直被Facebook内

偃师地图

2022-8-13

20 0 0 0

技术

CFA二级思维导图分享：机器学习

Reading7主要了解机器学习的一些常见概念，主要分类、了解常用算法的原理及其用途。机器学习（Machine Learning）专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新

淘宝推广

2022-8-11

33 0 0 0

技术

深度强化学习能让机器人拥有人一样的意识

机器人拥有人一样的意识，一直是我们目前难以攻克的难题。在近日，加州大学伯克利分校的科学家和谷歌人工智能（AI）研究部门之一的Google Brain在Arxiv．org上发表的一份预印本论文中描述了一

hellgate

2022-8-8

37 0 0 0

技术

复杂应用中运用人工智能核心强化学习

近期，有不少报道强化学习算法在 GO、Dota 2 和 Starcraft 2 等一系列游戏中打败了专业玩家的新闻。强化学习是一种机器学习类型，能够在电子游戏、机器人、自动驾驶等复杂应用中运用人工智能

拼写错误

2022-8-6

36 0 0 0

技术

人工智能强化学习的原理和目标

强化学习（RL），又称再励学习、评价学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。那么什么是强化学习？强化学习是智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函

510020

2022-8-5

50 0 0 0

技术

一文详谈机器学习的强化学习

强化学习属于机器学习中的一个子集，它使代理能够理解在特定环境中执行特定 *** 作的相应结果。目前，相当一部分机器人就在使用强化学习掌握种种新能力。强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户

炒外汇模拟软件

2022-8-5

38 0 0 0

区块链

多智能体强化学习：合作关系设定下的多智能体强化学习

0 前言在多智能体系统中，一个智能体未必能观测到全局状态 S。设第i号智能体有一个局部观测，它是S的一部分。我们假设所有的局部观

unique

2022-6-12

65 0 0 0

python

深度强化学习极简入门（二）——使用马尔可夫决策过程(MDP)描述强化学习

【引言】强化学习技术历经几十年的发展，理论严谨，应用广泛；而强化学习与深度学习相结合而形成的深度强化学习技术在视频游戏、即时战略游戏、围棋等领域达到了人类顶尖水平。上一篇博客介绍了强化学习的发展历史，这篇博客将介绍一个用于描述强化学习过程的

银行面试问题

2022-6-10

176 0 0 0

Golang

学习一门新语言(GoLang)及相关特点

GoLang能干什么？ 区块链技术后端服务器云计算云服务后台应用首先我们应当明白对于学习一门新的语言先要弄明白know how 在know why，在做中学，做了才会。

樱筱茉

2022-5-21

109 0 0 0

区块链

【强化学习-14】Multi-agent reinforcement learning: centralized vs. decentralized

Multi-agent reinforcement learning 第3种架构本笔记整理自 (作者: Shusen Wang): https:www.bilibili.comvideoBV1rv41167yx?fromsearc

code

2022-5-18

54 0 0 0

python

写一个强化学习训练的gym环境

需求要用强化学习(Reinforcement Learning)算法解决问题，需要百千万次的训练，真实环境一般不允许这么多次训练（时间太长、试错代价太大&#

code

2022-5-16

73 0 0 0

python

写一个强化学习训练的gym环境

需求要用强化学习(Reinforcement Learning)算法解决问题，需要百千万次的训练，真实环境一般不允许这么多次训练（时间太长、试错代价太大&#

code

2022-5-14

49 0 0 0

java

【PARL强化学习】环境搭建

PaddlePaddle 前言1、创建虚拟环境2、安装库3、CUDA、cuDNN安装4、基础测试5、实例测试结语前言抢了半年显卡，终于5.1时在pdd买到了原价的rtx3050(买不起不是我的问题&#xf

code

2022-5-7

85 0 0 0

python

【PARL强化学习】环境搭建

PaddlePaddle 前言1、创建虚拟环境2、安装库3、CUDA、cuDNN安装4、基础测试5、实例测试结语前言抢了半年显卡，终于5.1时在pdd买到了原价的rtx3050(买不起不是我的问题&#xf

code

2022-5-6

74 0 0 0

python

【代码开发】neuron

文章目录引子安装Anaconda安装环境及相关依赖运行代码引子最近调研了蛮多能跑 *** 的平台，但有些代码太老，有些太过复杂，很难找到开源的、方便的代码供研究。最近发

code

2022-5-6

69 0 0 0

python

【论文笔记】MOBA类游戏中的强化学习

文章目录引子论文列表用AI打星际争霸（RTS）整体结构训练模型结构用AI打dota整体模型网络结构值得一提的Surgery技术用AI打王者荣耀模型结构王者荣耀 1v1系统框架模

code

2022-5-5

56 0 0 0

python

文献阅读笔记 # SpaceAerial-Assisted Computing Offloading for IoT Applications: A Learning-Based Approach

这次分享的是一篇 2019 年发表在《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》的文章 SCI 1区，通信 Top 期刊，IF9.144

code

2022-4-28

191 0 0 0

java

文献阅读笔记 # SpaceAerial-Assisted Computing Offloading for IoT Applications: A Learning-Based Approach

这次分享的是一篇 2019 年发表在《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》的文章 SCI 1区，通信 Top 期刊，IF9.144

code

2022-4-28

132 0 0 0