• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • DeepMind开发了PopArt,解决了不同游戏奖励机制规范化的问题

    ,与没有使用PopArt的baseline agent相比,PopArt大大提高了agent的表现。无论是修剪了奖励还是没有修剪奖励,PopArt智能体在游戏中的中位数得分都高于人类中位数得分。

    2018-09-16 10:04

  • 强化学习“好奇心”模型:训练无需外部奖励,全靠自己

    我们的思路是,将内在奖励表示为预测agent在当前状态下的行为后果时出现的错误,即agent学习的前向动态的预测误差。我们彻底调查了54种环境中基于动力学的好奇心:这些场景包括视频游戏、物理引擎模拟和虚拟3D导航任务等,如图1所示。

    2018-08-20 08:55

  • 一款以BitTorrent代币连接和奖励用户的软件BitTorrent Speed介绍

    BitTorrent Speed是一款以BitTorrent代币(BTT)连接和奖励用户的软件,将与广受欢迎的μTorrent经典Windows客户端中的新下载版本整合,BitTorrent公司今日宣布了这一消息。下面就来看一下 BitTorrent Speed的新手指南。

    2019-07-10 10:29

  • 服务机器人 阿里智慧城市梦的承载者

    在昨天进行的2018云栖大会的机器革命·人工智能峰会上,阿里巴巴人工智能实验室发布了太空蛋和太空梭两款产品,主要面向酒店和医院等场景。

    2018-09-21 14:29

  • 如何采用有效抵押的区块奖励来缓解马太效应

    Harmony 的整体架构与以太坊 2.0 类似,由信标链和分片链组成。分片作为一种区块链的拓展方案,首先在 Zilliqa 上实现;但 Zilliqa 仅实现了网络分片和交易分片。Zilliqa 将其网络分为多个分片,每个分片有数百个节点(网络分片),允许不同的交易由不同的分片同时处理(交易分片)

    2019-10-11 10:26

  • 一文读懂杭州无人车路测

    具备汽车及零部件制造、技术研发或试验检测等自动驾驶技术相关业务能力,包括具有自动驾驶技术及产品研发、生产能力或运营能力的整车企业、改装车生产企业、互联网企业、科研院所、高校、交通运输企业以及其他科技型企业;

    2018-08-01 10:58

  • HDMI插拔大会落下帷幕,泰克为FRL、eARC测试提供可靠方案

    中国首次国际性HDMI Plugfest插拔大会于8月26~28日刚刚在深圳落幕,大会以“参加插拔大会,探索产品完美”为主题,30多家公司参加了此次会议。泰克作为专业测试设备提供商,现场为创新HDMI产品企业提供HD

    2019-09-03 10:00

  • ArduPilot全球无人机开发者大会开幕若联科技CEO上台发言

    10月15-10月16日,2018 ArduPilot全球无人机开发者大会在苏州正式举办。今年大会以“多元共享·推诚开源”为主题,秉持开源精神,致力于提供开源无人机行业服务交流契机。本次大会邀请

    2018-10-21 11:12

  • 用PopArt进行多任务深度强化学习

    按照以往的做法,如果研究人员要用强化学习算法对奖励进行剪枝,以此克服奖励范围各不相同的问题,他们首先会把大的奖励设为+1,小的奖励为-1,然后对预期

    2018-09-16 09:32

  • 如何计算比特币的交易手续费

    这个手续费是奖励给矿工的,以激励矿工继续挖矿为比特币提供足够的算力从而确保比特币网络的安全。目前矿工的主要收入是通过创造新的块(Block)来获得12.5BTC的奖励,但是这个奖励每4年减半,随着时间的推移比特币交易

    2019-06-24 11:24