• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • 基于多Agent的传感器管理系统

    本文提出了一种传感器管理系统框架,给出了基于多Agent的解决方案。该结构通过多个Agent间的相互协商来实现传感器任务的分配,较好地克服了在融合中心存在的缺陷。并在此基础上着重探讨各Agent之间的协调合作问题,实

    2018-03-14 10:11

  • 浅谈Q-Learning在Agent的应用

    经典的文字模型我们已经很熟悉了:训练时,模型不停的预测下一个 token 并与真实语料比较,直到模型的输出分布非常接近于真实分布。

    2023-12-02 16:53

  • 移动Agent嵌入式移动数据库详解及实现查询优化

    随着网络技术的迅速发展和不断渗透,在任何地点和任何时候都能接入网络获取各种信息,必将成为21世纪人类的普通要求;同时,移动通信技术的进步和人们对移动数据处理需求的不断提高,与各种智能通信设备紧密结合的嵌入式移动数据库技术已经得到了学术界、工业界、军事领域、民用部门等各方面的高度重视。移动计算和移动数据库技术将使得这种需求得以实现。

    2017-12-01 17:14

  • 手把手教你实现一个Java Agent(JVM启动时的处理流程)

    Arthas命令很多,如果是exit、logout、quit、jobs、fg、bg、kill等简单的命令,就会直接执行,如果是trace这种复杂的命令,会专门用一个类写处理的逻辑,如上图,根据名字就可以猜到这个类是处理什么命令的,这么多类的组织形式是模版模式,入口在com.taobao.arthas.core.shell.command.AnnotatedCommand#process,

    2023-11-27 10:53

  • 伯克利那个会“18般武艺”的DeepMimic模型开源了!

    整个DeepMimic所需要的input分为三部分:一个被称为Character的Agent模型;希望Agent学习的参考动作(reference motion);希望Agent完成的任务(task)所定义的rewa

    2018-10-19 09:06

  • 如何让多个智能体学会一起完成同一个任务,学会彼此合作和相互竞争

    多智体强化学习(Multi-agent reinforcement learning, MARL)假设有一组处在相同环境下的自主智能体。在MARL中学习非常困难,因为agent不仅与环境交互,而且还会相互作用:一个agent

    2018-06-27 14:22

  • 强化学习“好奇心”模型:训练无需外部奖励,全靠自己

    我们的思路是,将内在奖励表示为预测agent在当前状态下的行为后果时出现的错误,即agent学习的前向动态的预测误差。我们彻底调查了54种环境中基于动力学的好奇心:这些场景包括视频游戏、物理引擎模拟和虚拟3D导航任务等,如图1所示。

    2018-08-20 08:55

  • 验证组件配置参数

    一些典型 的 验证组件 配 置参数示例:  一个agent可以被配置为 active 或者 passive 模式。在active模式下agent驱动DUT,在passive模式下agent被动地检查

    2023-06-14 10:20

  • DeepMind开发了PopArt,解决了不同游戏奖励机制规范化的问题

    ,与没有使用PopArt的baseline agent相比,PopArt大大提高了agent的表现。无论是修剪了奖励还是没有修剪奖励,PopArt智能体在游戏中的中位数得分都高于人类中位数得分。

    2018-09-16 10:04

  • 开源之夏总结runk:基于Rust的OCI runtime实现

    这是今年开源之夏活动中,陈轶阳同学参加 runk 项目的总结文档,主要介绍了 runk 的由来,以及如何基于现有 kata agent 组件来实现一个标准的 OCI runtime。

    2022-11-29 15:00