• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • 探究超大Transformer语言模型分布式训练框架

    。 优化的分布式集群架构:NVIDIA DGX SuperPOD 有了高效的分布式训练框架,自然也需要优化的分布式训练集群。 NVIDIA DGX SuperPOD 便是 NVIDIA 推出的一个

    2021-10-20 09:25

  • zookeeper分布式原理

    是提供一个高可用的、一致性的机制,用于解决分布式系统中常见的一致性问题,比如Leader选举、分布式锁等。在本文中,我们将详细介绍Zookeeper的原理和工作机制。 数据模型 Zookeeper的数据

    2023-12-03 16:33

  • 如何才能同步分布式系统的所有时钟?

    分布式系统由Tanenbaum定义,“分布式系统是一组独立的计算机,在”分布式系统 — 原理和范例“作为用户的单一,连贯的系统出现”。

    2023-02-06 11:00

  • 分布式通信的原理和实现高效分布式通信背后的技术NVLink的演进

    的大小已经超出了单个 GPU 的范围。所以就需要实现跨多个 GPU 的模型训练,这种训练方式就涉及到了分布式通信和 NVLink。 当谈及分布式通信和 NVLink 时,我们进入了一个引人入胜且不断演进的技术领域,下

    2024-11-18 09:39

  • 如何才能同步分布式系统的所有时钟

    分布式系统由Tanenbaum定义,“分布式系统是一组独立的计算机,在”分布式系统 — 原理和范例“作为用户的单一,连贯的系统出现”。 区块链通过构建全球

    2019-02-21 13:40

  • 什么是分布式架构?

    1.独立性:分布式架构的各个节点是独立运行的,它们没有依赖关系,可以单独进行升级、维护和扩展。 2.通信性:分布式架构的各个节点通过网络连接进行通信和协作,以实现

    2024-01-12 15:04

  • 基于PyTorch的模型并行分布式训练Megatron解析

    NVIDIA Megatron 是一个基于 PyTorch 的分布式训练框架,用来训练超大Transformer语言模型,其通过综合应用了数据并行,Tensor并行和Pipeline并行来复现 GPT3,值得我们深入分析其背后机理。

    2023-10-23 11:01

  • 什么是分布式系统 分布式架构有哪些

    什么是分布式系统? 1.分布式系统一定是由多个节点组成的系统。 2.这些连通的节点上部署了我们的节点,并且相互的操作会有协同。 随着应用架构演进, 分布式架构有哪些 1.传统垂直架构 2.RPC架构 3.SOA服务化

    2021-07-31 09:54

  • 分布式通信是什么 分布式网络搭建

    智能机器人的功能繁多,全都放在一个计算机里,经常会遇到计算能力不够、处理出现卡顿等情况,如果可以将这些任务拆解,分配到多个计算机运行岂不是可以减轻压力? 这就是分布式系统,可以实现多计算平台

    2023-11-27 15:49

  • 如何使用分布式存储系统促进AI模型训练

    这凸显了分布式存储在人工智能(AI)领域的重要性。JuiceFS 是一个开源、高性能的分布式文件系统,为这个问题提供了解决方案。

    2023-06-12 09:28