电子发烧友

技术资料
元器件/IC

搜索历史

清空

搜索热词

搜索历史

清空

搜索热词

全文搜索
- 全文搜索
- 标题搜索
全部时间
- 全部时间
- 1小时内
- 1天内
- 1周内
- 1个月内
默认排序
- 默认排序
- 按时间排序

大家还在搜

TensorFlow正式发布1.5.0，使Volta GPUs/FP16上的训练速度翻倍

TensorFlow今天正式发布了1.5.0版本，支持CUDA 9和cuDNN 7，进一步提速。并且，从1.6版本开始，预编译二进制文件将使用AVX指令，这可能会破坏老式CPU上的TF。

2018-01-29 15:02
NVIDIA Volta GPU中内置的Tensor Core GPU架构是NVIDIA深度学习平台的巨大进步

Tensor Core所运行的张量应位于存储器的channel-interleaved型数据布局（数量-高度-宽度-通道数，通常称为NHWC），以实现最佳性能。训练框架预期的内存布局是通道主序的数据布局（数量-通道数-宽度-高度，通常称为NCHW）。因此，cuDNN库执行NCHW和NHWC之间的张量转置操作，如图3所示。如前所述，由于如今卷积本身如此之快，因此这些转置显然会占运行时间的一部分。

2018-05-21 17:35
混合精度训练的优势！将自动混合精度用于主流深度学习框架

仅通过添加几行代码，TensorFlow、PyTorch和MXNet中的自动混合精确功能就能助力深度学习研究人员和工程师基于NVIDIA Volta和Turing GPU实现高达3倍的AI训练加速。

2019-04-03 11:31
大模型训练，英伟达Turing、Ampere和Hopper算力分析

最先 Tesla 架构，分别经过 Fermi、Kepler、Maxwell、Pascal、Volta、Turing、Ampere至发展为今天的 Hopper 架构。

2023-05-15 11:16
盘点一些应用于汽车自动驾驶的芯片

主要来自于4颗处理器-2颗为以NVIDIA目前最新GPU架构「Volta」为核心的SoC「Xavier」、以及另外2颗为车用机械视觉与深度学习所准备的专用GPU。

2018-06-03 10:37
如何用单独的GPU，在CIFAR-10图像分类数据集上高效地训练残差网络

现在我们假设在一个英伟达Volta V100 GPU上用100%的计算力，训练将需要多长时间。网络在一张32×32×3的CIFAR10图像上进行前向和后向传递时需要大约2.8×109FLOPs。假设

2018-11-12 09:35
Orin芯片的编程语言支持

Orin是一款高度集成、高性能的车载计算平台，由英伟达推出，并采用了英伟达自家的Volta架构GPU和其他高级处理器技术。关于Orin芯片的编程语言支持，可以从以下几个方面进行介绍：一、主要编程

2024-10-27 16:45
自动驾驶芯片之争:ARM Cortex-A76AE对决MIPS I6500-F

Xavier是目前性能最强的自动驾驶单芯片，拥有90亿个晶体管，350平方毫米的裸晶面积，台积电12纳米FFN工艺，其512核的Volta GPU在FP8精度下是20TOPS Tensor Core

2018-12-19 15:27
fx3系列的硬件主要由什么组成

Cortex-A55 CPU、一个NVIDIA Volta GPU、两个NVDLA深度学习加速器和两个视觉处理单元（VPU）。 CPU ：ARM Cortex-A55核心，专为能效和性

2024-09-18 11:14