电子发烧友

技术资料
元器件/IC

搜索历史

清空

搜索热词

全文搜索
- 全文搜索
- 标题搜索
全部时间
- 全部时间
- 1小时内
- 1天内
- 1周内
- 1个月内
默认排序
- 默认排序
- 按时间排序

大家还在搜

深度学习模型量化方法

深度学习模型量化是一种重要的模型轻量化技术，旨在通过减少网络参数的比特宽度来减小

2024-07-15 11:01

TensorFlow模型优化：模型量化

大家都知道模型是有权重 (w) 和偏置 (b) 组成，其中 w，b 都是以 float32 存储的，float32 在计算机中存储时占 32bit，int8 在计算机中存储时占 8bit；模型量化

2021-02-04 15:40

理解LLM中的模型量化

在本文中，我们将探讨一种广泛采用的技术，用于减小大型语言模型（LLM）的大小和计算需求，以便将这些模型部署到边缘设备上。这项技术称为模型

2024-10-25 11:26 颖脉Imgtec 企业号

解读大模型FP量化的解决方案

在 LLaMA, BERT 以及 ViTs 模型上，4-bit 量化皆取得了远超 SOTA 的结果。特别是，这篇文章展示了 4-bit 量化的 LLaMA-13B 模型

2023-11-24 11:15

Meta发布Llama 3.2量化版模型

近日，Meta在开源Llama 3.2的1B与3B模型后，再次为人工智能领域带来了新进展。10月24日，Meta正式推出了这两个模型的量化版本，旨在进一步优化

2024-10-29 11:05

深度神经网络模型量化的基本方法

深度神经网络模型量化是深度学习领域中的一种重要优化技术，旨在通过减少模型参数的精度（即从高精度浮点数如32位浮点数FP32降低到低精度整数如8位整数INT8或更低）来降

2024-07-15 11:26

YOLOv8模型ONNX格式INT8量化轻松搞定

深度学习模型量化支持深度学习模型部署框架支持的一种轻量化模型与加速

2023-07-18 09:34

实战MNN之Mobilenet SSD部署

MNN 是一个轻量级的深度学习端侧推理引擎，核心解决深度神经网络模型在端侧推理运行问题，涵盖深度神经网络模型的优化、转换和推理。目...

2020-12-10 18:14

NNCF压缩与量化YOLOv8模型与OpenVINO部署测试

OpenVINO2023版本衍生出了一个新支持工具包NNCF(Neural Network Compression Framework – 神经网络压缩框架)，通过对OpenVINO IR格式模型的压缩与量化更好的提

2023-11-20 10:46

TPU-MLIR量化敏感层分析，提升模型推理精度

于浮点数模型，量化模型的推理精度会有一定程度的损失。当精度损失较大时，需要搜索模型中对精度影响较大的层，即敏感层，将其改

2023-10-10 10:17 算能开发者社区企业号

上一页12 3 4 5…1000 下一页

发烧友热榜
更多

1

解决接地环路的方法分析

4.8w

2

华为硬件工程师手册目前最全版本

664

3

山东本森智能装备机器人石膏粉码垛设备搬运

194

4

2025电子设计与制造技术研讨会

12.4w

5

上海海思AC9610 2Msps 24bit ADC芯片介绍

1.6w

6

STM32单片机无人机设计

646

7

保温料智能吨袋包装机介绍、

194

8

榜样力量，智领未来——2024年度电子发烧

3.7w

9

曝三星已量产第四代4nm芯片

6084

10

STM32F103C8T6开发板最小系统原理图

424