• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • 深度学习模型量化方法

    深度学习模型量化种重要的模型量化技术,旨在通过减少网络参数的比特宽度来减小

    2024-07-15 11:01

  • TensorFlow模型优化:模型量化

    大家都知道模型是有权重 (w) 和偏置 (b) 组成,其中 w,b 都是以 float32 存储的,float32 在计算机中存储时占 32bit,int8 在计算机中存储时占 8bit;模型量化

    2021-02-04 15:40

  • 理解LLM中的模型量化

    在本文中,我们将探讨种广泛采用的技术,用于减小大型语言模型(LLM)的大小和计算需求,以便将这些模型部署到边缘设备上。这项技术称为模型

    2024-10-25 11:26 颖脉Imgtec 企业号

  • 解读大模型FP量化的解决方案

    在 LLaMA, BERT 以及 ViTs 模型上,4-bit 量化皆取得了远超 SOTA 的结果。特别是,这篇文章展示了 4-bit 量化的 LLaMA-13B 模型

    2023-11-24 11:15

  • Meta发布Llama 3.2量化模型

    近日,Meta在开源Llama 3.2的1B与3B模型后,再次为人工智能领域带来了新进展。10月24日,Meta正式推出了这两个模型量化版本,旨在进步优化

    2024-10-29 11:05

  • 深度神经网络模型量化的基本方法

    深度神经网络模型量化是深度学习领域中的种重要优化技术,旨在通过减少模型参数的精度(即从高精度浮点数如32位浮点数FP32降低到低精度整数如8位整数INT8或更低)来降

    2024-07-15 11:26

  • YOLOv8模型ONNX格式INT8量化轻松搞定

    深度学习模型量化支持深度学习模型部署框架支持的种轻量化模型与加速

    2023-07-18 09:34

  • 实战MNN之Mobilenet SSD部署

    MNN个轻量级的深度学习端侧推理引擎,核心解决深度神经网络模型在端侧推理运行问题,涵盖深度神经网络模型的优化、转换和推理。目...

    2020-12-10 18:14

  • NNCF压缩与量化YOLOv8模型与OpenVINO部署测试

    OpenVINO2023版本衍生出了个新支持工具包NNCF(Neural Network Compression Framework – 神经网络压缩框架),通过对OpenVINO IR格式模型的压缩与量化更好的提

    2023-11-20 10:46

  • TPU-MLIR量化敏感层分析,提升模型推理精度

    于浮点数模型量化模型的推理精度会有定程度的损失。当精度损失较大时,需要搜索模型中对精度影响较大的层,即敏感层,将其改

    2023-10-10 10:17 算能开发者社区 企业号