卷积神经网络的层级结构 卷积神经网络的常用框架
2020-12-29 06:16
在这个高度依赖图像的时代,英特尔® FPGA 可利用 OpenCL™ 平台满足巨大的图像处 理和分类需求简介从 2015 年到 2020 年,互联网视频流量将增长四倍。[1] 鉴于可视数据的爆炸性增长, 找到有效的图像排序、分类和识别方法变得至关重要。卷积神经网络(CNNs)是一种基 于人脑功能的机器学习方法,通常用于图像分析。软件可将图像分为多个部分(通常采 取重叠操作),然后通过分析图像形成可视空间的整体示意图。该流程需要采用多个复 杂的数学运算步骤以分析、比较和识别图像,同时保持较低的错误率。开发人员使用计算密集型算法创建 CNN,并在各种平台上对其进行实施。本白皮书介绍 了 CNN 在英特尔® Stratix® 10 FPGA 上的实施方案。对于大批量任务,该方案能以每瓦 每秒 70 幅图像的速度每秒处理 14,000 幅图像;对于批量大小为 1 的任务,该方案能 以每瓦每秒 18 幅图像的速度每秒处理 3,015 幅图像。† 这些数字表明,英特尔 Stratix 10 FPGA 在处理大批量任务时完全可媲美其他高性能计算(HPC)器件(如 GPU), 在处理小批量任务时则比其他器件更快。
2019-07-17 06:34
专门针对Arm嵌入式设备优化的神经网络推理引擎Tengine + HCL,不同人群的量身定制
2021-01-15 08:00