写在前面:笔者这段时间工作太忙,身心俱疲,博客停更了一段时间,现在重新捡起来。本文主要解读 OneFlow 框架的第二种 Softmax 源码实现细节,即 block 级别的 Softmax。
2024-01-08 09:26
写在前面 :本文将对 Faster Transformer v2.1 版本源码进行解读,重点介绍该版本基于 v1.0 和 v2.0 所做的优化内容,剖析源码作者优化意图。 1 v2.1 版本发布背景
2023-09-19 11:39
当前,开源在科技进步和产业发展中发挥着越来越重要的作用,OpenAtom OpenHarmony(简称“OpenHarmony”)赋予了开发者孕育创新的种子,也为数字化产业发展开辟了一片土壤。深开鸿
2022-09-02 10:05
写在前面:近来笔者偶然间接触了一个深度学习框架 OneFlow,所以这段时间主要在阅读 OneFlow 框架的 cuda 源码。官方源码基于不同场景分三种方式实现 Softmax,本文主要介绍其中一种的实现过程,即 Warp 级别 Softmax,适用于矩阵宽度不
2024-01-08 09:24
解读的内容仅限 Faster Transformer v1.0 版本,更高版本的源码将在后续文章中继续解读。
2023-09-08 10:20
近年来,随着国内信息化市场的逐步成长,趋向成熟,以 OpenAtom OpenHarmony(简称“OpenHarmony”)为基座,以操作系统为代表的产业不断吸引了众多资源投入,汇聚了众多
2022-06-02 08:55
本项目的场景是智能家居。通过 OpenHarmony 源码与 Hi3861 开发板进行智能门锁的项目开发。最后可以通过舵机进行开关锁与通过手机的数字管家进行密码解锁。
2023-04-10 11:05
按照官网教程导入OpenHarmony源码
2022-04-21 07:54