• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • DeepSpeed Chat中监督指令微调过程的源码

    文章目录   系列文章0x0. 前言0x1. Supervised finetuning (SFT) 教程翻译 如何训练模型 如何对SFT checkpoint进行评测? 模型和数据 来自OPT-1.3B及其SFT变体(使用不同微调数据)的提示示例 一些参数解释和可训练的最大模型 其它0x2. 评测脚本解读0x3. 训练脚本解读 0x3.1 头文件相关解析 create_prompt_dataset解析 工具函数解析 print_rank_0 to_device save_hf_format set_random_seed get_all_reduce_mean get_optimizer_grouped_parameters save_zero_three_model load_hf_tokenizer convert_linear_layer_to_lora convert_lora_to_li

    2023-07-06 15:31

  • 大模型微调开源项目全流程

    对于所有“基座”(Base)模型,–template 参数可以是 default, alpaca, vicuna 等任意值。但“对话”(Chat)模型请务必使用对应的模板。

    2024-03-13 14:56

  • 区块链最新的应用程序你知道吗?

    e-Chat是首个带有内置加密货币钱包的分散式多任务通讯平台。那么它与现有其它通讯应用程序有什么区别呢,尤其是与Instagram?

    2018-06-25 15:47

  • Java开发者必须了解的堆外内存技术

    先来看一个 Demo:在 Demo 中分配堆外内存用的是 allocateDirect 方法,但其内部调用的是 DirectByteBuffer,换言之,DirectByteBuffer 才是实际操作堆外内存的类,因此,本场 Chat 将围绕 DirectByteBuffer 展开。

    2018-07-01 10:19

  • Linux终端中连接WiFi的方法

    我的家用电脑主要使用桌面 Linux。我也有多台 Linux 服务器用于托管网站以及开源软件,如 Nextcloud、Discourse、Ghost、Rocket Chat 等。

    2020-09-30 14:48

  • 利用OpenVINO部署GLM-Edge系列SLM模型

    ( GLM-Edge-1.5B-Chat,GLM-Edge-4B-Chat,GLM-Edge-V-2B,GLM-Edge-V-5B)。其中,1.5B / 2B模型主要面向手机、车机等平台, 4B / 5B 模型主要面向PC等平台。

    2024-12-09 16:12

  • 以Beepberry应对黑莓短缺

    树莓派Zero W为这款被称为“终极日常黑客工具”的便携式计算设备赋能。你可以将Beepberry用作简单的寻呼机,运行iMessage、WhatsApp等,也可以用作可编程的cyberdeck设备。当然,它可以运行任何在树莓派上运行的Linux应用程序。

    2023-07-03 14:48

  • 2023年要学习的3大编程语言

    当我们展望未来的时候,通过Chat GPT Plus、Microsoft GPT4等新应用程序,AI和技术领域已经获得了指数级的流行。很明显,编程将继续在塑造技术领域方面发挥重要作用。以下是2023年3月应该学习的三种最流行的编程语言。

    2023-03-28 15:31

  • 大规模语言模型的基本概念、发展历程和构建流程

    大模型呈现爆发式的增长,特别是 2022 年 11 月 ChatGPT(Chat Generative Pre-trained Transformer)发布后,更是引起了全世界的广泛关注。用户可以

    2023-12-07 11:40