文章目录 系列文章0x0. 前言0x1. Supervised finetuning (SFT) 教程翻译 如何训练模型 如何对SFT checkpoint进行评测? 模型和数据 来自OPT-1.3B及其SFT变体(使用不同微调数据)的提示示例 一些参数解释和可训练的最大模型 其它0x2. 评测脚本解读0x3. 训练脚本解读 0x3.1 头文件相关解析 create_prompt_dataset解析 工具函数解析 print_rank_0 to_device save_hf_format set_random_seed get_all_reduce_mean get_optimizer_grouped_parameters save_zero_three_model load_hf_tokenizer convert_linear_layer_to_lora convert_lora_to_li
2023-07-06 15:31
对于所有“基座”(Base)模型,–template 参数可以是 default, alpaca, vicuna 等任意值。但“对话”(Chat)模型请务必使用对应的模板。
2024-03-13 14:56
e-Chat是首个带有内置加密货币钱包的分散式多任务通讯平台。那么它与现有其它通讯应用程序有什么区别呢,尤其是与Instagram?
2018-06-25 15:47
先来看一个 Demo:在 Demo 中分配堆外内存用的是 allocateDirect 方法,但其内部调用的是 DirectByteBuffer,换言之,DirectByteBuffer 才是实际操作堆外内存的类,因此,本场 Chat 将围绕 DirectByteBuffer 展开。
2018-07-01 10:19
我的家用电脑主要使用桌面 Linux。我也有多台 Linux 服务器用于托管网站以及开源软件,如 Nextcloud、Discourse、Ghost、Rocket Chat 等。
2020-09-30 14:48
( GLM-Edge-1.5B-Chat,GLM-Edge-4B-Chat,GLM-Edge-V-2B,GLM-Edge-V-5B)。其中,1.5B / 2B模型主要面向手机、车机等平台, 4B / 5B 模型主要面向PC等平台。
2024-12-09 16:12
树莓派Zero W为这款被称为“终极日常黑客工具”的便携式计算设备赋能。你可以将Beepberry用作简单的寻呼机,运行iMessage、WhatsApp等,也可以用作可编程的cyberdeck设备。当然,它可以运行任何在树莓派上运行的Linux应用程序。
2023-07-03 14:48
当我们展望未来的时候,通过Chat GPT Plus、Microsoft GPT4等新应用程序,AI和技术领域已经获得了指数级的流行。很明显,编程将继续在塑造技术领域方面发挥重要作用。以下是2023年3月应该学习的三种最流行的编程语言。
2023-03-28 15:31
大模型呈现爆发式的增长,特别是 2022 年 11 月 ChatGPT(Chat Generative Pre-trained Transformer)发布后,更是引起了全世界的广泛关注。用户可以
2023-12-07 11:40