• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • 探索SFT训练策略对性能的影响

    大模型混合多种能力项数据进行微调时,会呈现高资源冲突,低资源增益的现象。我们提出的DMT策略通过在第一阶段微调特定能力数据,在第二阶段微调通用数据+少量的特定能力数据。

    2023-10-26 14:14

  • 三星SFT青少年探馆进博会:大大舞台点亮小小梦想

    for Tomorrow探知未来第十届全国青年科普创新实验暨作品大赛(SFT科普创新大赛)中学组特等奖学生,以及三星探知未来科技女性培养计划(STEM GIRLS)优秀学生组成的“Solve for Tomorrow走进进博会”代表团。 “三星Solve for Tomorrow走进进博会”代表团 这些年轻的

    2024-11-20 09:24

  • SFT-1150ZE静电复印机故障自动诊断

    当复印机出现故障时,在其操作板上,会显出相关故障代码,机器也会立即停止工作。故障代码如表5-53

    2006-04-17 23:11

  • 华为提出Sorted LLaMA:SoFT代替SFT,训练多合一大语言模型

    而这一切的背后,是一项名为Sorted Fine-Tuning(SoFT)的新训练技术。SoFT让我们可以在一个训练周期内产出多个子模型,无需任何额外的预训练步骤。此外,这项技术还揭示了模型的中间层也能够产生高质量的输出,这一点在之前的研究中常常被忽视。

    2023-09-26 16:26

  • 中软国际参加首期百度智能云文心千帆大模型SFT微调能力实训营

    2023年7月15日,中软国际受邀在百度大厦参加了首期百度智能云文心千帆大模型SFT微调能力实训营。此次培训旨在提高合作伙伴对大模型的理解和落地能力,更好地帮助客户落地大模型和相关应用,推动行业

    2023-07-17 18:15

  • 对稀疏傅里叶变换并行算法研究并在FPGA上设计实现

    提出了一种基于最优搜索的稀疏傅里叶变换(SFT)的并行实现设计。首先将输入信号分为并行N组,分别进行快速傅里叶变换(FFT),实现信号频率分量的取模处理,然后通过排序搜索获得。经验证,相较于FFTW

    2017-11-15 13:25

  • 聊聊小公司如何做大模型

    通过SFT、DPO、RLHF等技术训练了领域写作模型。实测下来,在该领域写作上,强于国内大多数的闭源模型。

    2024-02-21 11:28

  • 讲一讲ChatGPT的技术细节

    通过人工标注等方式,使用监督学习的模式对GPT3模型(对这个是chatGPT模型的base)进行初步训练(有监督微调,SFT),从而得到一个初步能够理解语言的模型,尤其是prompt的模式。

    2023-01-03 17:38

  • DeepSpeed Chat中监督指令微调过程的源码

    文章目录   系列文章0x0. 前言0x1. Supervised finetuning (SFT) 教程翻译 如何训练模型 如何对SFT checkpoint进行评测? 模型和数据 来自

    2023-07-06 15:31

  • 创新“小智慧”解决防疫“大问题”

    成为我国公共卫生部门关注的问题,也成为了三星“Solve for Tomorrow 探知未来”第七届全国青年科普创新实验暨作品大赛(以下简称SFT大赛)参赛选手重点关注的课题之一。 第七届三星SFT大赛决赛作品——智能防疫巡检消杀机器人

    2021-07-28 11:04