• 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动
0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
返回

电子发烧友 电子发烧友

  • 全文搜索
    • 全文搜索
    • 标题搜索
  • 全部时间
    • 全部时间
    • 1小时内
    • 1天内
    • 1周内
    • 1个月内
  • 默认排序
    • 默认排序
    • 按时间排序
大家还在搜
  • 亚马逊发布史上最大文本转语音模型BASE TTS

    亚马逊的人工智能研究团队近日宣布,他们成功开发出了迄今为止规模最大的文本转语音模型——BASE TTS。这款新模型拥有高达9.8亿个参数,不仅在规模上超越了之前的所有版本,还在能力上实现了质的飞跃。

    2024-02-20 17:04

  • 阶跃星辰发布国内首个千亿参数端到端语音模型

    近日,阶跃星辰在官方公众号上宣布了一项重大突破——推出Step-1o千亿参数端到端语音模型。该模型被誉为“国内首个千亿参数端到端语音

    2024-12-17 13:43

  • 使用PyTorch Lightning构建语音模型和解决方案

      人工智能正在推动第四次工业革命,其机器可以在超人的水平上听到、看到、理解、分析,然后做出明智的决定。然而,人工智能的有效性取决于基础模型的质量。因此,无论您是学术研究人员还是数据科学家,您都希望使用各种参数快速构建模型,并确定最有效的解决方案。

    2022-04-13 14:23

  • 能够直接翻译两种语言间语音模型

    和非语言信息)丢失,以及各子系统之间的错误叠加等问题。 2019 年,我们推出了 Translatotron,这是首款能够直接翻译两种语言间语音模型。此款直接 S2ST 模型能够有效地进行端到端训练,并拥有一个独特

    2021-10-26 15:57

  • 中国电信发布首个支持30种方言混说语音模型

    中国电信人工智能研究院(TeleAI)近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自由混说识别,打破了传统单一

    2024-05-28 09:14

  • 新品发布|启英泰伦联合启明云端推出离在线语音模型方案

    当前,生成式大模型正以颠覆性姿态重塑人机交互的边界,并逐渐向终端场景渗透。然而,云端大模型在落地终端场景时面临两大挑战:1.在真实噪声场景下容易听不清、误识别,影响交互准确性;2.云端处理冗余

    2025-03-11 14:07 启英泰伦 企业号

  • 科大讯飞创新推出长文本、长图文、长语音模型,解决落地难题

    近期,科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型,该系统融合了多元化数据源,包括海量文字、图片以及会议音频等,能为各行业场景提供专业化、精准化的答案。

    2024-04-28 09:32

  • AWE 2024:云鲸携双目视觉及语音模型技术首秀

    近日,中国家电及消费电子博览会(AWE2024)在上海新国际博览中心举办。作为与德国IFA、美国CES齐名的全球科技盛会,本届展会汇聚了国内外1000余家知名企业参展,重磅呈现各类新产品和新技术。

    2024-03-18 10:10

  • FunASR语音模型在Arm Neoverse平台上的优化实践流程

    Arm 架构在服务器领域发展势头前景看好。目前已有许多头部云服务提供商和服务器制造商推出了基于 Arm Neoverse 平台的服务器产品

    2024-02-22 13:41

  • 模型时代的新燃料:大规模拟真多风格语音合成数据集

    以大模型技术为核心驱动力的人工智能变革浪潮中,语音交互领域正迎来广阔的成长空间,应用场景持续拓宽与延伸。 其中,数据作为驱动语音模型进化的关键要素,重要性愈发凸显。丰

    2025-04-30 16:17