电子发烧友

技术资料
元器件/IC

搜索历史

清空

搜索热词

搜索历史

清空

搜索热词

全文搜索
- 全文搜索
- 标题搜索
全部时间
- 全部时间
- 1小时内
- 1天内
- 1周内
- 1个月内
默认排序
- 默认排序
- 按时间排序

大家还在搜

亚马逊发布史上最大文本转语音模型BASE TTS

亚马逊的人工智能研究团队近日宣布，他们成功开发出了迄今为止规模最大的文本转语音模型——BASE TTS。这款新模型拥有高达9.8亿个参数，不仅在规模上超越了之前的所有版本，还在能力上实现了质的飞跃。

2024-02-20 17:04
阶跃星辰发布国内首个千亿参数端到端语音大模型

近日，阶跃星辰在官方公众号上宣布了一项重大突破——推出Step-1o千亿参数端到端语音大模型。该模型被誉为“国内首个千亿参数端到端语音大

2024-12-17 13:43
使用PyTorch Lightning构建语音模型和解决方案

　　人工智能正在推动第四次工业革命，其机器可以在超人的水平上听到、看到、理解、分析，然后做出明智的决定。然而，人工智能的有效性取决于基础模型的质量。因此，无论您是学术研究人员还是数据科学家，您都希望使用各种参数快速构建模型，并确定最有效的解决方案。

2022-04-13 14:23
端到端语音交互数据精准赋能语音大模型进阶

在语音大模型从“能识别”向“懂语境”跨越的关键阶段，高质量场景化语音数据已成为制约技术突破的核心瓶颈。传统语音识别数据集采用孤立标注，在

2025-09-11 17:17
能够直接翻译两种语言间语音的模型

和非语言信息）丢失，以及各子系统之间的错误叠加等问题。 2019 年，我们推出了 Translatotron，这是首款能够直接翻译两种语言间语音的模型。此款直接 S2ST 模型能够有效地进行端到端训练，并拥有一个独特

2021-10-26 15:57
中国电信发布首个支持30种方言混说语音大模型

中国电信人工智能研究院（TeleAI）近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自由混说识别，打破了传统单一

2024-05-28 09:14
新品发布|启英泰伦联合启明云端推出离在线语音大模型方案

当前，生成式大模型正以颠覆性姿态重塑人机交互的边界，并逐渐向终端场景渗透。然而，云端大模型在落地终端场景时面临两大挑战：1.在真实噪声场景下容易听不清、误识别，影响交互准确性；2.云端处理冗余

2025-03-11 14:07 启英泰伦企业号
科大讯飞创新推出长文本、长图文、长语音大模型，解决落地难题

近期，科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型，该系统融合了多元化数据源，包括海量文字、图片以及会议音频等，能为各行业场景提供专业化、精准化的答案。

2024-04-28 09:32
AWE 2024：云鲸携双目视觉及语音大模型技术首秀

近日，中国家电及消费电子博览会（AWE2024）在上海新国际博览中心举办。作为与德国IFA、美国CES齐名的全球科技盛会，本届展会汇聚了国内外1000余家知名企业参展，重磅呈现各类新产品和新技术。

2024-03-18 10:10
FunASR语音大模型在Arm Neoverse平台上的优化实践流程

Arm 架构在服务器领域发展势头前景看好。目前已有许多头部云服务提供商和服务器制造商推出了基于 Arm Neoverse 平台的服务器产品

2024-02-22 13:41