电子发烧友

技术资料
元器件/IC

搜索历史

清空

搜索热词

搜索历史

清空

搜索热词

全文搜索
- 全文搜索
- 标题搜索
全部时间
- 全部时间
- 1小时内
- 1天内
- 1周内
- 1个月内
默认排序
- 默认排序
- 按时间排序

大家还在搜

使用HMM实现声调语音模型的研究说明

针对声韵母相同但声调不同的近音字识别问题和声韵母及声调都相同的同音字识别问题，提出在语音模型和语言模型中分别引入声调和字转移概率，以提高近音字和同音字的识别率。首先将声调划分为 5 种表现形式添加到

2020-05-06 08:00
科大讯飞发布星火语音大模型

科大讯飞行业资讯

2024-01-31 09:17
亚马逊发布史上最大文本转语音模型BASE TTS

亚马逊的人工智能研究团队近日宣布，他们成功开发出了迄今为止规模最大的文本转语音模型——BASE TTS。这款新模型拥有高达9.8亿个参数，不仅在规模上超越了之前的所有版本，还在能力上实现了质的飞跃。

2024-02-20 17:04
阶跃星辰发布国内首个千亿参数端到端语音大模型

近日，阶跃星辰在官方公众号上宣布了一项重大突破——推出Step-1o千亿参数端到端语音大模型。该模型被誉为“国内首个千亿参数端到端语音大

2024-12-17 13:43
使用PyTorch Lightning构建语音模型和解决方案

　　人工智能正在推动第四次工业革命，其机器可以在超人的水平上听到、看到、理解、分析，然后做出明智的决定。然而，人工智能的有效性取决于基础模型的质量。因此，无论您是学术研究人员还是数据科学家，您都希望使用各种参数快速构建模型，并确定最有效的解决方案。

2022-04-13 14:23
端到端语音交互数据精准赋能语音大模型进阶

在语音大模型从“能识别”向“懂语境”跨越的关键阶段，高质量场景化语音数据已成为制约技术突破的核心瓶颈。传统语音识别数据集采用孤立标注，在

2025-09-11 17:17
能够直接翻译两种语言间语音的模型

和非语言信息）丢失，以及各子系统之间的错误叠加等问题。 2019 年，我们推出了 Translatotron，这是首款能够直接翻译两种语言间语音的模型。此款直接 S2ST 模型能够有效地进行端到端训练，并拥有一个独特

2021-10-26 15:57
中国电信发布首个支持30种方言混说语音大模型

中国电信人工智能研究院（TeleAI）近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自由混说识别，打破了传统单一

2024-05-28 09:14
新品发布|启英泰伦联合启明云端推出离在线语音大模型方案

当前，生成式大模型正以颠覆性姿态重塑人机交互的边界，并逐渐向终端场景渗透。然而，云端大模型在落地终端场景时面临两大挑战：1.在真实噪声场景下容易听不清、误识别，影响交互准确性；2.云端处理冗余

2025-03-11 14:07 启英泰伦企业号
科大讯飞创新推出长文本、长图文、长语音大模型，解决落地难题

近期，科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型，该系统融合了多元化数据源，包括海量文字、图片以及会议音频等，能为各行业场景提供专业化、精准化的答案。

2024-04-28 09:32