语音超分辨率阿里通义实验室开源ClearerVoice-Studio新功能

2️⃣ 更多音频格式支持：为了方便大家的音频输入，ClearerVoice-Studio 现支持多种音频格式，包括 "wav", "aac", "ac3", "aiff", "flac", "m4a", "mp3", "ogg", "opus", "wma", "webm" 等，同时兼容单声道和立体声，并支持 16 位或 32 位精度。无需再手动转换音频格式，极大地方便您的处理体验。它的目标是恢

eddyzhao912

496人浏览 · 2025-01-13 10:51:32

eddyzhao912 · 2025-01-13 10:51:32 发布

ClearerVoice-Studio团队为大家带来了两项更新，希望提升您的音频处理体验：

1️⃣ 语音超分辨率（Speech Super-Resolution）：语音超分辨率，又称带宽扩展（Bandwidth Expansion），是一种通过算法将低分辨率语音信号转换为高分辨率信号的技术。它的目标是恢复音频信号中丢失的高频部分，从而提升语音的感知质量和自然度，使其听起来更加清晰和细腻。

基于卓越的MossFormer2模型和HiFi-GAN框架，ClearerVoice-Studio全新支持语音超分辨率，将低分辨率音频转换为高分辨率音频（采样率 48kHz），瞬间提升您的语音感知质量！

2️⃣ 更多音频格式支持：为了方便大家的音频输入，ClearerVoice-Studio 现支持多种音频格式，包括 "wav", "aac", "ac3", "aiff", "flac", "m4a", "mp3", "ogg", "opus", "wma", "webm" 等，同时兼容单声道和立体声，并支持 16 位或 32 位精度。无需再手动转换音频格式，极大地方便您的处理体验。

快来升级 ClearerVoice-Studio （GitHub 仓库： https://github.com/modelscope/ClearerVoice-Studio ），体验一下新功能吧！谢谢大家的支持！

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

cover

基于GD32的直流无刷电机控制算法实现和验证

DAMO开发者矩阵

cover

零基础进阶大模型实战高手：这本书带你掌握LLM全栈开发技术，5步成为AI工程师

DAMO开发者矩阵

cover

Agent AI与Agentic AI：概念辨析、技术落地与发展瓶颈

DAMO开发者矩阵

所有评论(0)

查看更多评论

eddyzhao912

已为社区贡献1条内容