​ ClearerVoice-Studio团队为大家带来了两项更新,希望提升您的音频处理体验:

1️⃣ 语音超分辨率(Speech Super-Resolution):语音超分辨率,又称带宽扩展(Bandwidth Expansion),是一种通过算法将低分辨率语音信号转换为高分辨率信号的技术。它的目标是恢复音频信号中丢失的高频部分,从而提升语音的感知质量和自然度,使其听起来更加清晰和细腻。

基于卓越的MossFormer2模型和HiFi-GAN框架,ClearerVoice-Studio全新支持语音超分辨率,将低分辨率音频转换为高分辨率音频(采样率 48kHz),瞬间提升您的语音感知质量!

2️⃣ 更多音频格式支持: 为了方便大家的音频输入,ClearerVoice-Studio 现支持多种音频格式,包括 "wav", "aac", "ac3", "aiff", "flac", "m4a", "mp3", "ogg", "opus", "wma", "webm" 等,同时兼容单声道和立体声,并支持 16 位或 32 位精度。无需再手动转换音频格式,极大地方便您的处理体验。

快来升级 ClearerVoice-Studio (GitHub 仓库: https://github.com/modelscope/ClearerVoice-Studio ),体验一下新功能吧!谢谢大家的支持! ​

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐