目前,科大讯飞官方并未提供完全开源的 TTS 引擎,但社区有一些基于讯飞 SDK 封装的非官方开源项目,可供本地或离线使用。以下是几个较为活跃的开源项目:


✅ 1. 基于 Python 的讯飞离线 TTS SDK 封装

  • 项目地址https://gitcode.com/Universal-Tool/1b02d

  • 特点

    • 使用 Python 3.7 调用讯飞离线语音合成 SDK(通过 C 接口封装)

    • 支持本地语音合成,无需联网

    • 适合对中文语音合成有本地化需求的开发者

  • 注意:需自行准备讯飞离线 SDK 的 .so.dll 文件,并配置好环境。


✅ 2. Linux 后台服务封装(Go 语言)

  • 项目地址https://github.com/imroc/ontts

  • 特点

    • 使用 Go 语言封装讯飞 Linux SDK

    • 提供后台服务模式,支持 Redis 队列

    • 适合服务端集成,支持批量合成任务。


✅ 3. 彩虹屁语音包生成器(Java)


⚠️ 注意事项:

  • 上述项目并非讯飞官方开源,而是社区开发者基于讯飞 SDK 或 API 的封装。

  • 若需商业使用,请确保遵守讯飞的使用协议,并申请合法授权。

  • 讯飞官方 SDK 需注册开发者账号并申请 AppID,部分功能为付费服务。


✅ 替代方案(完全开源):

如果你希望使用完全开源、无需注册的 TTS 方案,可考虑:

  • edge-tts:调用微软 Edge 浏览器语音合成服务,支持多语言、多音色,效果优秀。


如你有特定平台(如 Android、Windows、嵌入式)或语言(如 Python、Java)需求,我可以帮你推荐更具体的集成方案。需要吗?

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐