EmotiVoice 开源 TTS 引擎使用教程

EmotiVoiceEmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice

项目介绍

EmotiVoice(易魔声)是一个强大的开源 TTS 引擎,支持中英文双语,包含 2000 多种不同的音色以及特色的情感合成功能。它支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。EmotiVoice 提供一个易于使用的 web 界面,还有用于批量生成结果的脚本接口。

项目快速启动

环境准备

首先,确保你的机器上安装了 Docker 和 NVidia 容器工具包。如果你还没有安装,可以按照以下步骤进行安装:

  1. 安装 Docker

    sudo apt-get update
    sudo apt-get install docker.io
    
  2. 安装 NVidia 容器工具包

    distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
    curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
    curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
    sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
    sudo systemctl restart docker
    

运行 EmotiVoice

使用以下命令拉取并运行 EmotiVoice 的 Docker 镜像:

docker pull syq163/emoti-voice:latest
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

打开浏览器并导航到 http://localhost:8501,即可开始使用 EmotiVoice 的强大 TTS 功能。

应用案例和最佳实践

情感合成示例

EmotiVoice 的情感合成功能可以用于创建具有不同情感的语音,例如:

  • 快乐:用于游戏中的角色对话或积极的用户反馈。
  • 悲伤:用于讲述悲伤的故事或表达同情。
  • 愤怒:用于角色扮演游戏中的敌对角色或紧急通知。

批量生成语音

使用脚本接口可以批量生成语音文件,适用于需要大量语音数据的场景,如语音导航、有声书等。

import requests

url = "http://localhost:8501/tts"
payload = {
    "text": "这是一个测试文本",
    "voice": "zh-CN-XiaoxiaoNeural",
    "emotion": "happy"
}
response = requests.post(url, json=payload)
with open("output.wav", "wb") as f:
    f.write(response.content)

典型生态项目

语音克隆

EmotiVoice 支持使用个人数据进行语音克隆,可以用于创建个性化的语音助手或定制的语音模型。

多语言支持

开发中的特性包括对更多语言的支持,如日语和韩语,这将扩大 EmotiVoice 的应用范围。

通过以上步骤和示例,你可以快速上手并充分利用 EmotiVoice 开源 TTS 引擎的功能。希望这篇教程对你有所帮助!

EmotiVoiceEmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐