EmotiVoice 开源 TTS 引擎使用教程

EmotiVoice 开源 TTS 引擎使用教程EmotiVoiceEmotiVoice ????: a Multi-Voice and Prompt-Controlled TTS Engine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice 项目介绍EmotiVoice（易魔声）是一个强大的开源 TTS 引擎，支持中英文双语，包含 2000 多种

翁冰旭

2174人浏览 · 2024-08-08 07:38:33

翁冰旭 · 2024-08-08 07:38:33 发布

EmotiVoice 开源 TTS 引擎使用教程

EmotiVoiceEmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice

项目介绍

EmotiVoice（易魔声）是一个强大的开源 TTS 引擎，支持中英文双语，包含 2000 多种不同的音色以及特色的情感合成功能。它支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。EmotiVoice 提供一个易于使用的 web 界面，还有用于批量生成结果的脚本接口。

项目快速启动

环境准备

首先，确保你的机器上安装了 Docker 和 NVidia 容器工具包。如果你还没有安装，可以按照以下步骤进行安装：

安装 Docker：

sudo apt-get update
sudo apt-get install docker.io

安装 NVidia 容器工具包：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

运行 EmotiVoice

使用以下命令拉取并运行 EmotiVoice 的 Docker 镜像：

docker pull syq163/emoti-voice:latest
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

打开浏览器并导航到 http://localhost:8501，即可开始使用 EmotiVoice 的强大 TTS 功能。

应用案例和最佳实践

情感合成示例

EmotiVoice 的情感合成功能可以用于创建具有不同情感的语音，例如：

快乐：用于游戏中的角色对话或积极的用户反馈。
悲伤：用于讲述悲伤的故事或表达同情。
愤怒：用于角色扮演游戏中的敌对角色或紧急通知。

批量生成语音

使用脚本接口可以批量生成语音文件，适用于需要大量语音数据的场景，如语音导航、有声书等。

import requests

url = "http://localhost:8501/tts"
payload = {
    "text": "这是一个测试文本",
    "voice": "zh-CN-XiaoxiaoNeural",
    "emotion": "happy"
}
response = requests.post(url, json=payload)
with open("output.wav", "wb") as f:
    f.write(response.content)

典型生态项目

语音克隆

EmotiVoice 支持使用个人数据进行语音克隆，可以用于创建个性化的语音助手或定制的语音模型。

多语言支持

开发中的特性包括对更多语言的支持，如日语和韩语，这将扩大 EmotiVoice 的应用范围。

通过以上步骤和示例，你可以快速上手并充分利用 EmotiVoice 开源 TTS 引擎的功能。希望这篇教程对你有所帮助！

EmotiVoiceEmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

Kimi K2.5 怎么在 OpenClaw 里配置？3 种接入方案实测对比（2026）

上周三公司一个做客服机器人的项目要换模型，产品经理说想试试 Kimi K2.5，理由是"中文理解能力强，而且便宜"。我寻思也行，正好手头在用 OpenClaw 做日常开发，就花了两天把几种接入方案都跑了一遍。结果嘛……有惊喜也有坑，记录一下。说实话一开始我以为改个 base_url 就完事了，没想到 OpenClaw 对不同 API 协议的兼容性差异还挺大的。这篇文章就把我实测的 3 种方案摆出来