HeyGem 数字人系统是利用先进的人工智能技术,为用户提供了一个可以定制自己AI数字人的生成平台。HeyGem作为一款可本地部署的开源AI数字人生成系统,主要特点包括语音识别、语音合成和核心AI引擎,这些功能都是通过Docker容器进行部署的。为了方便用户,HeyGem提供了两种部署方式:手动拉取镜像和一键自动化部署。

项目架构

前端: 项目前端使用Vue3和Electron框架进行开发,这使得界面友好且功能丰富。
后端: 使用SpringBoot框架构建,确保了后端服务的稳定性和高效性。

项目功能

1.语音识别: 通过语音识别引擎,用户可以输入语音指令,数字人能够理解和执行这些指令。
2.语音合成: 语音合成模块能够将文本转换为自然流畅的语音输出。
3.核心AI引擎: 提供了数字人的智能交互能力,包括理解用户意图、生成回复等。
4.混剪配套设施: 提供了视频和音频的混剪功能,增强了数字人的多媒体处理能力。
5.数字人换背景: 允许用户更换数字人的背景图片,增加了使用的灵活性和趣味性。

项目优势

1.开源免费: HeyGem是一个完全开源且免费的项目,任何人都可以自由地使用和修改。
2.易部署: 提供了一键自动化部署方案,降低了使用门槛,即使是新手也能快速上手。
3.高性能: 推荐使用高性能的硬件配置,以确保数字人服务的流畅运行。
4.定制化: 开发者可以Fork项目并进行自定义开发,满足特定需求。

适用人群

开发者: 对于想要自定义更多功能的开发者,HeyGem提供了丰富的开发资源和文档支持。
AI爱好者: 对人工智能技术感兴趣的用户可以通过HeyGem体验和探索AI的潜力。
内容创作者: 可以利用HeyGem的数字人进行内容创作,如视频制作、直播等。

开源地址

https://gitee.com/Martinkeep/HenGem

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐