Android 使用开源项目Sherpa的关键词检测（语音唤醒）

sherpa是一个基于下一代 Kaldi 和 onnxruntime 的开源项目，专注于语音识别、文本转语音、说话人识别和语音活动检测（VAD）等功能。该项目支持在没有互联网连接的情况下本地运行，适用于嵌入式系统、Android、iOS、Raspberry Pi、RISC-V 和 x86_64 服务器等多种平台。现在很多语音识别都要收费了，之前用过免费的云知声也收费了，之前只使用过它的TTS，还

wqjcsdn

4587人浏览 · 2025-01-09 15:32:18

wqjcsdn · 2025-01-09 15:32:18 发布

sherpa是一个基于下一代 Kaldi 和 onnxruntime 的开源项目，专注于语音识别、文本转语音、说话人识别和语音活动检测（VAD）等功能。该项目支持在没有互联网连接的情况下本地运行，适用于嵌入式系统、Android、iOS、Raspberry Pi、RISC-V 和 x86_64 服务器等多种平台。支持流式语音处理。

https://github.com/k2-fsa/sherpa-onnx

现在很多语音识别都要收费了，之前用过免费的云知声也收费了，之前只使用过它的TTS，还有免费的离线sdk，现在要做语音唤醒(关键词检测)。试过pocketshpinx，效果很差。偶然看到sherpa,试了试效果不错。但是官方demo没有完整代码（不是没有模型，就是没有so，jar）

关键就这三个部分jar、assets、jni。然后就是自定义关键词

参考：

Pre-trained models — sherpa 1.3 documentation

主要就是php，会提示缺少库，安装就是了，官方的提示有点坑是这样的

sherpa-onnx-cli text2token \
  --tokens sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01/tokens.txt \
  --tokens-type ppinyin \
  keywords_raw.txt keywords.txt

把 tokens.txt 和 keywords_raw.txt都放在命令行位置下就好

sherpa-onnx-cli text2token --tokens tokens.txt --tokens-type ppinyin  
keywords_raw.txt keywords.txt

代码中主要就是配置和最后录音转text

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

2025-2026年国产PCB厂家综合实力排行推荐：TOP5专业评测新能源储能散热方案注意事项

核心考察ISO9001、IATF16949等管理体系认证，UL、RoHS、REACH等产品安全与环保认证，以及是否具备车规级、工业级的可靠性测试能力（如冷热冲击、振动测试等）。适合对高可靠性、高精密、高安全有严苛要求的客户，尤其适用于新能源汽车及储能、工业机器人、低空经济、无人机、自动驾驶配套、智能装备、光伏逆变、高压电源等新兴领域。评估锚点包括服务的主要行业（如汽车照明、新能源储能、工业机器人、