WSJ0数据集是一个用于语音识别研究的广泛使用的数据集。WSJ代表"Wall Street Journal",这个数据集由来自华尔街日报的英语语音录音组成。它是由美国国家标准与技术研究院(NIST)赞助的多个语音识别项目的一部分。

WSJ0数据集包含大约80小时的英语语音录音,其中包括约300小时的训练数据和约20小时的测试数据。这些录音是由约80名说话者以不同的口音和语速进行录制的。录音涵盖了各种新闻和非新闻主题,包括讲话、采访和演讲等。

WSJ0数据集不仅仅包含原始语音录音,还包括与每个录音相关的转录文本。这些转录文本被用作训练语音识别系统的标签,以帮助系统学习将语音转换为文本。

这个数据集在语音识别领域的研究中非常受欢迎,因为它提供了一个广泛的语音样本,可以用于训练和评估不同的语音识别模型。它也被用作评估语音识别系统性能的基准数据集,因为它是一个相对较大和多样化的数据集。

获取方法:

方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网

方法2:关注公众号,回复WSJ0 LDC语料小助手icon-default.png?t=N7T8https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg ​​​​​​​

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐