声音信号的数字化

过程

  • 取样
    • 声音
      • 声波频率范围为声音的带宽
      • 全频带声音带宽——20Hz-20KHz
      • 言语/语音——300-3400Hz
      • 音乐的取样频率——40KHz
      • 语音的取样频率——8-16KHz
  • 量化(A/D转换)
    • 量化精度越高,声音的保真度越好,噪音越低
  • 编码
  1. 取样要取声音,而声音有最大的范围,因此你要取这个声音就必须要在最大范围开始取。因此规定取样频率都是原最大频率范围的两倍
  2. 量化就是模拟转数字的操作,声音的保真度和噪音成正比.自然是转的越多,越细,质量越好

波形声音获取设备

  • 麦克风——将声波转换为电信号
  • 声卡——功能
    • 波形声音的获取与数字化
    • 声音的重建与播放
    • MIDI声音的输入
    • MIDI声音的合成与播放
  • 声卡——核心
    • 以数字信号处理器(DSP)为核心

麦克风是我们最常见的获取声音的设备。声卡同样也是非常重要的声音获取设备。
声卡它的功能其实就是把电脑里的声音转到耳机音箱输出给我们人听。而MIDI是一种计算机能理解的乐谱,它能根据这个写出对应音乐。音乐质量受声卡档次影响。
当然声卡中最重要的东西就是数字信号处理器了,它就好比水晶一样重要,没有它,啥都处理不了了

声音重建

过程

  • 解码
  • 数模(D/A)转换
  • 插值

音箱

  • 分类
    • 普通音箱——接收模拟信号
    • 数字音箱——接收数字信号
  • 既然有声音数字化的过程,那么自然也有声音模拟化回去的过程

  • 解码就对应了编码的操作,有编就有解嘛

  • 数模转换(D/A)对应了模数转换(A/D)

  • 插值对应了取样,你取了我还得给你填上

  • 普通音箱是相对便宜的音箱,接收的信号也需要转换,那么一经过转换,质量就会差许多了。

  • 而数字音箱是能直接接收数字信号的,不需要转换,所以质量也高。

计算机合成声音

分类

  • 音乐合成
    • MIDI
      • 优点——数据量极小,比CD或MP3都小
      • 缺点——人的语音模仿不出来
  • 语音合成
    • 文语转换TTS

计算机合成声音分为音乐和我们人的说话声音.
音乐通过一种MIDI文件,就是电脑认识的曲谱,它非常小,但却能包揽几乎所有的乐器声音,但它无法模仿语音,这也是缺点所在。
而语音像那些变声器就是通过计算机合成的。为了让计算机模仿人的发声,目前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换。就是给计算机一段一段文字,让它读
在这里插入图片描述

声音的码率(速度),数据量的计算

码率=取样频率X量化位数X声道数/压缩倍数
码率=速度X时间

数字音频编码格式

未经压缩

  • CD
    • 取样频率为44.1KHz
    • 16位量化位数
  • WAV
    同CD

有损压缩

  • MP3
  • WMA

无损压缩

  • FLAC
  • APE

我们平时所看见得各种各样的格式,其中有损压缩的MP3是我们较为常见的,WMA就是微软的媒体音频,还有就是无损压缩的FLAC,就是无损音频压缩编码

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐