音频帧或样本包含该特定时间点的幅度(响度)信息。为了产生声音,依次播放成千上万帧以产生频率。
对于CD质量的音频或未压缩的波形音频,每秒大约有44,100帧/样本。这些帧中的每一个都包含16位分辨率,从而可以相当精确地表示声级。另外,由于CD音频是立体声的,所以实际上有两倍多的信息,左声道16位,右声道16位。
当您在python中使用声音模块获取框架时,它将作为一系列十六进制字符返回:
- 8位单声道信号的一个字符。
- 8位立体声的两个字符。
- 16位单声道的两个字符。
- 16位立体声的四个字符。
为了转换和比较这些值,您必须首先使用python wave模块的功能来检查位深度和通道数。否则,您将比较不匹配的质量设置。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)