通常我们采用脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟
信号转换为数字编码。 \x0d\x0a\x0d\x0a1、什么是
采样率和采样大小(位/bit)? \x0d\x0a\x0d\x0a
频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。 \x0d\x0a\x0d\x0a2、有损和无损 \x0d\x0a\x0d\x0a根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。 \x0d\x0a\x0d\x0a3、为什么要使用音频压缩技术 \x0d\x0a\x0d\x0a要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2 Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样,在后面的文章中我们都会一一提到。有一点是可以肯定的,他们都压缩过。 \x0d\x0a\x0d\x0a4、频率与采样率的关系 \x0d\x0a\x0d\x0a采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。 \x0d\x0a\x0d\x0a因为,根据耐奎斯特采样理论,你的采样频率必须是信号最高频率的两倍。例如,音频信号的频率一般达到20Hz,因此其采样频率一般需要40Hz。 而人耳收听的范围只能到23Khz以下,所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz. \x0d\x0a\x0d\x0a5、流特征 \x0d\x0a\x0d\x0a随着网络的发展,人们对在线收听音乐提出了要求,因此也要求音频文件能够一边读一边播放,而不需要把这个文件全部读出后然后回放,这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放,正是这种特征,可以实现在线的直播,架设自己的数字广播电台成为了现实。同样一个音频文件双声道频率为什么大于单声道打开频率
双声道音频文件的频率范围要比单声道音频文件的频率范围要大,因为双声道音频文件中包含了左声道和右声道的信息,两个声道的频率范围可以叠加,从而使得双声道音频文件的总频率范围更大。
以国际标准音A-la-440HZ为准:do的频率为261.6HZ,re的频率为293.6HZ,mi的频率为329.6HZ,fa的频率为349.2HZ,sol的频率为392HZ,la的频率为440HZ,si的频率为493.8HZ。
根据计算高音比低音的比值为1.12,即高音频率是低音频率的2的1/12次方倍,比如do的频率为261.6HZ,则比它高半音的re的频率为261*2^(1/12)=293.6HZ。
这样类比下来,一个八度的音,这样一直乘下来,所得的结果刚好是2。
扩展资料
音阶指调式中的各音,从以某个音高为起点即从主音开始,按照音高次序将音符由低至高来排列,这样的音列称为音阶。1234567=CDEFGAB,这个叫七声音阶,基本音阶为C调大音阶,在钢琴上d奏时全用白键。
世界各地有许多不同的音阶,随着音乐水平的进步,音乐非常完整的理论与系统,目前世界上几乎都是用西洋的十二平均律来作为学习音乐的基础,因此我们今天所说的音阶,就是以最普遍的大音阶(大调)与小音阶(小调)为主。
频率是单位时间内完成振动的次数,是描述振动物体往复运动频繁程度的量,为了纪念德国物理学家赫兹的贡献,人们把频率的单位命名为赫兹,简称“赫”。
每个物体都有由它本身性质决定的与振幅无关的频率,叫做固有频率。频率概念不仅在力学、声学中应用,在电磁学和无线电技术中也常用。
评论列表(0条)