语音芯片的语音芯片概述

语音芯片的语音芯片概述,第1张

芯片(chip)就是半导体元件产品的统称。是集成电路(IC, integrated circuit)的载体,由晶圆分割而成。

硅片是一块很小的硅,内含集成电路,它是电脑或者其他电子设备的一部分。 语音芯片定义:将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。

根据语音芯片的输出方式分为两大类,一种是PWM输出方式,一种是DAC输出方式,PWM输出音量不可连续可调,不能接普通功放,目前市面上大多数语音芯片是PWM输出方式。另外一种是DAC经内部EQ放大,该语音芯片声音连续可调,可数字控制调节,可外接功放。

普通语音芯片放音功能实质上是一个DAC过程,而ADC过程资料是由电脑完成,其中包括对语音信号的采样、压缩、EQ等处理。

录音芯片包括ADC和DAC两个过程,都是由芯片本身完成的,包括语音数据的采集、分析、压缩、存储、播放等步骤。

ADC=Analog Digital Change 模数转换

DAC= Digital Analog Change 数模转换

音质的优劣取决于ADC和DAC位数的多少。例如:20秒到 340秒,最低从10秒到340秒.语音芯片直观的从名称上来看,就是与语音有关的芯片,语音就是存储的电子声音,凡是能发出声音的芯片,就是语音芯片,俗称声音芯片,英文准确些来说应该是Voice IC.  在语音芯片的大家庭中,根据声音的类型不同可分为(Speech IC)和(Music IC)两种.这儿应该算是语音芯片专业的区分方法. 掩膜生产。掩膜生产通俗的说就是先将声音烧到芯片里,然后再进行封装,一般有量的要求。

otp生产。所谓otp的意思是指的一次性烧录。先把芯片封装好,再借用软件烧进去声音。

语音芯片有根据IC本身的物理结构的多个通道(同时发出多个通道的声音)可分为多种类型:

一, 单通道的:

1, 单通道的语音IC(Speech IC)(这种语音芯片不支持音乐IC音乐存储方式)常见的语音IC是单通道的语音芯片,DKC020-OTP20秒和DKA010动物叫声是最典型的单通道语音芯片了,

2, 单通道的音乐IC(Music IC),同一单位时间内只能发出一种音乐的音乐IC, 电子声音文件是只有一个通道的.Mid后缀文件.

常说的单音片,是一种最基本的音乐IC,由一定时间内音符输出的多少,决定了单音片的效果,有64音符多,128音符等等. 单音片应用场合广,价格极其低廉,最常见的有单音片有生日快乐贺卡单音片.典型的有DK20S等

严格的说,单通道的音乐IC和单音片的两者结构是不相同的

二, 2通道:

1, 2通道的语音IC, 2通道和多通道的语音芯片,实际应用中语音播放时一般会按规定固定在某一通道内进行声音的播放(等同于单通道),但是这类产品比单通道的语音IC(Speech ic)成本要高,价格会高些,语音芯片厂家在设计时为了平衡产品价格和应用,一般来说,功能支持和声音效果方面都会做得更完美一些.

这种结构也许是因为产品和方案实际应用领域和价格所决定的, 语音芯片输出一般都是单通道的声音输出,支持立体声的产品很少, 要高端一些的产品就要选MP3主控芯片之类的方案了

2, 2通道的音乐芯片, 通俗叫法是双音片(Music With Dual Tone IC),顾名思义,同一单位时间内二个通道都可以发出音乐的音乐IC. 电子声音源文件一般为.Mid的二通道文件.常见的圣诞系列音乐IC如:.

这里得多补充两句,市面上还有一个叫melody的音乐芯片,她是个什么定义呢?简单的来说,比单音片的效果要好比和弦音乐芯片的效果要差的一种音乐芯片,所以双音片也有被叫成是melody音乐芯片,melody结构应该来说是一种更高级的单音片,或者可以说是二倍效果的单音片.

三, 4通道,8通道或以上:

三通道以上的声音.又称为和弦音乐.常说的4和弦音乐IC就是指4通道的音乐IC,例如DKC040...

一般多通道的语音芯片都是同时支持音乐IC(Music IC)和语音IC(Speech IC)功能的.

(a)“语音芯片”介绍:

(1)语音信号的量化

采样率(f)、位数(n)、波特率(T)

采样:将语音模拟信号转化成数字信号。

采样率:每秒采样的个数(byte)。

波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second

采样位数指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。

(2)采样率

奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。

嗓音的频带宽度为20~20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。

一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。而DKC系列语音芯片采样可以做到22K。

在应用单片机的过程中,采样越高,定时器中断速度越快,会影响到其他信号的监控和检测,所以要综合考虑。

(3)语音压缩技术。

由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式:

语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。

语音采样:一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。

数学压缩:主要是针对采样位数进行压缩,这种方式也是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。

通常,以上几种压缩方式都是综合起来使用的。

(4)常用语音格式

PCM格式: Pulse Code Modulation 脉冲编码调制,它将声音模拟信号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。

WAV格式:Wave Audio Files 是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。

ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90%以上,已广泛地应用于电话通信领域。

MP3格式: Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用 MPEG Audio Layer 3 的技术,采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(Variant Bitrate 可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小。

mp3压缩率10倍甚至12倍。是最初出现的一种高压缩率的语音格式。

Linear Scale格式:根据声音的变化率大小,把声音分成若干段,对每段用线性比例进行压缩,但是它的比例是可变的。

Logpcm格式:基本上对整个声音进行线性压缩,将最后若干位去掉。这种压缩方式在硬件上很容易实现,但音质比Linear Scale差一些,特别是音量较小声音比较细腻的情况下效果较差。主要用于pure speech方面。mid格式。mid格式的语音所占的空间比较狭小,有时短短20几秒的芯片就能装进去十多首mid格式的音乐.

(b)“音乐芯片”介绍:

(1)音乐的通道与音色:

包络(envelope)方波(patch) 通道(channel)

包络:合成音色的一部分,单位时间内音符输出的变化,常见有“ADSR”

方波:合成音色的一部分,单位时间内音符方波电流的变化。(另见三角波等)

通道:在同一时间内,芯片输出的音符个数,即“单音乐器”的个数。

PCT:模拟音色的一种,通过采样256个点的乐器声音来模拟出各个音符的音高。(音色柔和,占空间小,但不够真实)

FULL WAVE:通过采集一种乐器声音来模拟各个音符音高。(乐器声真实,但占用空间大,且采集音色音质要求高)

(2)音乐的压缩:

由于音乐数据量庞大,对音乐数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的音乐内容。有以下几种方式:

音乐分段:将音乐中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。

音色:根据音乐的丰满程度、需求程度,来确定Full wave,PCT、dual tone的选择,各个音色占用空间不懂,音色质量也不同。

数学压缩:主要是针对采样的音色(Full wave)进行压缩,这种方式也是有损压缩,对于要采集的音色进行降采样、处理等减小采集音色的大小(同语音类的修音)。 语音芯片为表述的形象化,由语音长度来表示

a)普通语音芯片以6K采样率为语音长度计算标准,最大采样到22K。

b)录音IC以6K采样率为语音长度计算标准。

即:以6k采样率芯片可以播放的长度。 相同品种的芯片成本与芯片的大小成正比。

a)I/O口的分配和ROM的大小(语音秒数)决定芯片成本。低秒数语音芯片其I/O口较少。

b)音质提高,采样提高,语音秒数缩短。

音质降低,采样降低,语音秒数变长 M---ROM大小(bit) n*f---波特率

声音处理软件介绍

1)SoundForge

2)Cooledit

3)goldwave

4)Calewalk

AC9020-OTPG20秒

OTP语音芯片

产品原理接线资料

产品描述:

AC9020是深圳市环芯半导体有限公司2009年推出的新产品,解决了AC8020原来仅支持3V供电的情况,5V供电时在VDD外加一个电阻的情况下,提供稳定性能的语音输出.同时在功能方面有了更大的改进.

AC9020

20秒新的OTPG语音芯片系列,是一颗支持PWM和DAC输出的20秒的OTP语音芯片,音质效果好,共有4个I/O口,其中2个Input,2个简单I/O,简单I/O只能触发单段语音或用于马达和闪灯,外围仅需一颗104电容,产品方案成本极低.

产品优势:

1,

Otp-AC9020

内置电阻、外围没有元器件,外围电路只需要要104电容.

整个方案的费用给您节省30%-50%

.

2,

工作电压默认为2.4V—3.6V,使用4.5V供电时在VDD上连一个8欧电阻即可,纽扣电池供电时只需连个4欧电阻;输出方式:PWM&DAC

.

3,

有8Pin,

DIP8和SOP8,裸片封装可以选择.

4,

唯一一款可以烧录裸片出货的OTP语音芯片产品,不需光罩费,音质和单价市场最优.

5,

喇叭是8欧0.5W的,支持8欧阻值功率范围

:

0.25W-1W的喇叭.

6,

声音DAC输出时,在DAC

Pin和VSS之间的电阻为470欧.

出货形式:

dip、

SOP、COB(可为积压盒专用)、裸片(已烧录好)。

其中裸片一块Wafer可以同时烧录4款不同的产品,直接绑定生产,大大地节约生产时间,

dip、

SOP、COB

1天交货,裸片5-7天交货。

AC9020_OTPG20S

3V供电按键模式(Stand-alone

Mode)

触发应用资料:

AC9020

/3

V供电接线图PWM直推喇叭-按键模式

AC9020

/

3V

Stand-alone

Mode

PWM

AC9020

/3

V供电接线图DAC三极管/供放/推喇叭

AC9020

/

3V

Stand-alone

Mode

DAC

AC9020

封装形式DIP8

/

SOP8

AC9020

-

DIP/SOP

PIN

NAME

1

TG2

2

TG1

3

TG11

4

TG12

5

VSS

6

PWM2/DAC

7

VDD

8

PWM1

有ICRoute公司的LD3320芯片,还有yq5969芯片和科大讯飞语音芯片CSK400系列都能够在400多米语音传输。

高品质MP3语音远程更换芯片解决方案是深圳唯创知音电子自主研发推出的低成本高效率的立体声无线传输方案芯片WT2605-24SS,集无线BLE数据传输、音频蓝牙等功能高集成度芯片。

结合微信小程序可以轻松实现声音无线更换、定时、及各种应用场景设置,同时可以通过串口外接MCU或WiFi、4G等无线模块通过网络远程更换设备内部的语音及OTA远程升级文件。

芯片小百科:

它是微型电子器件或部件,在电路中用字母“IC”表示,发明者为杰克·基尔比的集成电路和罗伯特·诺伊思。

当今半导体工业大多数应用的是基于硅的集成电路,是20世纪50年代后期到60年代发展起来的一种新型半导体器件。

1947年,美国贝尔实验室的约翰·巴丁、布拉顿、肖克莱三人发明了晶体管,这是微电子技术发展中第一个里程碑。1950年, R Ohl和肖克莱发明了离子注入工艺。

这些电路的小尺寸使得与板级集成相比,有更高速度,更低功耗并降低了制造成本。这些数字IC,以微处理器、数字信号处理器和微控制器为代表,工作中使用二进制,处理1和0信号。

从1930年代开始,元素周期表中的化学元素中的半导体被研究者如贝尔实验室的威廉·肖克利认为是固态真空管的最可能的原料。从氧化铜到锗,再到硅,原料在1940到1950年代被系统的研究。

今天,尽管元素中期表的一些III-V价化合物如砷化镓应用于特殊用途如,发光二极管、激光、太阳能电池和最高速集成电路,单晶硅成为集成电路主流的基层。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/8717338.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-20
下一篇 2023-04-20

发表评论

登录后才能评论

评论列表(0条)

保存