行业新闻

什么是声音芯片?

文章来源:未知人气:180发表时间:2018-11-15 13:46

什么是声音芯片?
声音芯片定义:将声音信号 通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还 原成语音信号。

普通声音芯 片放音功能实质上是一个DAC过程,而ADC过程主要是 由电脑完成,其中包括对 语音信号的采样、压缩、EQ等处理。

录音芯片包括ADC和DAC两个过程,都是由芯片 本身完成的,包括语音数据的采集、分析、压缩、存储、播放等步骤。

ADC=Analog Digital Change 模数转换

DAC= Digital Analog Change 数模转换

音质的优劣取决于ADC和DAC位数的多少。

 
(a) “声音芯片”语音信号的量化介绍:

(1)语音信号的量化
采样率(f)、位数(n)、波特率(T)
采样:将语音模拟 信号转化成数字信号。
采样率:每秒采样的个数(byte)。
波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second
采样位数指 在二进制条件下的位数。一般在没有 特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。

(2)采样率
奈奎斯特抽样定理(Nyquist Law):要从抽样信 号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。
抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。
嗓音的频带宽度为20~20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某 些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。
一般在我们 处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。
在应用单片 机的过程中,采样越高,定时器中断速度越快,会影响到其 他信号的监控和检测,所以要综合考虑。

(3)语音压缩技术。
由于语音数据量庞大,对语音数据 进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入 更多的语音内容。有以下几种方式:
语音分段:将语音中可 以重复的部分截取出来,通过排列组 合将内容完整地回放出来。
语音采样:一般我们使 用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质 可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。
数学压缩:主要是针对 采样位数进行压缩,这种方式也 是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率 压缩倍率为10倍左右。
通常,以上几种压 缩方式都是综合起来使用的。

(4)常用语音格式
PCM格式: Pulse Code Modulation 脉冲编码调制,它将声音模 拟信号采样后得到量化后的语音数据,是最基本最 原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。
WAV格式:Wave Audio Files 是微软公司 开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应 用程序广泛支持。WAV格式支持许 多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储 空间需求太大不便于交流和传播。WAV文件里面存 放的每一块数据都有自己独立的标识,通过这些标 识可以告诉用户究竟这是什么数据,这些数据包 括采样频率和位数,单声道(mono)还是立体声(stero)等。
ADPCM格式:是利用对过 去的几个抽样值来预测当前输入的样值,并使其具有 自适应的预测功能与实际检测值进行比较,随时对测得 的差值自动进行量化级差的处理,使之始终保 持与信号同步变化。它适用于语 音变化率适中的情况,而且声音回 放过程简短。它的优点是 对于人声的处理比较逼真,一般达到90%以上,已广泛地应 用于电话通信领域。
MP3格式: Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用 MPEG Audio Layer 3 的技术,采取了名为“感官编码技术”的编码算法:编码时先对 音频文件进行频谱分析,然后用过滤 器滤掉噪音电平,接着通过量 化的方式将剩下的每一位打散排列,最后形成具 有较高压缩比的mp3文件,并使压缩后 的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(Variant Bitrate 可变波特率)可以根据编 码的内容动态地选择合适的波特率,因此编码的 结果是在保证了音质的同时又照顾了文件的大小。
mp3压缩率10倍甚至12倍。是最初出现 的一种高压缩率的语音格式。
Linear Scale格式:根据声音的 变化率大小,把声音分成若干段,对每段用线 性比例进行压缩,但是它的比 例是可变的。
Logpcm格式:基本上对整 个声音进行线性压缩,将最后若干位去掉。这种压缩方 式在硬件上很容易实现,但音质比Linear Scale差一些,特别是音量 较小声音比较细腻的情况下效果较差。主要用于pure speech。
 

上一篇:没有了
下一篇:没有了

13143391993

13602859796

7x24小时

传真:

020-32365760-8004

微信二维码
快速取得联系信息

微信二维码
快速取得联系信息