摘 要:本文首先介绍了连续可变斜率增量调制(CVSD)的工作原理和性能,并与当前应用较为广泛的其它语音编码方 法进行分析比较,接着重点介绍了美国国家半导体公司的CVSD语音编码芯片-CMX639,并给出无线耳麦的整
体设计方案。
关键词:语音编码、CVSD、CMX639
CVSD工作原理
在无线通信的几十年的发展过程中,语音通信始终占据着重要地位。虽然数据业务得到了飞速的发展,但应该看到的是,大多数用户仍以进行语音通信为主,而且无线语音通信的应用领域也在不断扩大,在安全保卫、旅游休闲、教育等领域得到了越来越广泛的应用。
研究在保证一定语音质量的前提下,尽可能的降低语音编码率可以实现对无线通信资源的充分利用,是语音编码研究的重要领域之一。目前应用较为广泛的语音编码方法主要有:PCM和ADPCM、增量调制、线性预测编码、子带编码等。
其中线性增量调制的工作原理如图1所示:
图中的s(t)是编码器的输入话音信号, (t)是s(t)经量化、编码和本地译码器后得到的再生话音信号, 为量化阶距(简称量阶),P(t)是编码输出码型。其编码规则如下:
若s(t)> (tn-Tn),即e(tn)>0 ,则编码器输出 "1"码;
若s(t)< (tn-Tn),即e(tn)<0,则编码器输出 "0"码.
上两式中,tn是第n次取样时刻,n=1,2,3,……;Tn是取样周期;而s(tn)- (Tn-Ts)=e(tn),e(tn)称为比较器误差信号。
译码器的译码规则是:当输入"1"码时,则译码输出增加一个量阶 ;当输入"0"码时,则译码器输出减小一个量阶
。
图1 线性别增量调制度原理图(略)
图2 线性增量调制编码示意图(略)
图3 CMX639管脚功能图(略)
线性增量调制量阶的大小直接关系到语音编码的质量。如果量阶设置过小,当语音信号斜率较大时,会发生过载,使得信号严重失真;而量阶如果过大,则会增大颗粒噪声。因为语音的动态范围通常较大,所以线性增量调制的性能差强人意,要保证正常通话质量,语音编码速率通常不小于50Kbps。
而连续可变斜率增量调制(CVSD)在线性增量调制的基础上,能自适应地调整量阶。当编码输出连续出现"0"或"1"时,表明语音信号斜率较大,则适当增大量化的量阶;反之,则适当降低语音量化的量阶。因此能在较大的动态范围内,始终使信号的量化信噪比接近于其最大值,有效地提高了语音编码的质量。
经测试,语音编码速率在20Kbps左右的CVSD基本可以满足日常通话的要求,其语音质量略低于64Kbps的PCM和32Kbps的ADPCM,而好于16KbpsADPCM。诚然,目前采用线性预测编码、子带编码等方式已经可以在编码速率低于10Kbps,甚至在1
Kbps左右的条件下,实现较高的语音编码质量(MOS评价高于3分)。但应该指出的是,这些技术实现难度较大,系统复杂,成本较高,不太适合一些低成本的应用场合,如无线耳麦、短距离对讲机等。而CVSD以其较低的应用难度、极低低的成本、较低编码速率和较好的语音编码质量,特别适合于这些应用场合。更值得一提的是,CVSD作为增量调制的一种,是一种串入-串出的结构,用一个比特代表一个取样点,不存在帧结构。由于CVSD具有的这一特点,使得当进行无线通信时,无需进行复杂的组帧和拆帧工作,在发端可以直接将编码数据进行传送;而在收端,不需要进行复杂的定时和比特同步工作,也不需要对数据进行处理,可以直接将解调出的波形进行语音解码,大大降低了系统的实现难度。
CMX639芯片介绍
CMX639是美国国家半导体公司推出的斜率连续可变增量(CVSD)全双工音频调制芯片。
CMX639完全集成了语音编码和解码功能,实现了单芯片语音处理的能力,外围设备简单,而且用户可以通过其管脚方便地对其编解码算法进行设置,并且具有强大的可选择编码算法,低功耗、低价位、小体积和开发难度低等多种优点,因此特别适合在对成本非常敏感的消费类语音系统中应用。
VDD:3.0V~5.0V供电电压。
ENCODER INPUT(7): 模拟语音信号的输入管脚。
ENCODER OUTPUT(4):语音编码后的输出管脚,将输入的模拟信号编码成为串行数据。
DECODER INPUT(11):用于解码的串行数据的输入管脚
DECODER OUTPUT(9):解码后的模拟语音信号输出管脚。
DATA ENABLE(5):数据使能端,当DATA ENABLE管脚处于高电平状态时,ENCODER OUTPUT才输出编码信号;否则,ENCODER
OUTPUT管脚处于高阻状态。
AGRITHM(13):算法选择管脚,由外部输入来决定压缩编码地算法是采用3 bit或4 bit算法。
(10):功率节省管脚。当不需要进行语音编解码时,将POWERSAVE管脚置低电平,芯片处于低功耗的待机状态。
CLOCK MODE1(15),CLOCK MODE2(14),ENCODER DATA CLOCK(3)和DECODER DATA
CLOCK(12):其管脚功能见下表。
由上表可知,CMX639采样速率完全取决于振荡器的频率和所设置的时钟模式。用户可以依据实际情况,自主选择采样速率,在语音质量和编码数据码率之间进行权衡,而且在振荡器的频率固定的情况下,还可以利用外部端口改变采样速率,因此赋予用户开发极大的自主权。
典型应用
无线耳麦彻底摆脱了电线的束缚,在指挥调度、安全保卫、多媒体教学、休闲娱乐等诸多领域有着广阔的市场前景。无线耳麦综合了语音处理技术和无线通信技术等技术,要求体积小,功耗低,有较高的语音质量和较低的成本。经过比较论证,采用CVSD语音编码芯片-CMX639,并结合短距离射频芯片TRF6900和其它相关器件,可以基本达到无线耳麦各方面的性能要求。系统框图如图4所示。
从话筒来的语音信号幅度通常不大,为了减小量化噪声对信号质量的影响,加入了前置放大器(AN7310),将信号幅度提高到适合CM639编码的水平。
CMX639在进行解码时,不可避免地混入了一些高频噪声,音频滤波器(MAX7400)可以有效地滤除语音信号中混有的高频噪声,使得语音信号柔和。
图4 无线耳麦结构方框图(略)
由于CMX639输出的语音功率较低,不宜直接输出到耳机,加入功率放大器(LM386)可以提高音量,还可以用户对音量大小进行调节。
TRF6900是TI公司最新推出的短距离无线射频芯片,采用FSK调制,其主要性能如下:
1) 有效数据传输距离100米;
2) 工作电压2.2 V-3.6 V;
3) 待机电流5 A,工作电流50mA;
4) 数据传输最高速率50Kbps。
TRF6900可以基本满足无线耳麦对传输距离和数据速率的要求,而且工作电压和功耗较低,可以利用电池进行供电。
CMX639对语音信号的每次取样,只用1个比特表示,输出的是串行比特流,可以直接送入射频芯TRF6900进行传输,在接收端,则直接将串行比特流送入CMX639进行解码。整个过程不需要软件进行处理,微处理器只负责对CMX639和TRF6900进行初始化设置和监控,因此大大降低了微处理的负担,因此可以采用廉价的微处理器。TI公司的MSP430F1121功耗低,价格便宜,体积小,并可以进行在线编程,非常适合在无线耳麦中使用。
无线耳麦经过硬件开发和软件编程后,进行调试,在传输距离为50米的条件下,CMX639采用24 Kbps的取样速率,语音质量可以满足正常的语言交流。
|