引言
相比传统的电路交换技术,VoP技术有着独特的优势。随着VoP技术的发展,低功耗、高性能DSP的出现,传输技术的不断提高和各种协议的趋于统一,近年来,基于包交换的分组语音技术发展迅猛,已逐步成为下一代网络的关键技术之一。在向下一代网络的演进过程中,作为电路交换网和数据包交换网桥梁的VoP媒体网关扮演着重要角色。在整个网关系统中,数字信号处理器(DSP,
Digital Signal Processors)直接负责不同网络之间多媒体信号的转换工作,是语音编码器和调制解调器的核心部件,可以说是分组语音的发动机。另外,DSP的成本对整个媒体网关成本有着举足轻重的影响。所以,DSP的选型和相关设计直接影响着VoP技术的应用。本文将概要介绍分组语音媒体网关在信号处理方面的特点和对处理器的要求,数字信号处理器的独特结构、发展趋势和在媒体网关中的应用,最后介绍基于DSP的媒体信号处理系统设计。
媒体网关中信号处理的基本内容和特点
在讨论DSP在媒体网关中的应用之前,先简单介绍一下媒体网关信号处理的内容和特点。一般来说,分组语音若要替代电路交换语音,就必须支持传统电路交换所有的特性和业务。作为电信级业务,分组语音需要支持回波抵消、语音压缩、语音组包、播放、信令检测等技术。在包交换网络中,网络时延基本上都大于50毫秒,这就要求网关具备回波抵消技术(EC)。在分组网络上传输语音,必须将模拟的语音信号转换为一定长度的数字化语音分组。这就需要采用一定的语音编码算法对语音信号进行处理,如G.711,G.726等编码算法。若考虑到数据包出口的带宽,运营商往往会要求网关除了支持G.711,还要能支持低比特率(LBR)压缩算法,如G.729a/b,G.723等。为了节省传输信道资源,除了采用低比特率压缩算法,还采用了静音检测技术(VAD),通过检测通话阶段中的静音,并对其进行一定的处理。在实际使用中,接收端常常会在静音期间发送一些分组,从而生成使用户感觉舒服一些的背景噪声,即所谓的舒适噪声(CNG)。在播放语音包时,接收端需要提供一个可变长度的缓冲器,用来调节网络产生的抖动。此外,网关必须支持检测和产生多种电话音,如拨号音、传真音、呼叫过程提示音等,并且还要能够支持多种信令,如CCS,CAS,IVR等。
与其他信号处理系统相比,媒体网关的信号处理有以下特点:
媒体网关处理的实时信号多样化。这些实时信号包括语音、传真、MODEM数据以及各种信令等。将来,网关还需要支持图像处理。每种媒体信号的处理方式都不尽相同。在语音处理部分,包含了语音压缩、回波抵消、电话音的产生和检测等;在图像处理中,包括图像的求和求差运算、二维梯度运算、图像分割及区域特征提取等处理;在MODEM处理中,包括数据调制解调、数据压缩、数据纠错等处理;在信令处理中,要识别并且产生运行在不同网络上的多种信令。
媒体网关的信号处理对时延非常敏感。时延对语音呼叫的影响主要在于引入回声和交互性的丧失。语音信号在端到端传输过程中受到的时延环节很多,包括网关处理时延,接入网和核心网上的传输时延,节点中排队时延和服务处理时延等。其中网关处理时延由编码器引入的时延、分组打包时延和终端去抖动时延组成。当整个回路时延大于150毫秒时,语音质量开始明显下降。所以在网关的信号处理中,要尽可能地减少各种处理时延。
媒体网关信号处理算法复杂且在不断更新。在分组语音涉及到的算法中,有些算法非常复杂,例如目前回波控制均采用回波抵消方法,即通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值,这个处理过程计算量很大,需占用大量的处理资源。再如,一些低比特率编码器,V系列的调制解调协议,T.38等算法都需要处理器具备非常强的处理能力。另外,随着VoP技术的不断推广,一些效率更高性能更佳的算法在不断出现,如iBLC编解码器。一些老的算法也在不断更新,如G.729系列CODEC。因此处理器必须能支持算法升级。
媒体网关处理分组语音需要在短时间内完成大量的密集型运算和特殊处理,需要网关具备处理大数据量的能力,以保证系统的实时性。一般通用微处理器不能胜任这些运算,目前,数字信号处理器是网关信号处理的最佳选择。
数字信号处理器在媒体网关中的应用
与通用处理器(GPP)相比,DSP在硬件上具有独特的结构,如哈佛存储器结构、零开销循环、对密集的乘法运算的支持、定点计算、专门的寻址方式、执行时间的预测、定点DSP指令集。在实际应用的VoP解决方案中,DSP已经不可或缺。DSP在媒体网关应用中的优势突出体现在以下几方面:
DSP凭借其独特结构成为了语音等多媒体信号处理的最有效的引擎。ITU制订了许多语音压缩标准,如G.728、G.723、AMR等,它们都涉及到大量的乘加运算,所有这些算法都不无例外地是针对DSP的硬件结构特点设计的。回波抵消中的许多技术实现如自适应均衡也与DSP的硬件结构密不可分。DSP的可重复编程的特点可以使系统很方便地升级和拓展新的业务。另外,
语音处理是一种实时业务,对时间要求极为严格, 所以其运算性能必须是可以预测的,这点也正是DSP的强项。DSP程序员能够决定所使用的指令集,所以预测在DSP上执行代码的时间就是一项相对来说比较简单的工作。DSP没有使用通用处理器中的分支预测和预测执行概念,
它以一种高效的方式执行专用指令集来完成特定功能,而某些通用处理器的代码可能会随着分支运算的不同而消耗不同数量的指令周期。因此对这种处理器来说,很难预测执行某一特定运算所花费的时间。所以若采用通用处理器,信号处理的实时性很难得到保证。另外,若采用ASIC或FPGA,虽然它们是一个硬连线结构系统,处理时延很小,但它们通常只能用于完成特定的算法,这种系统只适合于实现功能固定和数据结构明确的计算问题,不利于网关业务扩展和性能的升级。
DSP较好地满足了媒体网关在功耗、成本和容量方面的要求。小容量的接入网关,特别是住宅网关,对系统的功耗和成本有严格的要求。与其他处理器相比,DSP的平均通道功耗非常低。由于DSP具有高效的指令集,只需要少量的语音处理内存,所以与DSP相关的存储器空间可以减到最小,不但减少了功耗,还降低了整个系统的成本。另一方面,中高密度的网关,要求处理器有足够的处理能力,单个处理器能支持较多的语音通道。否则,随着处理器数目的增加,系统设计的难度也增大。当前一些主流DSP的容量一般都在200路左右(非压缩编码),压缩算法通道也在100左右,一般通用处理器很难达到这个容量,
因此若计算平均通道成本,DSP方案要比一般通用处理器方案便宜很多。
随着越来越多的设备厂商选择DSP作为媒体网关的信号处理器,媒体网关也推动了数字信号处理器的发展。VoP应用的巨大潜力促使DSP厂商投入巨资去开发适合分组语音处理的DSP。作为分组语音的信号处理引擎,用于网关的DSP自然也有与一般通用DSP不同的地方。这种差异突出表现在以下几方面:
VoP DSP充分考虑到了语音处理特点,在芯片设计结构方面作了优化。用于不同密度媒体网关的DSP结构也不是完全一样的。家庭网关等低密度网关一般采用基于SoC结构的DSP。这种芯片设计思想是把DSP和定制电路集成到单一芯片中去。这种设计非常具有吸引力,它允许制造商在同一系统中集成高性能的数字信号处理器和定制电路。整个芯片由两部分构成,一部分为DSP,另一部分为ASIC电路。DSP核心逻辑负责信号处理部分,而ASIC电路往往集成了MIPS或ARM等内核,负责控制、接口和协议等处理。这种ASIC也称作SoC,它不仅完成了信号处理功能,还负责协议处理、数据包的组包和拆包等工作,它把DSP外部控制器的某些功能集中在内部完成了。但在中高密度媒体网关中,人们往往可以见到另一种结构的DSP—多核DSP。这种DSP里一般含有多个独立的标准DSP核,如C55x,不同DSP核之间通过内部独特的交换平台进行数据通讯,所以这是一种扁平化结构,使编程大为简化,而且可以继承以前单核DSP成熟的应用程序,缩短开发时间。每个核一般都有自己独立的内存块,在程序空间方面,一般都是共享的,这样可以减少对外置存储器的需求。由于集成度很高,这类DSP提供的语音通道数也很大,适合用于大型的通讯基础设备中。
由于媒体网关涉及到的信号处理算法非常庞大复杂,另外,这些算法中有相当一部分必须符合ITU及其他相关标准以满足设备互连互通的要求,网关设备制造商很难靠自己的力量独自去开发这些算法,所以这就要求DSP供应商在提供芯片的同时还要提供固件(在DSP中运行的各种算法及程序),这是与一般DSP应用的不同之处。这类软件必须根据语音处理的特点,经过高度优化,以达到在通道数和性能方面的最优化,而且为了能让设备开发商方便使用,还要提供高质量的API。
媒体网关在整个网络中的位置决定了其所用的DSP要有多种网络接口。对一些低成本网关来说,如住宅网关,设备内部一般没有专门用的与网络连接的器件,如网络处理器,DSP的接口往往直接与网络相连,这要求DSP具备对外的网络接口,例如PHY,USB接口等,以减少板子的BOM和功耗,这点对低密度网关至关重要。对于大型的中继网关,DSP的单一接口往往也不利于系统设计。新型的专用DSP一般都具有多种标准网络接口,如UTOPIA,POS,ETHERNET。老式的通用DSP一般只有微处理器接口,这种接口简单,但是与其他系统的互连性不好,需要增加其他专用器件,不适合大规模的系统集成,另外接口带宽也往往不够。因此应用于媒体网关的DSP必须具有丰富接口以适应多种网络结构。
DSP的性能是决定语音质量的关键因素,其成本在整个系统成本中占很大比重,如何选择合适的DSP非常关键。在比较DSP的同时,要综合考虑芯片的硬件性能、固件质量、技术支持、开发难易程度等多种因素,参见表1。
表1:DSP芯片选择(略)
基于DSP的VoP媒体网关系统设计
媒体网关能否与传统的电信设备展开竞争,分组语音业务能否被用户接受,服务内容、服务质量和设备成本是关键因素。在进行网关设计时,必须兼顾语音质量、系统的扩展性、可靠性与灵活性。
对于低密度媒体网关,如住宅网关,其整个系统设计比较简单,往往一两个关键芯片决定了整个系统结构。相比较而言,高密度媒体网关就复杂了许多。下面就着重讨论在中高密度网关中的DSP应用和设计。
图1 基于DSP的VoP媒体网关基本结构(略)
图1描述了媒体网关的主要组成:系统控制器、PSTN接口模块、TDM交换模块、VoP模块、包处理单元和数据网络接口。系统控制器负责整个系统的管理、配置和呼叫控制。PSTN接口模块提供与PSTN网络的接口,小容量网关常用的接口有E1、T1,大容量网关常用的接口有DS3、OC-3。TDM交换模块负责TDM流的分配。VoP模块负责媒体信号的处理和转换工作。网络协议由包处理单元完成处理。数据网络接口模块提供与包交换网络的接口。现在应用最多的是ATM网和IP网,绝大多数网关设备都提供这两种网络接口,常见的包接口有OC-n(OC-3、OC12等)、POS、100BaseT和千兆以太网接口。
VoP模块主要由DSP和汇聚器(Aggregator)构成。DSP完成不同网络之间的语音信号转换工作。对于有多个DSP的VoP模块来说,汇聚器必不可少,有时它位于VoP模块,有时位于包处理单元。汇聚器主要有以下功能:汇聚来自多个DSP产生的数据包,然后集中传输到下一模块;在相反方向,它把从分组交换网络上过来的数据包路由到合适的DSP上;有些DSP的接口是不标准的,引入汇聚器则可以向外界提供一个标准接口,这一点在背板系统中尤其有用;在有些应用中,它还可以提供包过滤,网络管理等功能。汇聚器可以是专用芯片,如以太网交换芯片、通用处理器、小型网络处理器,也可以是带有汇聚逻辑的ASIC、FPGA或PLD等逻辑器件。汇聚器的选择设计由模块接口、数据流带宽、包处理等因素决定。
图2 VoP模块结构示意图(略)
图2给出了一种典型的VoP模块结构。这种DSP有PCI、TDM和以太网接口。PCI总线用作控制通道,TSI用作时隙分配,以太网交换芯片作为数据包的汇聚器,提供对外的数据通路接口。在这个模块中,数据通道和控制通道是分离的,这种设计方法常用于高密度网关。随着DSP技术不断更新,VoP模块的生命周期也越来越短,在这种情况下,VoP模块的软硬件设计必须与系统其他模块分离出来,在系统设计时须定义好它们之间的软硬件接口,这种接口必须具有通用性,扩展性。
结束语
纵观DSP过去几年在分组语音中的应用,可以相信,未来高性能DSP必将会给用户提供更高质量的通信信号。
|