德州仪器公司(TI)推出以1GHz运行的数字信号处理器是计算机处理技术历史中一座重要的里程碑。在TI推出其第一款单片DSP之后的20年内,处理器时钟速度已提高了100倍,引发了高速计算机、通信、影像、模拟、导航、汽车引擎与交通控制、机器人与工业控制,以及众多其它领域的革命。如今,在速度超过每秒10亿周期的情况下,DSP正在各个领域不断推动着全新的应用。
可满足不同应用需求的处理器
其它类型的微处理器早就达到了GHz。象个人计算机等所采用的高性能RISC(精简指令集计算)的运行速度现在就能达到几个GHz时钟速度。但RISC是通用处理器引擎,目的是针对普通应用,如:办公计算机等。正如轿车及轻型卡车的引擎是设计用于各种驱动条件,
RISC是为了处理各种系统任务,在PC中,包括磁盘驱动器、视频、键盘与鼠标输入、打印机、扬声器、调制解调器与网络通信,以及众多系统内部功能。设计处理器使之具备处理不同类型任务的代价是相对比较低的计算效率。提高时钟速度有助于提高效率,但是并不能完全消除低效性。
而DSP则不同,它是为高性能应用而专门设计的。与小车、小型货运汽车和SUV引擎不同,DSP类似专门为赛车、赛艇以及飞机设计的引擎。采用DSP引擎的办公计算机就像在高峰大堵塞时驾驶一辆法拉利。
DSP实时处理计算密集型的任务,通常集中于每套系统中的单个应用。例如,DSP系统可以处理视频信号,每秒从高压缩输入解码几百兆象素信息。在移动电话中,DSP执行数字编码和解码对话中涉及的许多步骤,而且全部操作只消耗少量电池电源。
性能集中的DSP架构
在不明显造成用户延迟情况下实现这些功能意味着DSP必须能够设计胜任速度极高的计算,并具备与之相当的数据吞吐量。最快的DSP通过最小化每条指令需要的周期而实现性能。这些器件的架构还支持多指令并行执行。例如,TI的TMS320C6000
DSP可以在每个时钟周期同时执行8条指令,即以1GHz时钟速度每秒执行80亿次运算。在应用中,这些运算中的大部分是用于算术密集型算法的单周期乘法累加器(MAC)指令。因此,C6000
DSP在8位数据上可以达到8 GiMAC,如:视频成像中采用的数据,另外在其他应用中常见的16位数据上可达到4 GiMAC。
相比而言,许多RISC架构最多每秒执行单条指令,而1GHz RISC最多每秒执行10亿次运算。由于RISC设计中的MAC通常需要不止一个周期,每秒只能执行此数量MAC的不足一半。由于有限的MAC和其它指令执行速度,RISC在执行实时应用所需要的大量指令时根本不能与DSP相提并论。在信息高速公路中,即使数GHz
RISC的速度也是慢得不能满足快速通道中的流量要求
高性能、低功耗
DSP与速度相关的性能是其功耗。由于处理器以极高频率在更短时间内执行更多次运算,它也会消耗掉更多功率并使系统发热。桌面和笔记本电脑采用单RISC处理器,但是仍然需要风扇或金属板,以便散热。
另一方面,通讯系统通常在单个机箱中集成众多DSP。有时多个DSP会设计到单个线路卡上,用于蜂窝基站、DSL多路复用器、路由器、交换机和其它电信设备,以便使电信公司能够将成千上万条高速信道部署在一起。散热是在运行中决定系统能够支持多少信道以及设备成本的一个主要因素。
功耗在超小型系统的应用中也极为重要。一般情况下,热量在移动电话、PDA或其它只采用单个DSP的手持设备中不成为问题。但是,系统中的DSP引擎必须消耗最低的功率,以便延长电池寿命和在重复充电之间提供更长的使用时间。
DSP性能增加推动应用创新
DSP性能增加将推动技术创新。1GHz DSP将使更多的信道能够集成到基站、DSL线路卡、路由器、交换机、视频服务器以及其它通信设备;数字相机的感光阵列将达到14兆象素;MRI和CAT扫描将能够提供更详细的医疗图像;更精确的计算机模拟将帮助进行空气动力学设计、流体和应力分析、天气与环境预报,以及其它计算密集型的应用;导航、引路和识别系统将变得更精确、进而更安全、更可靠。
|