基于FPGA的可扩展高速FFT处理器的设计与实现_技术

　　一、引言

　　DFT（离散傅里叶变换）作为将信号从时域转换到频域的基本运算，在各种数字信号处理中起着核心作用，其快速算法FFT（快速傅里叶变换）在无线通信、语音识别、图像处理和频谱分析等领域有着广泛的应用。用大规模集成电路FPGA（现场可编程门阵列）来实现FFT算法时，需要重点考虑的不再是算法运算量，而是算法的复杂性、规整性和模块化，因为算法的简单性和规整性将更适合大规模集成，更方便于版图设计，而算法的模块化更有利于FFT处理器的灵活扩展。组合数FFT算法和CORDIC（坐标旋转数字计算机）算法结合起来，在计算长点数、可扩展FFT时具有较大的优越性［1，2］。而面向高速、大容量数据流的FFT的实时处理，可以通过VLSI（超大规模集成电路）器件的并行处理或多级流水线处理等来达到。特别是多级流水线处理的FFT结构使得基于FPGA器件的FFT处理器完成不同点数的FFT计算时可以通过增减模块级数很容易地实现。

　　二、组合数N=r1r2点混合基FFT原理

　　计算N点DFT：

　　式中k=0，1，…，N-1。

　　若N=r1r2的组合数，可将n（n＜N）表示为

　　式（2）的意

　　义在于，计算组合数N=r1r2点DFT，等价于先求出r?2组r?1点的DFT，其结果经过对应旋转因子的相位旋转后，再计算r1组r2点的DFT。实际应用中，DFT往往用它的快速算法FFT实现，因而式（2）中的r1点DFT和r2点DFT都用r1点FFT和r2点FFT实现。

　　三、可扩展FFT处理器实现结构

　　根据式（2）的FFT算法原理设计FFT处理器的可扩展结构如图1所示。

　　采用流水线模块化级联结构，把FFT处理器划分成短点数FFT、级间混序RAM和相位旋转等功能模块，设计的各功能模块可以重复利用，通过复用或增减各功能模块可以灵活改变FFT处理器的计算规模，而且不增加设计量。在图1结构中，当Li＝1时，就演变成了基2 FFT；当Li＝2时，就演变成了基4 FFT；同理，当Li≠Lj时，就演变成了高组合数的混合基FFT。