基于S3C2510h和TM1300数字信号处理器实现高速通信协议的设计_技术

目前，建立在宽带网络的多媒体应用日渐增多，高性能的DSP也不断推陈出新，由于DSP具备非常灵活的编程运算能力，针对不同的编码标准，采用不同的编码软件，加上合适的芯片价位，在视频会议终端、视频监控服务器、IP数字机顶盒等产品中已被普遍采用。

虽然DSP具备众多的优点，但却不适合作系统控制，因为DSP通常没有强大的 *** 作系统，没有完备的网络协议栈和可靠的文件系统，DSP架构在作控制指令时无法并行处理，分支判断和高速缓存没命中（cache miss）都会使运行效率极大降低。而这些正好是嵌入式RISC处理器的强项，比如ARM和MIPS系列，所以现在很多国际知名的半导体公司如PHILIPS和TI都推出了整合了RISC处理器和DSP的SOC芯片，如PNX8550、PNX8525、OMAP等。

高性能的DSP在进行媒体处理时会产生和消费大量的音视频数据，这些数据需要在RISC 和DSP两个处理器之间高速、稳定地交换数据，另外，RISC处理器也要经常给DSP发送指令，并且还要支持来自DSP的RPC调用。下面本文将要介绍一种基于多处理器之间的高速通讯机制，并且已在实践中得到商业化的应用。

本方案采用了SAMSUNG的S3C2510（ARM940T内核）和PHILIPS的Trimedia1300（TM1300）数字信号处理器，ARM940T内置了PCI2.1规范的总线接口，Trimedia1300可以作为PCI的MASTER和SLAVE，基本架构如图-1。

图-1

基于上述的硬件架构，在ARM和Trimedia1300处理器上分别采用了WindRiver的实时嵌入式 *** 作系统（RTOS）vxWorks和pSos2.5，本通讯协议的基本思路为，在ARM的内存空间上开辟一块共享内存，并能使TRIMEDIA能够访问，数据通讯的握手协议通过两个处理器的中断来实现，配合信号量的使用，可以达到高速、高效通讯的目的，其软件架构如图-2。

图-2

该通讯协议采用分层分布，两个处理器基本处于对称状态，因此，主要软件模块是公用的，有区别的是硬件抽象层和 *** 作系统抽象层，与硬件和 *** 作系统相关的模块比如中断驱动、信号量同步处理都分别提炼出来，单独放在这些模块文件中，减少软件开发和维护的工作量。

下面对图-2中的软件模块进行说明：

1. 硬件抽象层：该层主要完成对不同处理器的硬件的抽象，比如地址映射、中断处理、 PCI配置空间的访问，IO寄存器的访问等功能。将两个处理器之间的硬件差异隐藏起来，以便上一层统一管理接口。

2. *** 作系统抽象层：该层主要完成对不同 *** 作系统之间的抽象，提供vxWorks和pSos两个 *** 作系统的统一接口，主要是同步、信号量、关键代码的互斥保护机制等功能。

3. 通道及同步事件管理层：为了建立多处理器之间的多通道通讯和同步机制，该层支持多个通道独立通讯能力，每个通道都有唯一的句柄用于访问，通道的打开、使用、关闭相互独立。该层同时也支持命名的同步事件，可用于处理器之间的同步等待功能。

4. 消息处理管理层：该层完成多通道的指定长度分组包通讯功能，支持小数据量的通讯数据，并支持同步机制，DSP的控制指令可以采用这种方式进行通讯。

5. 共享缓存：支持多通道命名共享缓存，其中的数据可以同时被两个处理器访问，配合同步事件机制，流式数据可以采用这种方式进行高速、高效通讯。

6. 同步事件：支持多通道可命名的处理器之间的同步事件功能，ARM或DSP可以让对方等待同步事件，用于精确控制同步处理共享资源。

7. RPC（远程过程调用）层：在消息处理管理层和同步事件的基础上，当DSP处理器有时需要打印调试信息，或者读取HOST的资源时，比如调用printf、fopen、fread等标准c输入输出函数，通过该层处理后，ARM会调用相关函数完成指定的任务，并将结果返回给Trimedia1300。

在这里我们还要专门的描述的是位于硬件抽象层里的共享内存，它只在HOST的一方存在，所有需要两个处理器共享的数据都存储在该区域里，包括高层的共享缓存、消息、同步事件、通道信息等数据，因此需要主机维护物理连续的、一定大小的内存，并且是处理器非cacheable的区域。

下面本文将描述典型的控制指令传输方式，具体的过程见图-3

图-3

过程说明：本端处理器作初始化，创建同步事件，打开消息通讯句柄，同步事件用于读取数据时任务阻塞，然后创建通讯数据包并且发送，发送例程将数据存储在共享缓冲区内，最后触发对方中断。

对端处理器进入中断响应，首先中断例程分析共享数据区的通讯数据状态，发现某通道有新的未处理数据后，将其拷贝至自己的私有内存空间，并清理自己的共享数据区状态，然后释放在等待中的通讯任务的信号量，使读通讯数据包的任务解除阻塞状态，从私有数据区读取通讯数据包并作相应处理。

数据流通讯与数据包通讯类似，不过方法更简单，在创建共享缓存和同步事件后，一方写入数据后，出发同步事件，另一方等到同步事件解除后读取数据，效率很高而处理器开销节省至最低。

处理器之间的同步事件功能可以有效地对共享资源进行保护，防止多处理器同时对某一个共享资源访问，导致数据不完整。RPC（远程过程调用）功能能方便的用于系统调试和利用主处理器资源，能方便产品的调试和功能开发。

以上是简化的多处理器通讯模型，方法适用于大多数RISC+DSP的架构，另外为了实现该通讯机制，还必须先完成三个前提，下面将简单对此进行描述。

1. 位于HOST的共享内存必须是物理连续、非缓冲（none-cacheable）的一段内存，否则，两个处理器因为本身都带有数据高速缓存，会使数据的完整性无法保障，因此需要对两个处理器进行配置，对这段内存的访问关闭cache *** 作，具体 *** 作过程不再赘述。

2. 在编译Trimedia1300程序的时候，将指向共享内存的指针设置为下载时解析，并且要将Trimedia1300的下载程序移植到vxWorks *** 作系统，再下载解析该指针时将其指向ARM已分配给好的物理连续内存，Trimedia1300程序开始运行后就可以立即对共享内存初始化并进行通讯。

3. 该通讯协议以vxWorks的BSP（板级支持包）的方式提供接口，并创建标准的vxWorks设备，便于安装、使用。

该通讯规范已经在实用化的商业多媒体机顶盒中运行，该产品的数据流量较大，对时延要求很高，控制命令非常密集，从总体评价来看，采用该通讯协议后，无论是其效率、延时、处理器占用时间、灵活性、稳定性、可拓展性均获得很好的表现，希望本文也能对正在开发类似产品的人员起一定的提示作用，能加快相关产品的研发。

责任编辑：gt

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/2454497.html

基于S3C2510h和TM1300数字信号处理器实现高速通信协议的设计

发表评论

评论列表（0条）