如何编写dsp的程序 28335

如何编写dsp的程序 28335,第1张

1. 添加F28335.GEL, 文件路径:C:\CCStudio_v3.3\cc\gel\F28335.gel;

2. 添加C:\CCStudio_v3.3\MyProjects\WDPT_STEP(DSP)10\Source\DSP2833x_CodeStartBranch.asm文件,此文件负责上电后程序执行顺序跳转的;

3. 修改工程的build option,将LINKER中的Autoinit参数改成:Run-Time Autoinitial;

4. 添加DSP281x_Headers_nonBIOS.cmd文件,用于将DSP28头文件中的外设结构与存储器地址对应起来;

5. 向工程中添加C:\CCStudio_v3.3\MyProjects\WDPT_STEP(DSP)10\F28335.cmd文件,它是用于flash烧写的CMD文件,用于替换原有的用于RAM中调试的28335_RAM_lnk.cmd文件。

#include <reg51.h> /*头文件的包含*/

#include <intrins.h>

#define uchar unsigned char /*宏定义*/

#define uint unsigned int

#define _Nop() _nop_()/*定义空指令*/

/* 常,变量定义区 */

/*端口位定义*/

sbit SDA=P3^6 /*模拟I2C数据传送位*/

sbit SCL=P3^7 /*模拟I2C时钟控制位*/

/*状态标志*/

bit ack /*应答标志位*/

/*******************************************************************

起动总线函数

函数原型: void Start_I2c()

功能: 启动I2C总线,即发送I2C起始条件.

********************************************************************/

void Start_I2c()

{

SDA=1 /*发送起始条件的数据信号*/

_Nop()

SCL=1

_Nop() /*起始条件建立时间大于4.7us,延时*/

_Nop()

_Nop()

_Nop()

_Nop()

SDA=0 /*发送起始信号*/

_Nop() /* 起始条件锁定时间大于4μs*/

_Nop()

_Nop()

_Nop()

_Nop()

SCL=0 /*钳住I2C总线,准备发送或接收数据 */

_Nop()

_Nop()

}

/*******************************************************************

结束总线函数

函数原型: void Stop_I2c()

功能: 结束I2C总线,即发送I2C结束条件.

void Stop_I2c()

{

SDA=0 /*发送结束条件的数据信号*/

_Nop() /*发送结束条件的时钟信号*/

SCL=1 /*结束条件建立时间大于4μs*/

_Nop()

_Nop()

_Nop()

_Nop()

_Nop()

SDA=1 /*发送I2C总线结束信号*/

_Nop()

_Nop()

_Nop()

_Nop()

}

/*******************************************************************

字节数据传送函数

函数原型: void SendByte(uchar c)

功能: 将数据c发送出去,可以是地址,也可以是数据,发完后等待应答,并对

此状态位进行 *** 作.(不应答或非应答都使ack=0 假)

发送数据正常,ack=1ack=0表示被控器无应答或损坏。

********************************************************************/

void SendByte(uchar c)

{

uchar BitCnt

for(BitCnt=0BitCnt<8BitCnt++) /*要传送的数据长度为8位*/

{

if((c<<BitCnt)&0x80)SDA=1 /*判断发送位*/

else SDA=0

_Nop()

SCL=1 /*置时钟线为高,通知被控器开始接收数据位*/

_Nop()

_Nop() /*保证时钟高电平周期大于4μs*/

_Nop()

_Nop()

_Nop()

SCL=0

}

_Nop()

_Nop()

SDA=1 /*8位发送完后释放数据线,准备接收应答位*/

_Nop()

_Nop()

SCL=1

_Nop()

_Nop()

_Nop()

if(SDA==1)ack=0

else ack=1 /*判断是否接收到应答信号*/

SCL=0

_Nop()

_Nop()

}

/*******************************************************************

字节数据传送函数

函数原型: uchar RcvByte()

功能: 用来接收从器件传来的数据,并判断总线错误(不发应答信号),

发完后请用应答函数。

********************************************************************/

uchar RcvByte()

{

uchar retc

uchar BitCnt

retc=0

SDA=1/*置数据线为输入方式*/

for(BitCnt=0BitCnt<8BitCnt++)

{

_Nop()

SCL=0 /*置时钟线为低,准备接收数据位*/

_Nop()

_Nop()/*时钟低电平周期大于4.7μs*/

_Nop()

_Nop()

_Nop()

SCL=1 /*置时钟线为高使数据线上数据有效*/

_Nop()

_Nop()

retc=retc<<1

if(SDA==1)retc=retc+1/*读数据位,接收的数据位放入retc中 */

_Nop()

_Nop()

}

SCL=0

_Nop()

_Nop()

return(retc)

}

/********************************************************************

应答子函数

原型: void Ack_I2c(bit a)

功能:主控器进行应答信号,(可以是应答或非应答信号)

********************************************************************/

void Ack_I2c(bit a)

{

if(a==0)SDA=0/*在此发出应答或非应答信号 */

else SDA=1

_Nop()

_Nop()

_Nop()

SCL=1

_Nop()

_Nop() /*时钟低电平周期大于4μs*/

_Nop()

_Nop()

_Nop()

SCL=0 /*清时钟线,钳住I2C总线以便继续接收*/

_Nop()

_Nop()

}

/*******************************************************************

向有子地址器件发送多字节数据函数

函数原型: bit ISendStr(uchar sla,uchar suba,ucahr *s,uchar no)

功能: 从启动总线到发送地址,子地址,数据,结束总线的全过程,从器件

地址sla,子地址suba,发送内容是s指向的内容,发送no个字节。

如果返回1表示 *** 作成功,否则 *** 作有误。

注意:使用前必须已结束总线。

********************************************************************/

bit ISendStr(uchar sla,uchar suba,uchar *s,uchar no)

{

uchar i

Start_I2c() /*启动总线*/

SendByte(sla) /*发送器件地址*/

if(ack==0)return(0)

SendByte(suba) /*发送器件子地址*/

if(ack==0)return(0)

for(i=0i<noi++)

{

SendByte(*s) /*发送数据*/

if(ack==0)return(0)

s++

}

Stop_I2c()/*结束总线*/

return(1)

}

/*******************************************************************

向有子地址器件读取多字节数据函数

函数原型: bit ISendStr(uchar sla,uchar suba,ucahr *s,uchar no)

功能: 从启动总线到发送地址,子地址,读数据,结束总线的全过程,从器件

地址sla,子地址suba,读出的内容放入s指向的存储区,读no个字节。

如果返回1表示 *** 作成功,否则 *** 作有误。

注意:使用前必须已结束总线。

********************************************************************/

bit IRcvStr(uchar sla,uchar suba,uchar *s,uchar no)

{

uchar i

Start_I2c() /*启动总线*/

SendByte(sla) /*发送器件地址*/

if(ack==0)return(0)

SendByte(suba) /*发送器件子地址*/

if(ack==0)return(0)

Start_I2c()

SendByte(sla+1)

if(ack==0)return(0)

for(i=0i<no-1i++)

{

*s=RcvByte() /*发送数据*/

Ack_I2c(0) /*发送就答位*/

s++

}

*s=RcvByte()

Ack_I2c(1)/*发送非应位*/

Stop_I2c() /*结束总线*/

return(1)

论坛上看到的比较。这几天刚拿到STM32F4的评估板,STM32F4这次的卖点就是FPU和DSP指令集,关注了挺长时间,这次就想测试一下STM32F4的浮点性能,如果满足就升级自己飞控的架构。本来用STM32F103+28335双核架构,F28335当浮点处理器用,调试起来比较麻烦,所以一直想换了。测试代码就是用的我飞控的算法,全部使用浮点运算,包含姿态和位置两个7阶和9阶的卡尔曼滤波器,包含大量的矩阵运算以及部分导航算法和PID控制器等,还有部分IF和SWITCH包含跳转的判定语句,相比纯算法算是一个比较综合的运算。测试环境:F28335:CCSV3.3,使用TI优化的数学库,不开优化,程序在RAM里执行。STM32F4:KEILV4.7,使用ARM优化的数学库,不开优化。测试方法:F28335:在飞控算法入口设置断点,清零CCS的CPU计数器(profile->clock),然后STEPOVER,记录下CPU的计数STM32F4:在飞控算法入口设置断点,记录下Register窗口内算states计数器,然后STEPOVER,记录下新的计数器数值,与之前的数值相减得到CPU计数测试结果:F28335:253359个CPU周期,除以150MHZ,大约是1.69msSTM32F4:一共285964个周期,除以168MHZ,大约是1.7ms,比F28335略慢结论就是,对于包含相对较多跳转的综合浮点算法而言,STM32F4似乎并不慢多少。抛开架构因素,从纯浮点运算方面来看的话。STM32F4的FPU加减乘指令VADD.F32、VSUB.F32、VMUL.F32都是单周期指令,而除法VDIV.F32耗费14个周期。例如:a=a/b产生的汇编为:0x08000220ED900A00VLDRs0,[r0,#0x00]0x080002244804LDRr0,[pc,#16]@0x080002380x08000226EDD00A00VLDRs1,[r0,#0x00]0x0800022AEE801A20VDIV.F32s2,s0,s10x0800022E4803LDRr0,[pc,#12]@0x0800023C0x08000230ED801A00VSTRs2,[r0,#0x00]复制代码F28335:F28335的FPU有加减乘法指令,都是双周期的,由于没有硬件除法指令,F28335这里是用软件模拟的浮点除法,汇编可以看到LCR$div_f32.asm字样,需要19个时钟周期。例如:a=a*b,产生的汇编为:0087B2E203MOV32*-SP[4],R0H0087B4E2AFMOV32R1H,*-SP[6],UNCF0087B6E700MPYF32R0H,R1H,R0H0087B87700NOP//需要让流水线等待FPU运算完毕,所以需要NOP0087B9E203MOV32*-SP[4],R0H复制代码除法:0087BDE203MOV32*-SP[4],R0H0087BFE2AFMOV32R1H,*-SP[6],UNCF0087C17640LCR$div_f32.asm:52:71$0087C3E203MOV32*-SP[4],R0H复制代码结论:可见单从浮点处理器来说,F28335是不如F4的FPU的。但是由于F28335是哈佛架构,有较长的流水线,可以在一个时钟周期里完成读取,运算和存储,所以程序连续运行的话,就比ARM快上许多许多,比如执行一次a=a+b只需要5个时钟周期,但是缺点就是一旦要跳转,就必须清空流水线,如果是for(i=0i<1000i++)a=a+b复制代码这样的运算,速度反而要比ARM慢(测试下来单次是17周期,ARM是14).所以说这就是ARM和DSP不同的地方了。看看这次测试比较,感觉环境还是有一定的问题:1、F28335是在RAM中运行,并且两者都是在仿真器环境中进行运算,还是离线在Flash中跑比较靠谱。2、两者编译平台一个是CCS,一个是KEIL,对通用语句的优化,有待商榷。3、ARM和TI的数学库中,各自支持的运算种类不一样。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11221760.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-14
下一篇 2023-05-14

发表评论

登录后才能评论

评论列表(0条)

保存