对DSP而言,CCS用C语言编程和汇编编程,二者的效率相差多少?

对DSP而言,CCS用C语言编程和汇编编程,二者的效率相差多少?,第1张

我用的是28XX系列的,不知道经验对你有没有用,因为不同系列的芯片多少有些差别。

TI提供的库已经相当可以了,兼顾易用与效率。我当时做过这样的测试

1. 用IQMATH实现

2. 直接C语言实现

3. C语言优化实现

4. 原生汇编实现

IQMATH的运行周期在1000左右,比方案3快几十个周期,比方案4慢几个周期,方案2是10000多个周期。

另外,因为只是单独测的算法,汇编之所以快是快在寄存器的使用上, *** 作数可以直接入寄存器,但是考虑到程序其他部分是用C语言编写的话,把 *** 作栈的时间也加上,并不比方案1快。毕竟我对TI的汇编吃的也不透。

在编写上,无疑是方案1提供了最接近C语言风格的实现,几乎不用考虑ISA方面的问题。

另外对于执行效率,我觉得主要考虑三点:

1.分支的使用

CCS对C语言的优化我没做过太多比对。其实单从反汇编的结果看,我接触过的嵌入式开发环境的编译器都能做出很好的优化。但是几乎每个编译器都会在逻辑的优化上有欠缺——它只能对一些显而易见的判断条件进行优化,而在写程序的过程中,我们经常出于易读性的考虑,或者稳定性的考虑,或者其他的考虑加入几乎不会发生的分支,这样的分支判断会消耗一定比率的代码段执行效率,视乎代码段内有用功能的长度而定,越长这个比率越小,越短这个比率越高。

2.一般 *** 作,就是各种赋值 *** 作

在一般的 *** 作上,编译器的优化已经很令人满意了,基本上可以作为编写汇编的范本。我觉得所谓效率能达到90%就是针对这个部分说的。

3.特殊 *** 作,比如对整块内存的 *** 作,或者是浮点运算上。

在一些特殊的 *** 作上,就要看是否有现成的库,或者看硬件是否支持。比如对整块内存 *** 作就别用循环一个字节一个字节的搬了。

以上三点都能考虑到的话,相信执行效率方面已经没有太大的提升空间了。

另外如果你的代码发生在初始化部分,也就是只在系统运行开始的时候运行一次,那么优化不优化其实没有太大的必要,除非你对系统初始化的时间有严格的要求。但是如果你的代码是作为任务要被反复运行的,那就有优化的必要了。

在CCS里有代码消耗时钟周期的统计,如果你觉得某段代码效率低下的话,可以先分段进行消耗时钟周期的计算,这样优化比较有针对性。

答案:

1、CCS3.3是一个开发环境,不能够跑程序,程序弄好了要在芯片里面运行才能够有效果,如果不是直接下载,想在线调试(可以说在线硬件仿真),需要XDS100或者XDS510仿真器(更高级的XDS560 PLUS等等),一根JTAG连接线连接至DSP+一根USB连接线连接至PC;

2、开发Hello world 这个如果需要跑 *** 作系统,还是需要很多学习的,但如果裸机加一个液晶也是可以做出hello world的,即通过SPI接口连接一块12864液晶,通过发送指令发送数据就能达到,看你的需求。

over

CCS也是C语言,但也不是标准的ANSI C语言,它的头文件定义与ANSI C语言不同,所以它的程序和PICC不能混着编译,两者之间也不能混着移值。针对CCS编写的程序只能用CCS的编译器编译,用PICC编译只能报错,反之亦然。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11716989.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存