转自 https://www.digquant.com.cn/forum.php?mod=viewthread&tid=258
1、改变算法,多用矩盯好咐阵运算(尤其是矩阵乘法),尽量减少for循环;
2、减少for循环中的函数调用;
传统观点认为for-loop是影响性能的致命环节,让我们来对此验证:
Elapsed time is 0.000239 seconds.
Elapsed time is 0.000050 seconds.
从上面的实验结果可以得出以下结论:
1、tic/toc语句的时间开销可以忽略不计
2、for-loop语句本身的时间开销也非常小,关键的影响效率的地方不在于循环本身,而是在于循环的内部。
3、tic/toc不一定要成对出现,一个tic后面可以有多个toc,但需要需要重新计时的时候,要再次执行tic。
4、toc的结果可以用变量接收下来,如:
接下来我们就借助for循环,分析一下其他的各个影响效率的因素。
内建函数
Mean elapsed time is 0.032866 seconds.
m-函数
Mean elapsed time is 0.185556 seconds.
匿名函数
Mean elapsed time is 0.561228 seconds.
内联函数
Mean elapsed time is 19.5606 seconds.
从上面的实验结果可以得出袜春以下结论:
1、内联函数的调用时间开销最小,约为for-loop本身的10倍
2、m-函数的调用时间开销约为内联函数的6倍,约为for-loop本身的60倍
3、匿名函数的调用时间开销约为m-函数的3倍,约为for-loop本身的187倍
4、内联函数的调用时间开销过大,尽量不要在循环中使用
5、另外MEX-函数的调用时间开销,理应介于内联函数和m-函数之间
矩阵索引
Mean elapsed time is 0.007592 seconds.
Mean elapsed time is 0.007954 seconds.
Mean elapsed time is 0.663598 seconds.
Mean elapsed time is 0.273345 seconds.
Mean elapsed time is 0.730042 seconds.
Mean elapsed time is 1.00852 seconds.
Mean elapsed time is 0.009025 seconds.
Mean elapsed time >20 minutes.
因此,如果不预先分配好内存,将会大大增加仿真时间,拖慢执行效率。
所幸的是,由于这个现象的重要性,Matlab的编辑器能够发现并提示这个问题,会用红的波浪线 ~ 标记出来。
向量化:
MATLAB向量化函数
accumarray函数
arrayfun函数
bsxfun函数
cellfun函数
spfun函数
A =
101
206
0
208
subs =
1 1 1
2 1 2
2 3 2
2 1 2
2 3 2
val =
101
102
103
104
105
1、val的元素个凯纯数与subs的行数是一致的。
2、 A = accumarray(subs, val) 的实现过程分成2步。
第一步
是把val中的元素,按照subs对应行所给出的下标放到一个新的cell矩阵B中(cell是为了方便解释,也就是说B矩阵中的每个位置可以放入多个数值),注意,subs的值是B的下标,不是val的。举例来说,subs第一行[ 1 1 1],意思就是把val中第一个元素(val(1))放入到B(1,1,1)的位置,依次类推,val(2)放入到B(2 1 2),val(3)放入到B(2 3 2),val(4)放入到B(2 1 2),val(5)放入到B(2 3 2)。此时,可以看到B(1,1,1)中有1个数(val(1));B(2 1 2)有2个数(val(2),val(4));B(2 3 2)也有2个数(val(3),val(5))。
第二步
把B中每个单元中的数分别累加,并放入到A的对应位置。
注: accumarray 默认的是把每个单元中的数累加,因为对每个单元中的数的默认处理函数是sum。可以通过 A = accumarray(subs,val,[],[@fun](https://github.com/fun "@fun")) 的调用格式来指定其他的处理函数,比如说mean。对指定的fun函数的要求是,接受列向量输入,输出单个的数值型,字符型或逻辑型变量。A的维数与B相同,A中的元素默认为零。A的大小为max(subs(1))×max(subs(2))×max(subs(3))…
很显然,A的维数与subs的列数相等。
例子:
1000人,身高分布在170 180cm,体重在110 100斤,年龄分布在20~50岁,计算身高体重都相等的人的年龄平均值。结果用矩阵来表示:行数表示身高,列数表示体重,矩阵元素表示年龄的平均值。
arrayfun函数实现的是将指定的函数应用到给定数组在内的所有元素。这样以前不可避免的循环现在可以向量化了。
生成一个这样的n×n矩阵
以前,当我们想对一个矩阵A的每一列或每一行与同一个向量a进行某些 *** 作(比较大小、乘除等)时,只能用循环方法或者利用repmat函数将要 *** 作的向量a复制成和A一样尺寸的矩阵,进而进行 *** 作。从Matlab R2007a开始,有了更有效的方法,那就是bsxfun函数。
有如下矩阵:
向量为b=[1 2 3]T,请找出b在A矩阵列中的位置loc=[1,4]。
方法1:
方法2:
方法3:
方法4:
方法5:
A={‘Hello’, ‘MATLAB’, ‘I love MATLAB’, ‘MATLAB is powerful’, ‘MATLAB is the language of technical computer’}
cellfun( @length ,A)
ans =
5 6 13 18 44
</pre>
a =
(1,2) 1
(3,20) 2
(20,30) 3
(60,60) 4
(100,80) 5
</pre>
sa =
(1,2) 2
(3,20) 5
(20,30) 10
(60,60) 17
(100,80) 26
常用的预分配内存函数:
1、打开枣念清Matlab软件,【打开】凳前或新建调试文件。
2、点击代码前的横杠【设置断点】。
3、点击【运行】。
4、光标停到断点处,按【F10】单步执行。
5、将鼠标放在要观察的变量上【停留片刻】,查看变量高灶值(当矩阵太大时,只显示矩阵的维数)。最后F5执行完成。
matlab对多层嵌套循环的执行效率非常低,物历远磨蚂缺远低于c++代瞎辩码,通常使用三层的嵌套循环就要慎重,你的代码有四层循环了。解决方案有如下几个:1)考虑采用向量化编程,但实际编码时不是所有的都可以以向量化的方式改写,编码也有一定难度;2)考虑采用c++混编,把嵌套循环的代码由c++实现,再让matlab调用这部分功能;3)选用高版本的matlab,如r2016a,新版本对于嵌套循环的执行效率会有1/3以上的提升。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)