linux多线程为什么单线程执行_系统运维

主要是两个问题，任务调度和oversubscription。

openmp默认使用的schedule是取决于编译器实现的。gcc默认使用schedule(dynamic,1)，也就是动态调度并且块大小是1。在你的程序里面，这种调度是及其低效的，看代码都能预期到，不太可能比单线程快。

动态调度的一种简单理解方式是，计算任务存在一个任务队列里面，你的for循环每一个i值对应一个计算任务。每个线程每次提取一批任务，然后计算。“一批”是多少呢？就是前面说的块大小，在你的程序里面是1。提取任务需要什么 *** 作呢？因为这个任务队列是多线程共享的，提取任务前必须加锁，读取一批，从队列中移除，然后解锁。说到这里，你应该已经知道原因了。

你的线程一次只提取一次计算任务，这个任务还完成得很快。然后所有的16个线程排着队，逐个去加锁，抢任务，然后解锁让其它线程继续抢。然后马上发现这个任务很快，又要重新去排队等任务，始终处于饥饿状态。注意排队的时候可能也是要占cpu的，因为使用了busy wait，所以可能你看来十六核满负荷，但是其实啥也没干。

我的建议就是，使用static schedule，或者增加dynamic schedule的块大小，比如1024，取决于你循环多少次。一般如果你知道每次循环的执行时间基本都是一样，并且是专用服务器设置好affinity，无其它负荷无oversubscription无numa问题的话，static schedule会是个比较好的选择。这样每个线程做哪些任务只需要进行一次分配，最小化了openmp本身的消耗。

还有一个非常重要的问题！数值计算不要使用cpu超线程！cpu的超线程对于数值计算基本是有害无益的，线程数不要大于实际核数，否则就是oversubscription。你这已经是非常严重的oversubscription了。数值计算专用的话，建议直接关闭服务器bios里面的超线程选项。

协程可以。允许我们在单线程模式下模拟多线程编程的效果，代码执行时的挂起与恢复完

全是由编程语言来控制的，和 *** 作系统无关。这种特性使得高并发程序的运行效率得到了极大的提升。

现在的技术，还是一个线程只能运行在一个 CPU 上。多核心，必须用多线程/进程来运行才能实现最大化。当然，你可以单个线程不停的在所有的 CPU 上来回跳。但是效率会很低很低。

因为 CPU 有寄存器和缓存的问题。如果你切换 CPU 运行，所有的数据都要进行一次传递。非常浪费时钟（在 CPU 上，程序执行不是一个时钟马上就能任意执行一个指令，而是流水线作业，一个指令需要很多个时钟才能处理完，数据存取也都要等）。

这也因为程序原本就都是顺序执行的。你没办法让一个程序的后面的结果可以跳过前面的结果而得出。

当然，现在 CPU 确实有这种技术，叫做乱序执行。也就是当前面的过程还没有计算时，后面的指令先计算。但是这种事情是要靠猜测的，而且这也仅仅是分支预测，依然不能预测某个计算的结果。即便猜的再准确，也有错的时候。奔腾4 最老的版本就有这个问题，流水线太长。计算后发现错了。整条流水线需要清空重新计算。有严重性能问题的奔腾4 CPU ，流水线长度是 31 级。也就是一个程序至少 31 个时钟周期才能从推到流水线后到真正执行。直接浪费了 31 个时钟周期。

所以目前的技术来说，单线程多核新协同计算，技术上不可能实现。

提高性能，就是整理数据处理的算法，把多次重复计算的过程，拆成多条线程分别计算。从而保证 CPU 多核新的效率最大化。每个线程可以共享同一块数据，自己读取自己的数据计算使可以的。不过，这时候就有另外一个问题，数据寻址和传递的性能问题。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/8927789.html

linux多线程为什么单线程执行

发表评论

评论列表（0条）