linux单进程如何实现多核cpu多线程分配？_系统运维

linux下的单进程多线程的程序，要实现每个线程平均分配到多核cpu，主要有2个方法

1：利用linux系统自己的线程切换机制，linux有一个服务叫做irqbalance，这个服务是linux系统自带的，默认会启动，这个服务的作用就是把多线程平均分配到CPU的每个核上面，只要这个服务不停止，多线程分配就可以自己实现。但是要注意，如果线程函数内部的有某个循环，且该循环内没有任何系统调用的话，可能会导致这个线程的CPU时间无法被切换出去。也就是占满CPU现象，此时加个系统调用，例如sleep，线程所占的CPU时间就可以切换出去了。

2：利用pthread库自带的线程亲和性设置函数，来设置线程在某个CPU核心上跑，这个需要在程序内部实现。同时注意不要和进程亲和性设置搞混淆了

int pthread_setaffinity_np(pthread_t thread, size_t cpusetsize，

const cpu_set_t *cpuset)

int pthread_getaffinity_np(pthread_t thread, size_t cpusetsize,

cpu_set_t *cpuset)

从函数名以及参数名都很明了，唯一需要点解释下的可能就是cpu_set_t这个结构体了。这个结构体的理解类似于select中的fd_set，可以理解为cpu集，也是通过约定好的宏来进行清除、设置以及判断：

//初始化，设为空

void CPU_ZERO (cpu_set_t *set)

//将某个cpu加入cpu集中

void CPU_SET (int cpu, cpu_set_t *set)

//将某个cpu从cpu集中移出

void CPU_CLR (int cpu, cpu_set_t *set)

//判断某个cpu是否已在cpu集中设置了

int CPU_ISSET (int cpu, const cpu_set_t *set)

现在的技术，还是一个线程只能运行在一个 CPU 上。多核心，必须用多线程/进程来运行才能实现最大化。当然，你可以单个线程不停的在所有的 CPU 上来回跳。但是效率会很低很低。

因为 CPU 有寄存器和缓存的问题。如果你切换 CPU 运行，所有的数据都要进行一次传递。非常浪费时钟（在 CPU 上，程序执行不是一个时钟马上就能任意执行一个指令，而是流水线作业，一个指令需要很多个时钟才能处理完，数据存取也都要等）。

这也因为程序原本就都是顺序执行的。你没办法让一个程序的后面的结果可以跳过前面的结果而得出。

当然，现在 CPU 确实有这种技术，叫做乱序执行。也就是当前面的过程还没有计算时，后面的指令先计算。但是这种事情是要靠猜测的，而且这也仅仅是分支预测，依然不能预测某个计算的结果。即便猜的再准确，也有错的时候。奔腾4 最老的版本就有这个问题，流水线太长。计算后发现错了。整条流水线需要清空重新计算。有严重性能问题的奔腾4 CPU ，流水线长度是 31 级。也就是一个程序至少 31 个时钟周期才能从推到流水线后到真正执行。直接浪费了 31 个时钟周期。

所以目前的技术来说，单线程多核新协同计算，技术上不可能实现。

提高性能，就是整理数据处理的算法，把多次重复计算的过程，拆成多条线程分别计算。从而保证 CPU 多核新的效率最大化。每个线程可以共享同一块数据，自己读取自己的数据计算使可以的。不过，这时候就有另外一个问题，数据寻址和传递的性能问题。

单核使用多线程效率不会提高，反而还会增加不必要的线程切换时的资源开销。但是有些情况还是需要多线程的，首先一个是程序中有一个计算量大的功能模块，为了在执行它的同时能够让其他功能模块也得到执行机会，是需要多线程的；还有就是程序有可能部署在多核的系统上，当它部署在多核系统上时，多线程的性能优势会体现出来。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/8512498.html

linux单进程如何实现多核cpu多线程分配？

发表评论

评论列表（0条）