C语言
线程池的实现
为什么需要线程池?
目前的大多数网络服务器,包括 Web
服务器、
Email 服务器以及数据库服务器等都具有一个共同 点,就是单位时间内必须处理数目巨大的连接请求,但处理时间却相对较短。
传统多线程方案中我们采用的服务器模型则是一旦接受到请求之后,即
创建一个新的线程,由该 线程
执行任务。任务执行完毕后,线程退出,这就是是“即时创建,即时销毁”的策略。尽管与
创建进程相比,创建线程的时间已经大大的缩短,但是如果提交给线程的任务是执行时间较短,
而且执行次数极其频繁,那么服务器将处于不停的创建线程,销毁线程的状态。
我们将传统方案中的线程执行过程分为三个过程:
T1
、
T2
、
T3
。
T1
:线程创建时间
T2
:线程执行时间,包括线程的同步等时间
T3
:线程销毁时间
那么我们可以看出,线程本身的开销所占的比例为(T1+T3) / (T1+T2+T3)。如果线程执行的时间很短 的话,这比开销可能占到
20%‐50%左右。如果任务执行时间很频繁的话,这笔开销将是不可忽略 的。
除此之外,线程池能够减少创建的线程个数。通常线程池所允许的并发线程是有上界的,如果同 时需要并发的线程数超过上界,那么一部分线程将会等待。而传统方案中,如果同时请求数目为 10000
,那么最坏情况下,系统可能需要产生
10000 个线程。尽管这不是一个很大的数目,但是也有部分机器可能达不到这种要求。
因此线程池的出现正是着眼于减少线程池本身带来的开销。线程池采用预创建的技术,在应用程 序启动之后,将立即创建一定数量的线程
(N1)
,放入空闲队列中。这些线程都是处于阻塞
(
Suspended
)状态,不消耗
CPU,但占用较小的内存空间。当任务到来后,缓冲池选择一个空闲 线程,把任务传入此线程中运行。当
N1
个线程都在处理任务后,缓冲池自动创建一定数量的新
线程,用于处理更多的任务。在任务执行完毕后线程也不退出,而是继续保持在池中等待下一次
的任务。当系统比较空闲时,大部分线程都一直处于暂停状态,线程池自动销毁一部分线程,回
收系统资源。
基于这种预创建技术,线程池将线程创建和销毁本身所带来的开销分摊到了各个具体的任务上, 执行次数越多,每个任务所分担到的线程本身开销则越小,不过我们另外可能需要考虑进去线程之间同步所带来的开销。
线程池的作用
在具体的代码中,经常会遇到以下场景:
① 监听机制:在代码正常运行时,需要随时监听主线程的状态或者某个变量的状态,一旦状态变化立刻需要处理。
② 耗时任务:在主进程执行某个耗时特别长的任务时,会导进程长时间阻塞卡顿现象。
③ 任务状态控制:即在任务执行过程中,能够终止此任务的执行。等等。
以上情景都可以用线程来实现,当以上场景在一个代码中多次出现时,可能就要创建很多个线程来满足相应的需求了。但线程过多或者频繁创建和销毁线程会带来调度开销,进而影响缓存局部性和整体性能。
在线程池中只存在几个固定的线程,由线程池来维护,等待调度器派发已存在空闲的线程去执行对应的任务。
由此,便实现了线程的一次创建多次使用的功能,从而避免了短时间内的任务时创建与销毁线程的代价。线程池不仅能保护资源的充分利用,还能保证不被过分调度。
线程池的原理
线程池的在初始化时,会先创建固定数量的线程;具体的任务会放在任务队列中,类似于生产者-消费者概念。
多个线程作为消费者,任务队列作为生产者。当任务队列存在多个任务时,便会由调度器依次将任务派发给现有的线程执行。
某个任务执行完毕后,当前线程就会被释放,此时调度器可继续派发任务给线程执行。如此反复便实现了,多个任务并发的执行。
一般一个简单的线程池有下列组件:
线程池管理器(ThreadPoolManager):用于创建并管理线程池
工作线程(WorkThread): 线程池中线程
任务接口(Task):每个任务必须实现的接口,以供工作线程调度任务的执行。
任务队列:用于存放没有处理的任务。提供一种缓冲机制。
我们定义以下
评论列表(0条)