几乎所有需要异步或并发执行任务的程序都可以使用线程池,开发过程中合理使用线程池能够带来以下三个好处:
降低资源消耗提高响应速度提高线程的可管理性 1. 线程池的实现原理
当我们提交一个新任务到线程池时,线程池的处理流程如下:
其中,任何创建新线程的 *** 作都需要获取全局锁。
ThreadPoolExecutor采取上述步骤的设计思路,是为了在执行execute()方法时,尽可能地避免获取全局锁。在ThreadPoolExecutor完成预热后,几乎所有的execute()方法都是执行步骤二,而步骤二不需要获取全局锁。
工作线程在完成当前的任务后,会自己到工作队列中循环获取任务来执行:
2. 线程池的使用 2.1 创建线程池我们通过ThreadPoolExecutor来创建线程池。
new ThreadPoolExecutor(corePoolSize // 核心线程池大小 ,maximumPoolSize // 线程池大小 ,keepAliveTime // 最长存活时间 ,milliseconds // 时间单位 ,runnableTaskQueue // 工作队列 ,handler) // 饱和策略
corePoolSize 参数为线程池基本大小,即核心线程池的最大容量。当核心线程池未满时,只要收到新任务都会创建一个新的线程。当核心线程池满且无空闲工作线程时,会将任务存到任务队列中。
**maximumPoolSize **参数为线程池最大数量,即线程池允许创建的最大线程数。如果任务队列满了,将会创建新线程来执行任务,直到线程数量达到该最大数量。值得注意的是如果使用了无界的任务队列,那么这个参数就没有效果。
keepAliveTime 参数为空闲线程存活时间。
**TimeUnit **参数为线程活动保持时间的单位。
**workQueue **参数为任务队列,它是一个用于保存等待执行的任务的阻塞队列,可以选择以下几个。
ThreadFactor参数为线程工厂。可以通过线程工厂为每个创建出来的线程设置更有意义的名字。
RejectedExecutionHandler参数为饱和策略。当队列和线程池都满了,我们需要使用饱和策略来处理新任务。一般有以下四种策略。
- AbortPolicy:直接抛出异常。CallerRunsPolicy:只用调用者所在线程来运行任务。DiscardOldestPolicy:丢弃队列里最近的一个任务,并执行当前任务。DiscardPolicy:不处理,丢掉。当然,也可以通过RejectedExecutionHandler接口自定义策略,比如记录日志或者持久化存储不能处理的任务。
为什么要求用 ThreadPoolExecutor 创建线程池
否则有资源耗尽的风险,Executors返回的线程池对象弊端如下:
FixedThreadPool和SingleThreadPool:允许的请求队列长度为Integer.MAX_VALUE,可能会堆积大量请求,导致 OOM。CachedThreadPool和ScheduledThreadPool:允许的创建线程数量为Integer.MAx_VALUE,可能会创建大量线程,导致 OOM。 2.2 向线程池提交任务
可以用execute()和submit()两个方法向线程池提交任务,前者提交不需要返回值的任务,后者提交需要返回值的任务。
2.3 关闭线程池使用shutdown()或shutdownNow()方法来关闭线程池。原理是遍历线程池中的工作线程,逐个调用interrupt()方法。
shutdownNow()会将线程池状态设置为STOP,并尝试停止所有的正在执行或暂停任务的线程,并返回等待执行任务的列表。而shutdown()只是将线程池状态设置为SHUTDOWN状态,然后中断所有没有正在执行任务的线程。
通常调用shutdown()方法,如果任务不一定要执行完,就调用shutdownNow()。
3. 合理配置线程池我们需要通过任务的特性,来分析合理的线程池配置方式:
任务的性质:CPU 密集型任务、IO 密集型任务和混合型任务
CPU 密集型任务配置尽可能少的线程,如配置 CPU 核数+ 1 个线程。IO 密集型人物应配置尽可能多的线程,如配置 2 * cpu 核数个线程。混合型任务尽量拆分 任务优先级:高、中、低
优先级不同的任务可以使用优先级队列PriorityBlockingQueue来处理。 任务执行时间:长、中、短
执行时间不同的任务交给不同规模的线程池处理。 任务依赖性:是否以来其他系统资源,如数据库资源
依赖数据库连接池的任务,因为线程提交 SQL 后需要等待数据库返回结果,等待时间越长则 CPU 空闲时间越长,那么线程数应该设置得越大,才能更好地使用 CPU。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)