在学习 golang 的 GMP 原理前,你可能需要了解一下关于进程、线程以及协程的知识,可以先瞅瞅这篇之前的文章。
文章地址:golang的并发编程
1、G、M、P都代表什么意思
Processor处理器,其中包含了运行 goroutine 的资源,如果线程想运行 goroutine,那必须先获取 P,P 中还包含了可运行的 G 队列。
2、GMP模型
golang 中线程是运行 goroutine 的实体,调度器的作用是把可运行的 goroutine 分配到工作线程上。
Goroutine 的调度器和 OS 调度器是通过 M 结合起来的,每个 M 都代表了 1 个内核线程,OS 调度器负责把内核线程分配到 CPU 的核上执行。
P 和 M 的个数问题?
P 的数量:
由启动时环境变量 $GOMAXPROCS 或者是由 runtime 的方法 GOMAXPROCS() 决定。这意味着在程序执行的任意时刻都只有 $GOMAXPROCS 个 goroutine 在同时运行。
M 的数量:
go 语言本身的限制:go 程序启动时,会设置 M 的最大数量,默认 10000。一般内核很难支持这么多线程数,这个限制可以忽略。
runtime/debug 中的 SetMaxThreads 函数,设置 M 的最大数量
一个 M 阻塞了,会创建新的 M。
M 与 P 的数量没有绝对关系,一个 M 阻塞,P 就会去创建或者切换另一个 M,所以,即使 P 的默认数量是 1,也有可能会创建很多个 M 出来。
P 和 M 何时会被创建?
P 何时创建:在确定了 P 的最大数量 N 后,程序运行时系统会创建 N 个 P。
M 何时创建:没有足够的 M 来关联 P 并运行其中的可运行的 G。比如所有的 M 此时都阻塞了,但是 P 中还有很多就绪任务,就要去寻找空闲 M,没找到空闲的 M 就会去创建新的 M。
3、调度器的设计策略
复用线程:避免线程被频繁创建、销毁。
1)work stealing 机制
当本线程无可运行的 G 时,会尝试从其他线程绑定的 P 偷取 G,而不是把线程销毁。
2)hand off 机制
当本线程因为 G 进行系统调用阻塞时,线程释放绑定的 P,把 P 转移给其他空闲的线程执行。
利用并行:GOMAXPROCS 设置 P 的数量,最多有 GOMAXPROCS 个线程分布在多个 CPU 上同时运行。GOMAXPROCS 也限制了并发的程度,比如 GOMAXPROCS = 核数/2,则最多利用了一半的 CPU 核进行并行。
抢占:在 coroutine 中要等待一个协程主动让出 CPU 才执行下一个协程(非抢占);Golang 中,为防止其他 goroutine 被饿死,一个 goroutine 最多占用 CPU 10ms(抢占),这是 goroutine 不同于 coroutine 的一个地方。
全局 G 队列:当 M 执行 work stealing 从其他 P 偷不到 G 时,就可以从全局 G 队列获取 G。
4、go func() 的调度流程
分析上图得出结论:
可以通过 go func () 创建一个 goroutine;有两个存储 G 的队列,一个是调度器 P 的本地 G 队列、一个是全局 G 队列。新创建的 G 会先保存在 P 的本地队列,如果 P 的本地队列已满就会保存在全局的队列里;G 只能运行在 M 中,一个 M 必须持有一个 P,M 与 P 是 1:1 的关系。M 会从 P 的本地队列d出一个可执行状态的 G 来执行,如果 P 的本地队列为空,就会从其他 MP 组合偷取一个可执行的 G 来执行;一个 M 调度 G 执行的过程是一个循环机制;当 M 执行某一个 G 时候如果发生了 syscall(系统调用) 等 *** 作,M 会阻塞,如果当前正好有一些 G 在执行,runtime 会把这个线程 M 从 P 中摘除,然后再创建一个新的 *** 作系统的线程 (如果有空闲的线程可用就复用空闲线程) 来服务于这个 P;当 M 系统调用结束时,这个 G 会尝试获取一个空闲的 P 执行,并放入到这个 P 的本地队列。如果获取不到 P,那么这个线程 M 变成休眠状态, 加入到空闲线程中,然后这个 G 会被放入全局队列中。
参考文档地址:GMP原理
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)