python3多线程爬虫中GIL执行效率如何?

python3多线程爬虫中GIL执行效率如何?,第1张

python3多线程爬虫中GIL执行效率如何?

在我们执行程序的时候,可能需要进行多个的运转,这样就会有出现错误的可能性发生。为了防止多个线路的出错,就有了GIL的产生。我们可以把GIL看成能够运行的一把钥匙,只要拥有了这把钥匙,计算机就会为它打开大门,这样听起来是不是很有意思呢?下面我们会详细的讲解一下GIL及其运行效率的一些内容。


GIL的全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考虑,为了数据安全所做的决定。某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,并且在一个python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。GIL只在cpython中才有,因为cpython调用的是c语言的原生线程,所以他不能直接 *** 作cpu,只能利用GIL保证同一时间只能有一个线程拿到数据。而在pypy和jpython中是没有GIL的。

在多线程环境中,Python虚拟机按照以下方式执行

1. 设置GIL。

 2.切换到一个线程去执行。

3.运行

4.把线程设置为睡眠状态。

5.解锁GIL。

6.再次重复以上步骤。

 

python针对不同类型的代码执行效率也是不同的:

1、CPU密集型代码(各种循环处理、计算等等),在这种情况下,由于计算工作多,ticks计数很快就会达到阈值,然后触发GIL的释放与再竞争(多个线程来回切换当然是需要消耗资源的),所以python下的多线程对CPU密集型代码并不友好。 2、IO密集型代码(文件处理、网络爬虫等涉及文件读写的 *** 作),多线程能够有效提升效率(单线程下有IO *** 作会进行IO等待,造成不必要的时间浪费,而开启多线程能在线程A等待时,自动切换到线程B,可以不浪费CPU的资源,从而能提升程序执行效率)。所以python的多线程对IO密集型代码比较友好。

 

使用建议?

python下想要充分利用多核CPU,就用多进程。因为每个进程有各自独立的GIL,互不干扰,这样就可以真正意义上的并行执行,在python中,多进程的执行效率优于多线程(仅仅针对多核CPU而言)。

 

GIL在python中的版本差异

1、在python2.x里,GIL的释放逻辑是当前线程遇见IO *** 作或者ticks计数达到100时进行释放。(ticks可以看作是python自身的一个计数器,专门做用于GIL,每次释放后归零,这个计数可以通过sys.setcheckinterval 来调整)。而每次释放GIL锁,线程进行锁竞争、切换线程,会消耗资源。并且由于GIL锁存在,python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行),这就是为什么在多核CPU上,python的多线程效率并不高。 2、在python3.x中,GIL不使用ticks计数,改为使用计时器(执行时间达到阈值后,当前线程释放GIL),这样对CPU密集型程序更加友好,但依然没有解决GIL导致的同一时间只能执行一个线程的问题,所以效率依然不尽如人意。

有了这把GIL的钥匙,我们就不用了担心在多线程运行的时候可能出现的错乱现象。而且值得要再提一句的是,GIL在python2和3中是不同的,这点小伙伴们可要记住了哦~更多Python学习指路:PyThon学习网教学中心。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/3014326.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-09-28
下一篇 2022-09-28

发表评论

登录后才能评论

评论列表(0条)

保存