Ruby的GIL

 

一、什么是GIL

GIL即全局解释锁(global interpreter lock),这个锁环绕着Ruby代码的执行,在一个多线程上下文中,任何时候只有一个线程可以执行Ruby代码。因此即使在多核的机器上运行多线程应用,在特定时间点上也只有一个线程和一个核心在忙碌,GIL一直保护着Ruby内核,以免竞争条件造成数据混乱。

 

二、GIL产生原因

首先,Ruby线程依托于原生操作系统线程,所以Ruby线程的调度也是源于操作系统的线程调度程序。其次,对于Ruby来说其实没有什么操作是线程安全的,比如最简单的数组附加,如下:

arr = [] arr << ‘str1’

Ruby中的数组附加其实包含许多步骤,在其底层实现上是包含一大堆代码:

VALUE rb_ary_push(VALUE ary, VALUE iterm) {     long idx = RARRAY_LEN(ary);     ary_ensure_room_for_push(ary, 1);     RARRAY_ASET(ary, idx, item);     ARY_SET_LEN(ary, idx + 1);     return ary; }

这段代码揭示了数据附加包含以下几个步骤:

1.    获取数组当前长度;

2.    检查数组是否有空间容纳新的元素;

3.    将元素附加到数组;

4.    修改数据长度+1。

由于这么一系列操作不是线程安全的,所以在多线程应用中,会频繁发生上下文切换,这样就可能会发生一些匪夷所思的错误,为此,我们需要使这些操作具有原子性,所以我们需要使用GIL来解决这个问题。GIL保卫着系统的内部状态,使用GIL,就不需要在数据结构周围使用任何锁或者同步机制。如果两个线程不能够同时改变内部状态,也就不会有竞争条件发生了。

 

三、GIL的实现原理

Ruby的线程依托于原生的操作系统的线程,但是当一个Ruby线程希望在其原生操作系统线程中执行代码的时,必须要先获得GIL,如下图所示,在特定时间点上只有一个线程可以获取GIL,于是Ruby的代码执行是完全不能并行的。

 

那么Ruby如何保证GIL被线程独霸呢?Ruby提供了一个计时器线程,这个线程是仅存在于Ruby内部的原生线程,当Ruby启动并只有主线程运行时,定时器线程处于沉睡状态,但一旦有线程等待GIL,定时器线程就会被唤醒。定时器线程是用于避免一个线程独霸GIL的情况,每经过一定周期,定时器线程在当前持有GIL的线程上设置一个中断标志,Ruby会检查这些中断标志,被设置中断标志的线程会停止运行并释放GIL,这样,别的线程就可以获取GIL继而执行其代码。

 

 

四、总结

GIL是Ruby内部实现细节,是为了保证Ruby内部执行的安全,它保证了Ruby中C实现的底层方法的原子性。

PS:以上内容都是基于CRuby的,对于JRuby或者Rubinius来说,它们是可以真正做到多线程并发执行的。