- 一、synchronized锁优化
- 1.1 偏向锁批量重偏向&批量撤销
- 原理
- 应用场景
- JVM的默认参数值
- 测试:批量重偏向
- 测试:批量撤销
- 总结
- 1.2 自旋优化
- 1.3 锁粗化
- 1.4 锁消除
- 1.5 逃逸分析(Escape Analysis)
- 方法逃逸(对象逃出当前方法)
- 线程逃逸((对象逃出当前线程)
- 二、源码分析
- 2.1 Synchronized轻量级锁源码分析
- 2.2 Synchronized重量级锁加锁解锁执行逻辑
关于偏向锁、轻量级锁、重量级锁存在的理解误区:
1、无锁->偏向锁->轻量级锁->重量级锁
ps: 不存在无锁->偏向锁
2、轻量级锁自旋获取所失败后,会膨胀升级为重量级锁
ps:轻量级锁不存在自旋
3、重量级锁不存在自旋
ps:重量级锁反而存在自旋
锁升级总结:
1、偏向锁解锁后依然是偏向锁
2、偏向锁撤销后有可能是无锁、轻量级锁、重量级锁,不同的情况撤销后结果不同(参考上图)
3、轻量级锁是如何存储hashCode的?会在线程栈中创建一个锁记录,然后将无锁状态下的markword拷贝一份,无锁的markword中存有hashCode。并且这个markword还要用于锁撤销后的还原,如果轻量级锁解锁为无锁状态,直接将拷贝的markword CAS修改到锁对象的markword中即可。
4、重量级锁撤销之后是无锁状态,撤销锁之后会清除创建的monitor对象并修改markword,这个过程需要一段时间。Monitor对象是通过GC来清除的。GC清除掉monitor对象之后,就会撤销为无锁状态。
5、无锁状态可以直接升级为重量级锁,当竞争激烈的时候,CAS失败导致升级为轻量级锁失败,会直接升级为重量级锁。
接下来开始这次的正题。
一、synchronized锁优化 1.1 偏向锁批量重偏向&批量撤销从偏向锁的加锁解锁过程中可看出,当只有一个线程反复进入同步块时,偏向锁带来的性能开销基本可以忽略,但是当有其他线程尝试获得锁时,就需要等到safe point时,再将偏向锁撤销为无锁状态或升级为轻量级,会消耗一定的性能,所以在多线程竞争频繁的情况下,偏向锁不仅不能提高性能,还会导致性能下降。于是,就有了批量重偏向与批量撤销的机制。
原理以class为单位,为每个class维护一个偏向锁撤销计数器,每一次该class的对象发生偏向撤销 *** 作时,该计数器+1,当这个值达到重偏向阈值(默认20)时,JVM就认为该class的偏向锁有问题,因此会进行批量重偏向。
每个class对象会有一个对应的epoch字段,每个处于偏向锁状态对象的Mark Word中也有该字段,其初始值为创建该对象时class中的epoch的值。每次发生批量重偏向时,就将该值+1,同时遍历JVM中所有线程的栈,找到该class所有正处于加锁状态的偏向锁,将其epoch字段改为新值。下次获得锁时,发现当前对象的epoch值和class的epoch不相等,那就算当前已经偏向了其他线程,也不会执行撤销 *** 作,而是直接通过CAS *** 作将其Mark Word的Thread Id 改成当前线程Id。
当达到重偏向阈值(默认20)后,假设该class计数器继续增长,当其达到批量撤销的阈值后(默认40),JVM就认为该class的使用场景存在多线程竞争,会标记该class为不可偏向,之后,对于该class的锁,直接走轻量级锁的逻辑。
批量重偏向(bulk rebias)机制是为了解决:一个线程创建了大量对象并执行了初始的同步 *** 作,后来另一个线程也来将这些对象作为锁对象进行 *** 作,这样会导致大量的偏向锁撤销 *** 作。
批量撤销(bulk revoke)机制是为了解决:在明显多线程竞争剧烈的场景下使用偏向锁是不合适的。
JVM的默认参数值设置JVM参数-XX:+PrintFlagsFinal,在项目启动时即可输出JVM的默认参数值
intx BiasedLockingBulkRebiasThreshold = 20 //默认偏向锁批量重偏向阈值
我们可以通过-XX:BiasedLockingBulkRebiasThreshold 和 -XX:BiasedLockingBulkRevokeThreshold 来手动设置阈值
测试:批量重偏向当撤销偏向锁阈值超过 20 次后,jvm 会这样觉得,我是不是偏向错了,于是会在给这些对象加锁时重新偏向至加锁线程,重偏向会重置对象 的 Thread ID
@Slf4j public class LockEscalationDemo12 { public static void main(String[] args) throws InterruptedException { // 延时产生可偏向对象 Thread.sleep(5000); // 创建一个list,来存放锁对象 List
测试结果:
thread1:
创建50个偏向线程thread1的偏向锁。 1-50 偏向锁
thread2:
1-18 偏向锁撤销,升级为轻量级锁 (thread1释放锁之后为偏向锁状态)
19-40 偏向锁撤销达到阈值(20),执行了批量重偏向 (测试结果在第19就开始批量重偏向了)
当撤销偏向锁阈值超过 40 次后,jvm 会认为不该偏向,于是整个类的所有对象都会变为不可偏向的,新建的对象也是不可偏向的。
注意:时间-XX:BiasedLockingDecayTime=25000ms范围内没有达到40次,撤销次数清为0,重新计时
在这里插入代码片
测试结果:
thread3:
1-18 从无锁状态直接获取轻量级锁 (thread2释放锁之后变为无锁状态)
19-40 偏向锁撤销,升级为轻量级锁 (thread2释放锁之后为偏向锁状态)
41-50 达到偏向锁撤销的阈值40,批量撤销偏向锁,升级为轻量级锁 (thread1释放锁之后为偏向锁状态)
新创建的对象: 无锁状态
1、批量重偏向和批量撤销是针对类的优化,和对象无关。
2、偏向锁重偏向一次之后不可再次重偏向。
3、当某个类已经触发批量撤销机制后,JVM会默认当前类产生了严重的问题,剥夺了该类的新实例对象使用偏向锁的权利
1.2 自旋优化重量级锁竞争的时候,还可以使用自旋来进行优化,如果当前线程自旋成功(即这时候持锁线程已经退出了同步块,释放了锁),这时当前线程就可以避免阻塞。
- 自旋会占用 CPU 时间,单核 CPU 自旋就是浪费,多核 CPU 自旋才能发挥优势。
- 在 Java 6之后自旋是自适应的,比如对象刚刚的一次自旋 *** 作成功过,那么认为这次自旋成功的可能性会高,就多自旋几次;反之,就少自旋甚至不自旋,比较智能。
- Java 7 之后不能控制是否开启自旋功能
注意:自旋的目的是为了减少线程挂起的次数,尽量避免直接挂起线程(挂起 *** 作涉及系统调用,存在用户态和内核态切换,这才是重量级锁最大的开销)
1.3 锁粗化假设一系列的连续 *** 作都会对同一个对象反复加锁及解锁,甚至加锁 *** 作是出现在循环体中的,即使没有出现线程竞争,频繁地进行互斥同步 *** 作也会导致不必要的性能损耗。如果JVM检测到有一连串零碎的 *** 作都是对同一对象的加锁,将会扩大加锁同步的范围(即锁粗化)到整个 *** 作序列的外部。
StringBuffer buffer = new StringBuffer(); public void append(){ buffer.append("aaa").append(" bbb").append(" ccc"); }
上述代码每次调用 buffer.append 方法都需要加锁和解锁,如果JVM检测到有一连串的对同一个对象加锁和解锁的 *** 作,就会将其合并成一次范围更大的加锁和解锁 *** 作,即在第一次append方法时进行加锁,最后一次append方法结束后进行解锁。
1.4 锁消除锁消除即删除不必要的加锁 *** 作。锁消除是Java虚拟机在JIT编译期间,通过对运行上下文的扫描,去除不可能存在共享资源竞争的锁,通过锁消除,可以节省毫无意义的请求锁时间。
public class LockEliminationTest { public void append(String str1, String str2) { StringBuffer stringBuffer = new StringBuffer(); stringBuffer.append(str1).append(str2); } public static void main(String[] args) throws InterruptedException { LockEliminationTest demo = new LockEliminationTest(); long start = System.currentTimeMillis(); for (int i = 0; i < 100000000; i++) { demo.append("aaa", "bbb"); } long end = System.currentTimeMillis(); System.out.println("执行时间:" + (end - start) + " ms"); } }
StringBuffer的append是个同步方法,但是append方法中的 StringBuffer 属于一个局部变量,不可能从该方法中逃逸出去,因此其实这过程是线程安全的,可以将锁消除。
测试结果: 关闭锁消除执行时间4688 ms 开启锁消除执行时间:2601 ms
逸分析,是一种可以有效减少Java 程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。通过逃逸分析,Java Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。逃逸分析的基本行为就是分析对象动态作用域。
方法逃逸(对象逃出当前方法)当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他地方中。
public Object getObj() { Object o = new Object(); return o; }线程逃逸((对象逃出当前线程)
这个对象甚至可能被其它线程访问到,例如赋值给类变量或可以在其它线程中访问的实例变量。
使用逃逸分析,编译器可以对代码做如下优化:
1.同步省略或锁消除(Synchronization Elimination)。如果一个对象被发现只能从一个线程被访问到,那么对于这个对象的 *** 作可以不考虑同步。
2.将堆分配转化为栈分配(Stack Allocation)。如果一个对象在子程序中被分配,要使指向该对象的指针永远不会逃逸,对象可能是栈分配的候选,而不是堆分配。
3.分离对象或标量替换(Scalar Replacement)。有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中。
jdk6才开始引入该技术,jdk7开始默认开启逃逸分析。在Java代码运行时,可以通过JVM参数指定是否开启逃逸分析:
-XX:+DoEscapeAnalysis //表示开启逃逸分析 (jdk1.8默认开启) -XX:-DoEscapeAnalysis //表示关闭逃逸分析。 -XX:+EliminateAllocations //开启标量替换(默认打开)
测试:
@Slf4j public class EscapeTest { public static void main(String[] args) { long start = System.currentTimeMillis(); for (int i = 0; i < 500000; i++) { alloc(); } long end = System.currentTimeMillis(); log.info("执行时间:" + (end - start) + " ms"); try { Thread.sleep(Integer.MAX_VALUE); } catch (InterruptedException e1) { e1.printStackTrace(); } } private static String alloc() { Point point = new Point(); return point.toString(); } public void append(String str1, String str2) { StringBuffer stringBuffer = new StringBuffer(); stringBuffer.append(str1).append(str2); } private static void test2() { Point point = new Point(1, 2); System.out.println("point.x=" + point.getX() + "; point.y=" + point.getY()); // int x=1; // int y=2; // System.out.println("point.x="+x+"; point.y="+y); } } @Data @AllArgsConstructor @NoArgsConstructor class Point { private int x; private int y; }
测试结果:开启逃逸分析,部分对象会在栈上分配。
二、源码分析 2.1 Synchronized轻量级锁源码分析注意,轻量级锁是从无锁状态开始加锁的。如果是偏向锁,需要先撤销偏向锁到无锁状态。
所在类:…openjdk8hotspotsrcsharevmruntimesynchronizer.cpp#ObjectSynchronizer::slow_enter
// ----------------------------------------------------------------------------- // Interpreter/Compiler Slow Case // This routine is used to handle interpreter/compiler slow case // We don't need to use fast path here, because it must have been // failed in the interpreter/compiler code. void ObjectSynchronizer::slow_enter(Handle obj, BasicLock* lock, TRAPS) { // 获取对象的markOop数据 mark markOop mark = obj->mark(); assert(!mark->has_bias_pattern(), "should not see bias pattern here"); //判断mark是否为无锁状态:mark的偏向锁标志位为 0,锁标志位为 01; if (mark->is_neutral()) { // Anticipate successful CAS -- the ST of the displaced mark must // be visible <= the ST performed by the CAS. //把mark保存到BasicLock对象的_displaced_header字段 lock->set_displaced_header(mark); //通过CAS尝试将Mark Word更新为指向BasicLock对象的指针,如果更新成功,表示竞争到锁,则执行同步代码 // Atomic::cmpxchg_ptr原子 *** 作保证只有一个线程可以把指向栈帧的指针复制到Mark Word if (mark == (markOop) Atomic::cmpxchg_ptr(lock, obj()->mark_addr(), mark)) { TEVENT (slow_enter: release stacklock) ; return ; } // Fall through to inflate() ... // inflate方法: 锁膨胀的过程,该方法返回一个ObjectMonitor对象,然后调用其enter方法 } else //如果当前mark处于加锁状态,且mark中的ptr指针指向当前线程的栈帧,表示为重入 *** 作,不需要竞争锁 if (mark->has_locker() && THREAD->is_lock_owned((address)mark->locker())) { assert(lock != mark->locker(), "must not re-lock the same lock"); assert(lock != (BasicLock*)obj->mark(), "don't relock with same BasicLock"); lock->set_displaced_header(NULL); return; }
无锁状态分支:
1、首先会判断锁对象的markword是否为无锁状态,即偏向锁标志位为0,做标志位为01;
2、如果是无锁状态,会将该锁对象的markword拷贝一份到BasicLock(轻量级锁在JVM中对应的对象)对象的_displaced_header字段中:
3、然后进行cas *** 作:Atomic::cmpxchg_ptr(lock, obj()->mark_addr(), mark)
尝试将锁对象的_ptr_to_lock_record指针指向当前的LockRecord,即basicLock对象。
- 如果本次CAS成功,表示获取锁成功;
- 如果本次CAS失败,则直接膨胀为重量级锁;注意,这里和我们平时了解到逻辑不一致,轻量级锁间并不存在自旋 *** 作…
加锁状态分支(是否为轻量级锁状态):
1、如果当前mark处于加锁状态(为轻量级锁状态),会判断当前锁对象的markword中的_ptr_to_lock_record指针是否指向当前线程的栈帧:
mark->has_locker() && THREAD->is_lock_owned((address)mark->locker())
- 如果是,表示重入 *** 作,在入栈一个displactedword为null的LockRecorder到本地线程栈;
- lock->set_displaced_header(NULL);
2、如果不是重入,这时候需要膨胀为重量级锁。
膨胀前设置锁记录中的displaced_mark_word为一个特殊值,代表该锁正在用一个重量级锁的monitor;
3、然后会调用ObjectSynchronizer::inflate(2, obj())->enter(THREAD);方法,执行锁膨胀的逻辑,膨胀完成后返回一个ObjectMonitor对象;
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)