- 一、Java内存模型之JMM
- 1.1 计算机硬件存储体系
- 1.2 Java内存模型Java Memory Model
- 1.3 JMM规范下,三大特性
- 1.3.1 可见性
- 1.3.2 原子性
- 1.3.3 有序性
- 案例
- 1.4 JMM规范下, 多线程对变量的读写过程
- 1.4.1 读取过程
- 1.4.2 小总结
- 1.5 JMM规范下,多线程先行发生原则之happens-before
- 1.5.1 x,y案例说明
- 1.5.2 先行发生原则说明
- 1.5.3 happens-before总原则
- 1.5.4 happens-before之8条
- 1.5.5 案例说明
- 二、volatile与Java内存模型
- 2.1 volatile两大特点
- 2.1.2 volatile的内存语义
- 2.2 内存屏障
- 2.2.1 是什么?
- 2.2.2 volatile凭什么可以保证可见性和有序性?
- 2.2.3 JVM中提供了四类内存屏障指令
- C++源码
- 四大屏障分别是什么意思
- 2.2.4 happens-before之volatile变量规则
- 2.2.5 JMM的4中内存屏障插入策略
- 在每一个volatile写 *** 作前面插入一个StoreStore屏障
- 在每一个volatile写 *** 作后面插入一个StoreLoad屏障
- 在每一个volatile读 *** 作后面插入一个LoadLoad屏障
- 在每一个volatile读 *** 作后面插入一个LoadStore屏障
- 2.3 volatile特性
- 2.3.1 保证可见性
- 测试代码
- 上述代码原理解析
- volatile变量的读写过程
- 2.3.2 没有原子性
- code
- 既然一修改就是可见,为什么还不能保证原子性?
- 读取赋值一个volatile变量的情况
- JVM的字节码,i++分成三步,间隙期不同步非原子 *** 作(i++)
- 2.3.3 防止指令重排
- code(模拟一个单线程,什么顺序读?什么顺序写?)
- 2.4 如何正确使用volatile
- 单一赋值可以,but含复合运算赋值不可以(i++之类)
- 状态标志,判断业务是否结束
- 开销较低的读,写锁策略
- DCL双检锁
- 问题
- 解决01
- 解决02 采用静态内部类的方式实现
- 2.5 总结
- 2.5.1 内存屏障是什么?
- 2.5.2 内存屏障能干嘛?
- 2.5.3 内存屏障4大指令
- 2.5.4 volatile关键字和内存屏障的关系
- 关键字
- 2.5.5 volatile可见性
- 2.5.6 volatile禁重排
- 2.5.7 对比java.util.concurrent.locks.Lock来理解
- 2.5.8 一句话总结
- 计算机存储结构,从本地磁盘到主存到CPU缓存,也就是从硬盘到内存,到CPU。
一般对应的程序的 *** 作就是从数据库查数据到内存然后到CPU进行计算
因为有这么多级的缓存(cpu和物理主内存的速度不一致的),
CPU的运行并不是直接 *** 作内存而是先把内存里边的数据读到缓存,而内存的读和写 *** 作的时候就会造成不一致的问题
Java虚拟机规范中试图定义一种Java内存模型(java Memory Model,简称JMM) 来屏蔽掉各种硬件和 *** 作系统的内存访问差异,
以实现让Java程序在各种平台下都能达到一致的内存访问效果。推导出我们需要知道JMM
JMM(Java内存模型Java Memory Model,简称JMM)本身是一种抽象的概念并不真实存在它仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程)各个变量的读写访问方式并决定一个线程对共享变量的写入何时以及如何变成对另一个线程可见,关键技术点都是围绕多线程的原子性、可见性和有序性展开的。
原则:
JMM的关键技术点都是围绕多线程的原子性、可见性和有序性展开的
能干嘛?
1 通过JMM来实现线程和主内存之间的抽象关系。
2 屏蔽各个硬件平台和 *** 作系统的内存访问差异以实现让Java程序在各种平台下都能达到一致的内存访问效果。
- 是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更 ,JMM规定了所有的变量都存储在主内存中。
Java中普通的共享变量不保证可见性,因为数据修改被写入内存的时机是不确定的,多线程并发下很可能出现"脏读",所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝,线程对变量的所有 *** 作(读取,赋值等 )都必需在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成
线程脏读:如果没有可见性保证
- 指一个 *** 作是不可中断的,即多线程环境下, *** 作不能被其他线程干扰
对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。
但为了提供性能,编译器和处理器通常会对指令序列进行重新排序。
指令重排可以保证串行语义一致,但没有义务保证多线程间的语义也一致,即可能产生"脏读",简单说,
两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化。
单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。
处理器在进行重排序时必须要考虑指令之间的数据依赖性
多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测
public void mySort() { int x = 11; //语句1 int y = 12; //语句2 x = x + 5; //语句3 y = x * x; //语句4 }
4123不可以,语句4依赖语句1
读取过程:
由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的 *** 作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到的线程自己的工作内存空间,然后对变量进行 *** 作, *** 作完成后再将变量写回主内存,不能直接 *** 作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如下图:
JMM定义了线程和主内存之间的抽象关系
- 1 线程之间的共享变量存储在主内存中(从硬件角度来说就是内存条)
- 2 每个线程都有一个私有的本地工作内存,本地工作内存中存储了该线程用来读/写共享变量的副本(从硬件角度来说就是CPU的缓存,比如寄存器、L1、L2、L3缓存等)
- 我们定义的所有共享变量都储存在物理主内存中
- 每个线程都有自己独立的工作内存,里面保存该线程使用到的变量的副本(主内存中该变量的一份拷贝)
- 线程对共享变量所有的 *** 作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存中读写(不能越级)
- 不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行(同级不能相互访问)
在JMM中,
如果一个 *** 作执行的结果需要对另一个 *** 作可见性 或者 代码重排序,那么这两个 *** 作之间必须存在happens-before关系。
如果Java内存模型中所有的有序性都仅靠volatile和synchronized来完成,那么有很多 *** 作都将会变得非常啰嗦,
但是我们在编写Java并发代码的时候并没有察觉到这一点。
我们没有时时、处处、次次,添加volatile和synchronized来完成程序,这是因为Java语言中JMM原则下
有一个“先行发生”(Happens-Before)的原则限制和规矩
这个原则非常重要:
它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规则一揽子解决并发环境下两个 *** 作之间是否可能存在冲突的所有问题,而不需要陷入Java内存模型苦涩难懂的底层编译原理之中。
- 如果一个 *** 作happens-before另一个 *** 作,那么第一个 *** 作的执行结果将对第二个 *** 作可见,
而且第一个 *** 作的执行顺序排在第二个 *** 作之前。 - 两个 *** 作之间存在happens-before关系,并不意味着一定要按照happens-before原则制定的顺序来执行。
如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序并不非法。
- 1 次序规则:
- 一个线程内,按照代码顺序,写在前面的 *** 作先行发生于写在后面的 *** 作;
- 前一个 *** 作的结果可以被后续的 *** 作获取。讲白点就是前面一个 *** 作把变量X赋值为1,那后面一个 *** 作肯定能知道X已经变成了1。
- 2 锁定规则:
- 一个unLock *** 作先行发生于后面((这里的“后面”是指时间上的先后))对同一个锁的lock *** 作;
public class HappenBeforeDemo{ static Object objectLock = new Object(); public static void main(String[] args) throws InterruptedException { //对于同一把锁objectLock,threadA一定先unlock同一把锁后B才能获得该锁, A 先行发生于B synchronized (objectLock) { } } }
- 3 volatile变量规则:
- 对一个volatile变量的写 *** 作先行发生于后面对这个变量的读 *** 作,前面的写对后面的读是可见的,这里的“后面”同样是指时间上的先后。
- 4 传递规则:
- 如果 *** 作A先行发生于 *** 作B,而 *** 作B又先行发生于 *** 作C,则可以得出 *** 作A先行发生于 *** 作C;
- 5 线程启动规则(Thread Start Rule):
- Thread对象的start()方法先行发生于此线程的每一个动作
- 6 线程中断规则(Thread Interruption Rule):
- 对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;
- 可以通过Thread.interrupted()检测到是否发生中断
- 7 线程终止规则(Thread Termination Rule):
- 线程中的所有 *** 作都先行发生于对此线程的终止检测,我们可以通过Thread::join()方法是否结束、Thread::isAlive()的返回值等手段检测线程是否已经终止执行。
- 8 对象终结规则(Finalizer Rule):
- 一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始
- 对象没有完成初始化之前,是不能调用finalized()方法的
修复:
- 把getter/setter方法都定义为synchronized方法
- 把value定义为volatile变量,由于setter方法对value的修改不依赖value的原值,满足volatile关键字使用场景
- 可见性
- 有序性
- 当写一个volatile变量时,JMM会把该线程对应的本地内存中的共享变量值立即刷新回主内存中。
- 当读一个volatile变量时,JMM会把该线程对应的本地内存设置为无效,直接从主内存中读取共享变量
- 所以volatile的写内存语义是直接刷新到主内存中,读的内存语义是直接从主内存中读取。
内存屏障(也称内存栅栏,内存栅障,屏障指令等,是一类同步屏障指令,是CPU或编译器在对内存随机访问的 *** 作中的一个同步点,使得此点之前的所有读写 *** 作都执行后才可以开始执行此点之后的 *** 作),避免代码重排序。内存屏障其实就是一种JVM指令,Java内存模型的重排规则会要求Java编译器在生成JVM指令时插入特定的内存屏障指令,通过这些内存屏障指令,volatile实现了Java内存模型中的可见性和有序性,但volatile无法保证原子性。
内存屏障之前的所有写 *** 作都要回写到主内存,
内存屏障之后的所有读 *** 作都能获得内存屏障之前的所有写 *** 作的最新结果(实现了可见性)。
因此重排序时,不允许把内存屏障之后的指令重排序到内存屏障之前。
一句话:对一个 volatile 域的写, happens-before 于任意后续对这个 volatile 域的读,也叫写后读。
内存屏障(Memory Barriers/Fences)
2.2.3 JVM中提供了四类内存屏障指令 C++源码Unsafe.class
Unsafe.java
Unsafe.cpp
OrderAccess.hpp
orderAccess_linux_x86.inline.hpp
- StoreStore屏障可以保证在volatile写之前,其前面的所有普通写 *** 作都已经刷新到主内存中。
- StoreLoad屏障的作用是避免volatile写与后面可能有的volatile读/写 *** 作重排序
- LoadLoad屏障用来禁止处理器把上面的volatile读与下面的普通读重排序。
- LoadStore屏障用来禁止处理器把上面的volatile读与下面的普通写重排序。
- 保证不同线程对这个变量进行 *** 作时的可见性,即变量一旦改变所有线程立即可见
- 不加volatile,没有可见性,程序无法停止
- 加了volatile,保证可见性,程序可以停止
public class VolatileSeeDemo { static boolean flag = true; //不加volatile,没有可见性 //static volatile boolean flag = true; //加了volatile,保证可见性 public static void main(String[] args) { new Thread(() -> { System.out.println(Thread.currentThread().getName()+"t"+"---come in"); while(flag) { new Integer(308); } System.out.println("t1 over"); },"t1").start(); try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } new Thread(() -> { flag = false; },"t2").start(); } }上述代码原理解析
线程t1中为何看不到被主线程main修改为false的flag的值?
问题可能:
- 主线程修改了flag之后没有将其刷新到主内存,所以t1线程看不到。
- 主线程将flag刷新到了主内存,但是t1一直读取的是自己工作内存中flag的值,没有去主内存中更新获取flag最新的值。
我们的诉求:
1.线程中修改了工作内存中的副本之后,立即将其刷新到主内存;
2.工作内存中每次读取共享变量时,都去主内存中重新读取,然后拷贝到工作内存。
解决:
使用volatile修饰共享变量,就可以达到上面的效果,被volatile修改的变量有以下特点:
- 线程中读取的时候,每次读取都会去主内存中读取共享变量最新的值,然后将其复制到工作内存
- 线程中修改了工作内存中变量的副本,修改之后会立即刷新到主内存
Java内存模型中定义的8种工作内存与主内存之间的原子 *** 作
read(读取)→load(加载)→use(使用)→assign(赋值)→store(存储)→write(写入)→lock(锁定)→unlock(解锁)
read: 作用于主内存,将变量的值从主内存传输到工作内存,主内存到工作内存
load: 作用于工作内存,将read从主内存传输的变量值放入工作内存变量副本中,即数据加载
use: 作用于工作内存,将工作内存变量副本的值传递给执行引擎,每当JVM遇到需要该变量的字节码指令时会执行该 *** 作
assign: 作用于工作内存,将从执行引擎接收到的值赋值给工作内存变量,每当JVM遇到一个给变量赋值字节码指令时会执行该 *** 作
store: 作用于工作内存,将赋值完毕的工作变量的值写回给主内存
write: 作用于主内存,将store传输过来的变量值赋值给主内存中的变量
由于上述只能保证单条指令的原子性,针对多条指令的组合性原子保证,没有大面积加锁,所以,JVM提供了另外两个原子指令:
lock: 作用于主内存,将一个变量标记为一个线程独占的状态,只是写时候加锁,就只是锁了写变量的过程。
unlock: 作用于主内存,把一个处于锁定状态的变量释放,然后才能被其他线程占用
- volatile变量的复合 *** 作(如i++)不具有原子性
class MyNumber { volatile int number = 0; public void addPlusPlus() { number++; } } public class VolatileNoAtomicDemo { public static void main(String[] args) throws InterruptedException { MyNumber myNumber = new MyNumber(); for (int i = 1; i <=10; i++) { new Thread(() -> { for (int j = 1; j <= 1000; j++) { myNumber.addPlusPlus(); } },String.valueOf(i)).start(); } //暂停几秒钟线程 try { TimeUnit.SECONDS.sleep(3); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println(Thread.currentThread().getName() + "t" + myNumber.number); } }
从i++的字节码角度说明
原子性指的是一个 *** 作是不可中断的,即使是在多线程环境下,一个 *** 作一旦开始就不会被其他线程影响。
public void add()
{
i++; //不具备原子性,该 *** 作是先读取值,然后写回一个新值,相当于原来的值加上1,分3步完成
}
如果第二个线程在第一个线程读取旧值和写回新值期间读取i的域值,那么第二个线程就会与第一个线程一起看到同一个值,
并执行相同值的加1 *** 作,这也就造成了线程安全失败,因此对于add方法必须使用synchronized修饰,以便保证线程安全.
不保证原子性
多线程环境下,"数据计算"和"数据赋值" *** 作可能多次出现,即 *** 作非原子。若数据在加载之后,若主内存count变量发生修改之后,由于线程工作内存中的值在此前已经加载,从而不会对变更 *** 作做出相应变化,即私有内存和公共内存中变量不同步,进而导致数据不一致
对于volatile变量,JVM只是保证从主内存加载到线程工作内存的值是最新的,也就是数据加载时是最新的。
由此可见volatile解决的是变量读时的可见性问题,但无法保证原子性,对于多线程修改共享变量的场景必须使用加锁同步
读取赋值一个普通变量的情况
当线程1对主内存对象发起read *** 作到write *** 作第一套流程的时间里,线程2随时都有可能对这个主内存对象发起第二套 *** 作
- volatile主要是对其中部分指令做了处理
重排序
重排序是指编译器和处理器为了优化程序性能而对指令序列进行重新排序的一种手段,有时候会改变程序语句的先后顺序
不存在数据依赖关系,可以重排序;
存在数据依赖关系,禁止重排序
但重排后的指令绝对不能改变原有的串行语义!这点在并发设计中必须要重点考虑!
重排序的分类和执行流程
编译器优化的重排序: 编译器在不改变单线程串行语义的前提下,可以重新调整指令的执行顺序
指令级并行的重排序: 处理器使用指令级并行技术来讲多条指令重叠执行,若不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序
内存系统的重排序: 由于处理器使用缓存和读/写缓冲区,这使得加载和存储 *** 作看上去可能是乱序执行
数据依赖性:若两个 *** 作访问同一变量,且这两个 *** 作中有一个为写 *** 作,此时两 *** 作间就存在数据依赖性。
案例 :
不存在数据依赖关系,可以重排序===> 重排序OK 。
存在数据依赖关系,禁止重排序===> 重排序发生,会导致程序运行结果不同。
编译器和处理器在重排序时,会遵守数据依赖性,不会改变存在依赖关系的两个 *** 作的执行,但不同处理器和不同线程之间的数据性不会被编译器和处理器考虑,其只会作用于单处理器和单线程环境,下面三种情况,只要重排序两个 *** 作的执行顺序,程序的执行结果就会被改变。
public class VolatileTest { int i = 0; volatile boolean flag = false; public void write(){ i = 2; flag = true; } public void read(){ if(flag){ System.out.println("---i = " + i); } } }
public class UseVolatileDemo { private volatile static boolean flag = true; public static void main(String[] args) { new Thread(() -> { while(flag) { //do something...... } },"t1").start(); //暂停几秒钟线程 try { TimeUnit.SECONDS.sleep(2L); } catch (InterruptedException e) { e.printStackTrace(); } new Thread(() -> { flag = false; },"t2").start(); } }开销较低的读,写锁策略
public class UseVolatileDemo { public class Counter { private volatile int value; public int getValue() { return value; //利用volatile保证读取 *** 作的可见性 } public synchronized int increment() { return value++; //利用synchronized保证复合 *** 作的原子性 } } }DCL双检锁 问题
存在指令重排序
单线程环境下(或者说正常情况下),在"问题代码处",会执行如下 *** 作,保证能获取到已完成初始化的实例
隐患:多线程环境下,在"问题代码处",会执行如下 *** 作,由于重排序导致2,3乱序,后果就是其他线程得到的是null而不是完成初始化的对象
right
problem
- volatile修饰
public class SafeDoubleCheckSingleton { //通过volatile声明,实现线程安全的延迟初始化。 private volatile static SafeDoubleCheckSingleton singleton; //私有化构造方法 private SafeDoubleCheckSingleton() { } //双重锁设计 public static SafeDoubleCheckSingleton getInstance() { if (singleton == null){ //1.多线程并发创建对象时,会通过加锁保证只有一个线程能创建对象 synchronized (SafeDoubleCheckSingleton.class){ if (singleton == null){ //隐患:多线程环境下,由于重排序,该对象可能还未完成初始化就被其他线程读取 //原理:利用volatile,禁止 "初始化对象"(2) 和 "设置singleton指向内存空间"(3) 的重排序 singleton = new SafeDoubleCheckSingleton(); } } } //2.对象创建完毕,执行getInstance()将不需要获取锁,直接返回创建对象 return singleton; } }解决02 采用静态内部类的方式实现
public class SingletonDemo { private SingletonDemo() { } private static class SingletonDemoHandler { private static SingletonDemo instance = new SingletonDemo(); } public static SingletonDemo getInstance() { return SingletonDemoHandler.instance; } }2.5 总结 2.5.1 内存屏障是什么? 2.5.2 内存屏障能干嘛?
- 阻止屏障两边的指令重排序
- 写数据时加入屏障,强制将线程私有工作内存的数据刷回主物理内存
- 读数据时加入屏障,线程私有工作内存的数据失效,重新到主物理内存中获取最新数据
-
在每一个volatile写 *** 作前面插入一个StoreStore屏障
-
在每一个volatile写 *** 作后面插入一个StoreLoad屏障
-
在每一个volatile读 *** 作后面插入一个LoadLoad屏障
-
在每一个volatile读 *** 作后面插入一个LoadStore屏障
- 字节码层面:
写指令
读指令
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)