专业的JAVA编程教程与资源

网站首页 > java教程 正文

《深入理解Java虚拟机》5分钟速成:12章(Java内存模型与线程)

temp10 2024-11-26 08:56:33 java教程 13 ℃ 0 评论

第12章 Java内存模型与线程

前言:

《深入理解Java虚拟机》5分钟速成:12章(Java内存模型与线程)

1、物理机如何处理并发问题?

2、什么是Java内存模型?

3、原子性、可见性、有序性的具体含义和应用实现?

4、volatile 关键字特性?

5、基于volatile变量的运算在并发下是否是线程安全的?

6、Java线程调度方式?


12.1 关于并发

物理机的并发引入:

  • 运算任务,除了需要处理器计算之外,还需要与内存交互,如读取运算数据、存储运算结果等(不能仅靠寄存器来解决)。
  • 计算机的存储设备和处理器的运算速度差了几个数量级,所以不得不加入一层读写速度尽可能接近处理器运算速度的高速缓存(Cache),作为内存与处理器之间的缓冲:将运算需要的数据复制到缓存中,让运算快速运行。当运算结束后再从缓存同步回内存,这样处理器就无需等待缓慢的内存读写了。

12.2 硬件的效率和一致性

  • 缓存一致性:基于高速缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是引入了一个新的问题:缓存一致性。在多处理器系统中,每个处理器都有自己的高速缓存,它们又共享同一主内存。当多个处理器的运算任务都涉及同一块主内存时,可能导致各自的缓存数据不一致。
  • CPU乱序执行优化:为了解决一致性的问题,需要各个处理器访问缓存时遵循缓存一致性协议。同时为了使得处理器充分被利用,处理器可能会对输出代码进行乱序执行优化。
  • JVM 指令重排序优化:Java虚拟机的即时编译器也有类似的指令重排序优化。


12.3 Java 内存模型

  • Java内存模型:Java虚拟机的规范,用来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各个平台下都能达到一致的并发效果。
  • Java内存模型的目标:定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出这样的底层细节。此处的变量包括实例字段、静态字段和构成数组对象的元素,但是不包括局部变量和方法参数,因为这些是线程私有的,不会被共享,所以不存在竞争问题。

12.3.1 主内存与工作内存

所以的变量都存储在主内存,每条线程还有自己的工作内存,保存了被该线程使用到的变量的主内存副本拷贝。线程对变量的所有操作(读取、赋值)都必须在工作内存中进行,不能直接读写主内存的变量。不同的线程之间也无法直接访问对方工作内存的变量,线程间变量值的传递需要通过主内存。


12.3.2 内存间的交互操作

一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存,Java内存模型定义了8种操作:


12.3.3 volatile 关键字

关键字volatile:是Java虚拟机提供的最轻量级的同步机制。当一个变量被定义成volatile之后,具备两种特性:

  • 保证此变量对所有线程的可见性。当一条线程修改了这个变量的值,新值对于其他线程是可以立即得知的。而普通变量做不到这一点。
  • 禁止指令重排序优化。普通变量仅仅能保证在该方法执行过程中,得到正确结果,但是不保证程序代码的执行顺序。

volatile变量&线程安全问题(非充分条件):

  • volatile变量在各个线程的工作内存,不存在一致性问题(各个线程的工作内存中volatile变量,每次使用前都要刷新到主内存)。
  • 但是Java里面的运算并非原子操作,导致volatile变量的运算在并发下一样是不安全的。

volatile的性能:

在某些情况下,volatile同步机制的性能要优于锁(synchronized关键字),但是由于虚拟机对锁实行的许多消除和优化,所以并不是很快。

volatile变量读操作的性能消耗与普通变量几乎没有差别,但是写操作则可能慢一些,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。


12.3.4 对 long&double(64位)变量的规则

商业JVM已内部实现:针对 64位变量操作的原子性,不需要用户再额外添加volatile机制。


12.3.5 原子性、可见性、有序性

  • 原子性(Atomicity):对基本数据类型的访问和读写是具备原子性的。对于更大范围的原子性保证,可以使用字节码指令monitorenter和monitorexit来隐式使用lock和unlock操作。这两个字节码指令反映到Java代码中就是同步块——synchronized关键字。因此synchronized块之间的操作也具有原子性。
  • 可见性(Visibility):当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取之前从主内存刷新变量值来实现可见性的。volatile的特殊规则保证了新值能够立即同步到主内存,每次使用前立即从主内存刷新。synchronized和final也能实现可见性。final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把this的引用传递出去,那么其他线程中就能看见final字段的值。
  • 有序性(Ordering):Java程序的有序性可以总结为一句话,如果在本线程内观察,所有的操作都是有序的(线程内表现为串行的语义);如果在一个线程中观察另一个线程,所有的操作都是无序的(指令重排序和工作内存与主内存同步延迟线性)。
  • 总结:synchronized 可同时实现:原子性+可见性+有序性。

12.3.6 先行发生原则

先行发生(happens-before)是Java内存模型中定义的两项操作之间的偏序关系,如果操作A先行发生于操作B,其实就是说在发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中共享变量的值/发送了消息/调用了方法等。

下面是Java内存模型下一些“天然的”先行发生关系,无须任何同步器协助就已经存在,可直接在编码中使用。如果两个操作之间的关系不在此列,并且无法从下列规则推倒出来,它们就没有顺序性的保障,虚拟机可以对它们进行随意地重排序。

  • 1)程序次序规则(Program Order Rule):在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。准确地来说应该是控制流顺序而不是程序代码顺序,因为要考虑分支/循环结构。
  • 2)管程锁定规则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一锁的lock操作。这里必须强调的是同一锁,而“后面”是指时间上的先后顺序。
  • 3)volatile变量规则(Volatile Variable Rule):对一个volatile变量的写操作先行发生于后面对这个变量的读操作,这里的“后面”是指时间上的先后顺序。
  • 4)线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。
  • 5)线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread.join()方法结束/Thread.isAlive()的返回值等手段检测到县城已经终止执行。
  • 6)线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生,可以通过Thread.interrupted()方法检测到是否有中断发生。
  • 7)对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始。
  • 8)传递性(Transitivity):如果操作A先行发生于操作B,操作B先行发生于操作C,那么操作A先行发生于操作C。

时间上的先后顺序与先行发生原则之间基本没有太大的关系,所以我们衡量并发安全问题时不要受时间顺序的干扰,一切必须以先行发生原则为准。


12.4 Java并发与线程

  • 并发与线程:并发不一定要依赖多线程,PHP中有多进程并发。但是Java里面的并发是多线程的。
  • 线程:是比进程更轻量级的调度执行单位。线程可以把一个进程的资源分配和执行调度分开,各个线程既可以共享进程资源(内存地址、文件I/O),又可以独立调度(线程是CPU调度的最基本单位)。

12.4.1 线程实现

实现线程有哪些方式?

  • 使用内核线程实现(非Java)
  • 使用用户线程实现
  • 使用用户线程+轻量级进程混合实现

Java线程的实现:操作系统支持怎样的线程模型,在很大程度上就决定了Java虚拟机的线程是怎样映射的。

12.4.2 Java线程调度

  • 线程调度:线程调度是系统为线程分配处理器使用权的过程。包含下列两种方式:
  • 协同式线程调度:实现简单,没有线程同步的问题。但是线程执行时间不可控,容易系统崩溃。
  • 抢占式线程调度(Java采用此方式):每个线程由系统来分配执行时间,不会有线程导致整个进程阻塞的问题。

Java的线程调度

虽然Java线程调度是系统自动完成的,但是我们可以建议系统给某些线程多分配点时间——设置线程优先级。Java语言有10个级别的线程优先级,优先级越高的线程,越容易被系统选择执行。但是并不能完全依靠线程优先级。因为Java的线程是被映射到系统的原生线程上,所以线程调度最终还是由操作系统说了算。如Windows中只有7种优先级,所以Java不得不出现几个优先级相同的情况。同时优先级可能会被系统自行改变。Windows系统中存在一个“优先级推进器”,当系统发现一个线程执行特别勤奋,可能会越过线程优先级为它分配执行时间。


12.4.3 状态转换

Java语言定义了5种进程状态,在任意一个时间点,一个线程只能有且只有其中一种状态:

  • 新建(New):创建尚未启动的线程处于这种状态。
  • 运行(Runable):包括操作系统线程状态中的Running和Ready,处于此状态的线程可能正在运行,也可能等待着CPU为它分配执行时间。
  • 无限期等待(Waiting):处于这种状态的线程不会被分配CPU执行时间,它们要等待其他线程显示地唤醒。
  • 限期等待(Timed Waiting):处于这种状态的线程也不会被分配CPU执行时间,不过无须等待被其他线程显示地唤醒,在一定时间后由系统自动唤醒。
  • 阻塞(Blocked):线程被阻塞了,“阻塞状态”与“等待状态”的区别是:“阻塞状态”在等待获取一个排它锁,这个事件将在另外一个线程放弃这个锁的时候发生;“等待状态”则是在等待一段时间,或者唤醒动作的发生。在程序进入等待进入同步块区域的时候,线程将进入这种状态。
  • 结束(Terminated):已终止线程的线程状态,线程已经结束执行。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表