下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

编程语言理解什么是Java内存模型

作者:聚IT     来源: 今日头条点击数:787发布时间: 2020-02-25 10:42:40

标签: 编程语言Java操作系统Javascript系统视频

大神带你学编程,欢迎选课

循序渐进 理解什么是java内存模型。编程语言原本是被设计成专门使用在计算机上的,但它们也可以用来定义算法或者数据结构。正是因为如此,程序员才会试图使程序代码更容易阅读。

本文从硬件可能出现的问题引出计算机内存模型解决方案,进而提取出多线程并发问题,最后再引出Java内存模型。

近期笔者在阅读《深入理解Java虚拟机:JVM高级特性与最佳实现(第3版)》,书中提到关于Java内存模型的知识点,但是看完之后还是感觉有些模糊,便查阅一些其他相关资料。本文是笔者经过对知识理解和整理后的一个总结,希望能够帮助朋友们对Java内存模型有更加清晰的认识,对于文章内容有其他想法或意见建议等,欢迎提出共同讨论共同进步。下面将从以下三点展开讨论:
  • 内存模型的由来
  • 内存模型的定义
  • Java内存模型及实现

内存模型的由来

1. 计算机在执行程序的时候每条指令都是由CPU来执行的。而CPU在执行的时候为了获取数据,所以难免与主存打交道。

编程语言理解什么是Java内存模型_编程语言_Java_Javascript_课课家

2. 随着CPU技术的发展其执行越来越高速度,越来也快,同时因内存技术发展比较缓慢,性能没有太大的变化,所以导致出现CPU每次操作内存都需要耗费一定的等待时间。

3. 为在保证CPU技术发展同时优化解决这一问题,人们后来想出来了一个方案,就是在CPU和内存之间增加高速缓冲存储器(Cache)。

高速缓冲存储器是存在于主存与CPU之间的一级存储器, 由静态存储芯片(SRAM)组成,容量比较小但速度比主存高得多, 接近于CPU的速度。在计算机存储系统的层次结构中,是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。

因为Cache速度接近于CPU的速度且CPU每次操作主存前都会先访问Cache,所以通过增加Cache后当便达到了优化的效果。

4. 随着CPU的升级,一层缓存慢慢地无法满足要求,因此逐渐地衍生出多级缓存。每一级缓存中所储存的全部数据都是下一级缓存的一部分。而CPU读取数据也演变为:当CPU要读取一个数据时,首先从一级缓存中查找,如果没有找到再从二级缓存中查找,如果还是没有就从下一级缓存查直到访问内存。如下图所示

5. 单核CPU只含有一套L1,L2,L3缓存;如果CPU含有多个核心,即多核CPU,则每个核心都含有一套L1(甚至和L2)缓存,而共享L3(或者和L2)缓存,下图是一个单CPU双核得缓存结构图:

随着计算机能力不断提升,开始支持多线程,那么就可能会问题了。我们分别来分析下单线程、多线程在单核CPU、多核CPU中的影响。

  • 单核cpu与单线程:核心的缓存只被一个线程访问,缓存独占,不会出现访问冲突等问题。
  • 单核CPU与多线程:进程中的多个线程会同时访问进程中的共享数据,CPU将某块内存加载到缓存后,不同线程在访问相同的物理地址的时候,都会映射到相同的缓存位置,这样即使发生线程的切换,缓存仍然不会失效。但由于任何时刻只能有一个线程在执行,因此不会出现缓存访问冲突。
  • 多核CPU与多线程:每个核都至少有一个L1 缓存用于提升效率。当多个线程分别在不同的核心上执行且访问进程中的同个共享内存,由于多核是可以并行的,则可能会出现类似多线程编程中出现的并发问题,如对于同一块内存中的变量,多个核心同时读写修改数据的话,就会出现不可预期的错误,而其解决思路则是通过锁机制。

所以在CPU和主存之间增加缓存,在多核CPU多线程场景下发生并发内存访问操作时可能会出现歧义。

处理器优化--“指令重排”

除了上面的问题之外,还有另一个硬件问题也比较重要:处理器为了使其内部的运算单元能够被充分利用会进行优化,可能会乱序执行处理输入代码,此处暂理解为“指令重排”。除了一些处理器会对代码进行优化乱序处理外,很多编程语言的编译器也会有类似的优化,比如Java虚拟机的JIT即时编译器也会做指令重排。

如Java单例设计模式Double-Check例子中的voliate关键字应用就是为了防止因指令重排导致在多线程并发场景下出现异常。感兴趣的朋友可以参考我的另一篇文章深入解析单例模式--懒汉模式,这里就不再进行过多的探讨。

什么是内存模型

上面分析了那么多其实目的是为了引出两个重要问题:

  • 多核CPU多线程场景下发生并发内存访问操作时可能会出现歧义
  • 处理器为了使其内部的运算单元能够被充分利用会自行进行优化--“指令重排”

那么对于以上问题该如何解决?这时候便引出了重要概念--内存模型,定义如下:

内存模型是对内存进行读写访问过程的抽象,可以理解为内存模型定义了共享内存系统中读写操作行为的规范,通过这些规则来规范对内存的读写操作,从而保证指令执行的正确性。它与处理器有关、与缓存有关、与并发有关、与编译器也有关。目的是为解决CPU多级缓存、处理器优化、指令重排等导致的问题与歧义。

可以简单理解为内存模型其实就是解决多线程场景下因并发所导致的问题的一个重要规范。

Java内存模型

1. 定义

Java内存模型(Java Memory Model ,JMM)就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,以实现让Java程序在各种平台下都能达到一致的内存访问效果的规范。

2. 理解

Java内存模型(简称“JMM”)是一个规范,其主要目的是定义程序中各种变量的访问规则,是围绕着在并发过程中如何处理原子性、可见性和有序性三个特征来建立的。

关于Java内存模型的实现,相信熟悉Java并发编程的朋友一定会熟悉,Java提供了一系列和并发处理相关的关键字,其实这些就是Java内存模型封装了底层的实现后提供给程序员使用的一些关键字,本文在这里就不对这些关键字一一展开讨论了,感兴趣的朋友可以看看《Java多线程编程核心技术》进行了解。其中如:

  • 通过使用volatile关键字解决因指令重排导致的问题
  • 通过synchronized关键字来保证线程安全等

等方式其实就与硬件通过计算机内存模型中限制处理器优化和使用内存屏障等解决问题的思路一致。

最后

本文从硬件可能出现的问题引出计算机内存模型解决方案,进而提取出多线程并发问题。最后再引出Java内存模型。Java内存模型可以简单理解就是一套围绕着在并发过程中如何处理原子性、可见性和有序性三个特征来建立的规范,而如synchronized等关键字则是其具体实现。

编程语言往往使程序员能够比使用机器语言更准确地表达他们所想表达的目的。对那些从事计算机科学的人来说,懂得程序设计语言是十分重要的,因为在当今所有的计算都需要程序设计语言才能完成。

赞(15)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程