JVM探究
- 对JVM的理解?java8虚拟机和之前的变化?
- 什么是OOM,什么事栈溢出StackOverFlowError?怎么分析?
- JVM的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?
- JVM中,类加载器的认识?
JVM的位置
硬件体系->操作系统->JVM
JVM的体系结构
.java->Class File->类加载器 Class Loader->运行时数据区(Runtime Data Area)
{
* 方法区(Method Area)
* Java栈(Stack)
* 本地方法栈(Native Method Stack)
* 堆(Heap)
* 程序计数器
}
->本地方法接口->本地方法库
类加载器
作用:加载Class文件
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序加载器
双亲委派机制
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到根加载器
- 启动类加载器检查是否能够加载当前这个类,如果能加载,就使用当前加载器,否则抛出异常,通知子类加载器加载
- 重复步骤3
沙箱安全机制
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信任的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱机制。如下图所示
在后续的Java1.1和1.2版本中,分别加入了“安全策略”“代码签名”。
当前最新的安全机制实现,则引入域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示
组成沙箱的基本组件:
- 字节码校验器(bytecode verifier):确保Java文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
- 类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码
- 它守护了被信任的类库边界
- 它将代码归入保护域,确定了代码可以进行哪些操作
类装载器采用的机制是双亲委派模式
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效
- 存取控制器:存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
- 安全管理器:是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
- 安全软件包:java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 信息摘要
- 数字签名
- 加密
- 鉴别
Native
凡是带了native关键字的,说明Java的作用范围到达不了,回去调用底层C语言的库,会进入本地方法栈,调用本地方法本地接口JNI
JNI作用:扩展Java的使用,融合不同的编程语言为Java所用
Java在内存区域中专门开辟了一块标记区域:Native Method Stack,登记native方法
PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来储存指向一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计。
方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间。
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
栈
数据结构
程序 = 数据结构 + 算法
先进后出,后进先出——类比桶
队列:先进先出(FIFO: First In First Out)
栈内存:主管程序的运行,生命周期和线程同步,线程结束,栈内存释放,对于栈来说,不存在垃圾回收问题
一旦线程结束,栈就结束
8大基本类型+对象引用+实例方法 => 栈内存中
栈运行原理:栈帧
栈满了:StackOverflowError
栈+堆+方法区:交互关系
三种JVM
- Sun——HotSpot
- BEA——JRokit
- IBM——J9VM
堆
Heap,一个JVM只有一个堆内存,堆内存的大小是可以调节的
类加载器读取了类文件后,一般会把什么东西放到堆中?类,方法,常量,变量……保存我们所有引用类型的真实对象
堆内存中细分为三个区域:
- 新生区(伊甸园区)
- 老年区
- 永久区
GC垃圾回收,主要是在伊甸园区和养老区
假设内存满了,OOM(OutOfMemory),堆内存不够
在JDK8以后,永久存储区改了个名字:元空间
新生区
- 类:诞生和成长的地方,甚至死亡
- 伊甸园:所有对象都是在伊甸园区new出来的
- 幸存者(0,1)
老年区
永久区
这个区域常驻内存,用来存放JDK自带的Class对象、Interface元数据,存储的是Java运行时的一些环境或类信息,这个区域不存在垃圾回收。关闭JVM会释放这个区域的内存
- JDK1.6之前:永久代,常量池是在方法区中
- JDK1.7,永久代,但是慢慢地退化了,
去永久代
,常量池在堆中 - JDK1.8之后,无永久代,常量池在元空间
经过研究,99%的对象都是临时对象
元空间:逻辑上存在,物理上不存在
在一个项目中,突然出现了OOM故障,那么如何排除?
- 能够看到第几行出错:内存快照分析工具,MAT、JProfiler
- Debug,一行行代码分析
MAT、JProfiler作用:
- 分析Dump文件,快速定位内存泄漏
- 获得堆中的数据
- 获得大的对象
堆内存调优
OOM:1. 尝试扩大堆内存看结果 2. 分析内存,看哪个地方出现了问题
JProfiler
查看堆错误
GC:垃圾回收
JVM在进行GC时,并不是对这三个区域统一回收,大部分时候,回收都是新生代
- 新生代
- 幸存区(from, to)
- 老年区
GC两种类型:轻GC(普通GC)、重GC(全局GC)
GC题目:
- JVM的内存模型和分区 详细到每个区放什么
- 堆里面的分区有哪些?Eden, from, to, 老年区,说说特点
- GC算法有哪些?标记清除法,标记压缩,复制算法,引用计数器
- 轻GC和重GC分别在什么时候发生?
GC常用算法
引用计数法
复制算法
- 好处:没有内存的碎片
- 坏处:浪费了内存空间,多了一半空间永远是空的。假设对象100%存活(极端情况)
复制算法最佳使用场景:对象存活度较低的时候:新生区
标记清除算法
- 优点:不需要额外的空间
- 缺点:两次扫描,严重浪费时间,会产生内存碎片
标记压缩
再优化
标记清除压缩
先标记清除几次,再压缩
总结
内存效率:复制算法>标记清除算法>标记压缩算法(时间复杂度)
内存整齐度:复制算法=标记压缩算法>标记清除算法
内存利用率:标记压缩算法=标记清除算法>复制算法
思考:有无更优算法?
答案:没有最好的算法,只有最合适的——>GC:分代收集算法
年轻代:
- 存活率低
- 复制算法
老年代:
- 区域大:存活率高
- 标记清除(内存碎片不是太多)+标记压缩混合实现
JMM
什么是JMM?
JMM:Java Memory Model
干什么的?
官方、博客、视频
作用:缓存一致性协议,用于定义数据读写的规则
JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量储存在主内存中,每个线程都有一个私有的本地内存
解决共享对象可见性的问题:volilate
它该如何学习?
JMM:抽象的概念,理论