JVM 垃圾回收算法

《深入理解Java虚拟机:JVM高级特性与最佳实践》-笔记

一、概述

垃圾回收,Garbage Collection,简称GC。

GC需要完成三件事:

  • 哪些内存需要回收?
  • 什么时候回收?
  • 如何回收?

二、对象存活判断

判断对象是否存活一般有两种方式:

  • 引用计数:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收。此方法简单,无法解决对象相互循环引用的问题。
  • 可达性分析(Reachability Analysis):从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。不可达对象。

在Java语言中,GC Roots包括:

  • 虚拟机栈中引用的对象。
  • 方法区中类静态属性实体引用的对象。
  • 方法区中常量引用的对象。
  • 本地方法栈中JNI引用的对象。

三、JVM的垃圾回收过程

首先从GC Roots开始进行可达性分析,判断哪些是不可达对象。

对于不可达对象,判断是否需要执行其finalize方法,如果对象没有覆盖finalize方法或已经执行过finalize方法则视为不需要执行,进行回收;如果需要,则把对象加入F-Queue队列。

对于F-Queue队列里的对象,稍后虚拟机会自动建立一个低优先级的线程去触发其finalize方法,但不会等待这个方法返回。

如果在finalize方法的执行过程中,对象重新被引用,那么进行第二次标记时将被移出F-Queue,在finalize方法执行完成后,对象仍然没有被引用,则进行回收。

对于被移出F-Queue的对象,如果它下一次面临回收时,将不会再执行其finalize方法。

finalize方法只执行一次。

四、垃圾收集算法

标记-清除算法

Mark-Sweep:先标记所有需要回收对象,然后统一回收。

问题

  1. 效率问题,标记和清除两个过程的效率都不高。
  2. 空间问题,会产生大量不连续的内存碎片。分配大对象时容易提前触发GC。

复制算法

Copying:把可用内存分为大小相等的两块,每次只使用一块。当一块用完时,将存活对象复制到另一块,再一次清理掉已使用的内存块。

实现简单,分配快,只需要顺序移动堆顶指针就可以进行分配,允许高效。代价是内存浪费大。

IBM的研究表明,新产生的对象98%都是很快就死忙的。

HotSpot将内存分为一块较大的Eden和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。回收时,将Eden和Survivor中存活的对象一次性复制到另一个Survivor上,然后清理掉Eden和用过的Survivor。

在上面的复制过程中,如果Survivor空间不够,则需要引入一种分配担保机制来处理,在HotSpot中是将对象分配到年老代。

标记-压缩

Mark-Compact:先标记,然后将存活对象移向一边,再清理掉边界以外的内存。

分代收集算法

一般的虚拟机都是分代收集算法,也就是把内存分为几个块,不同的块用不同的回收算法。

一般将内存分为新生代和年老代,在新生代一般采用复制算法,年老代采用标记-压缩算法。

五、Java 里的引用

  • 强引用(Strong Reference):一般的赋值就是建立强引用,只要有强引用就不会被回收。
  • 软引用(Soft Reference):在系统将要发生内存溢出时进行回收,如果回收后还是不够内存才跑出内存溢出异常。内存足够则不会回收。
  • 弱引用(Weak Reference):只能存活到下一次GC时,不管内存是否足够。
  • 虚引用(Phantom Reference):对对象的生存时间没影响,目的是为了在对象被回收时得到系统通知。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据