JVM，我就不信学不会你了 (2)

日期：2022-08-04 栏目：程序人生浏览：次

这里的知识点，我推荐通过网上的文章看，又因为涉及到了并发知识，我建议就着《Java Performance》第二版的“Chapter 9. Threading and Synchronization Performance”这章一起看。

还有余力，建议再继续看周志明的那本《深入理解 JAVA 虚拟机》第三版中的 12-13 章。周志明这本书讲的十分深入，也带来个缺点：门槛高。此时，如果没看懂可以放一放。

注意，我这里说的是并发的原理，不是并发实践，读者想学并发编程，《JAVA 并发编程实践》我认为是前提条件，故不会赘述。

资深程序员怎么学

这时候的你，已经开始承担项目开发中很重要的职责了，有些出色的朋友都开始带团队了。那这时候，你可能会做下面的事：

1. 合理规划项目使用资源

合理规划项目使用资源，前提是对垃圾回收有非常深入的了解。

如果说在新手期，已经对 Java 对象的内存分配和内存使用有了大致的概念，那么，这个垃圾回收，则是这类知识的进一步拓展。

只有理解了各种垃圾回收的原理，再配合着 Java 内存布局的基础知识，才能更好地规划出项目用什么回收算法，才能在合适的资源利用度上得到最佳性能。

比如，新生代和老年代之间的合适比例。比如，新生代中 Eden 和 Survivor 区域间的比例。

2. 排查各种线上问题

要排查各种问题，就需要对 JVM 提供的各种故障排查工具非常了解。

这些工具又分为两类：

基础的命令行形式的故障处理工具，比如 jps、jstack 等等

第二类是可视化的故障处理工具，比如 VisualVM

但是，掌握工具的使用还不够。因为有关垃圾回收的问题，还必须得通过解析 GC 日志后，再通过工具的使用，才可能能定位到问题的根源。

所以，最好对使用故障排查工具和 GC 日志都非常熟练。

比如：

2021-05-26T14:45:37.987-0200: 151.126: [GC (Allocation Failure) 151.126: [DefNew: 629119K->69888K(629120K), 0.0584157 secs] 1619346K->1273247K(2027264K), 0.0585007 secs] [Times: user=0.06 sys=0.00, real=0.06 secs] 2021-05-26T14:45:59.690-0200: 172.829: [GC (Allocation Failure) 172.829: [DefNew: 629120K->629120K(629120K), 0.0000372 secs]172.829: [Tenured: 1203359K->755802K(1398144K), 0.1855567 secs] 1832479K->755802K(2027264K), [Metaspace: 6741K->6741K(1056768K)], 0.1856954 secs] [Times: user=0.18 sys=0.00, real=0.18 secs]

上面这条，应该一眼看出来，垃圾算法用的是 Serial 收集器，并且年轻代分配出现了问题，大小可能需要调整。

这里的知识点，强烈反对看网上的文章，网上说的很多细节有问题，疏漏很多。所以，推荐看书。

《Java Performance》第二版里，“Chapter 5. An Introduction to Garbage Collection”，“Chapter 6. Garbage Collection Algorithms”的知识已经足够。

有人去看《深入理解 JAVA 虚拟机》第三版中的第 3 章，讲垃圾收集器与内存分配策略的。这里还是老问题，讲的太细，我建议绕过 3.4 节，讲 HotSpot 算法细节的那块儿。

这里安全点这个知识点挺重要，但是现在这个阶段想理解挺难的。我觉得将来做一些底层框架，接触到崩溃恢复的 checkpoint 相关思想了，再回头来学习，那才能真正理解和掌握。

技术专家怎么学

达到这个级别了，那就需要对整套 JVM 要有非常深入的了解了，因为你是解决技术问题的最后保障了。有些时候，甚至还需要因为某些问题开发出各种各样的工具。

曾经，有个项目时不时总是会报错：

java.lang.OutOfMemoryError: GC overhead limit exceeded

这个问题几个同事都没搞定，就来找我。我看了看，突然想起来，以前在官方调优指南《HotSpot Virtual Machine Garbage Collection Tuning Guide》看到过相关介绍。

JVM 本身内存不足就会运行 GC，但是如果每次 GC 回收的内存不够，那么很快就会开始下一次 GC。

JVM 有个默认的保护机制，如果发现在一个统计周期内，98% 的时间都是在运行 GC，内存回收却少于 2% 的时候，就会报这个错。

怎么引起的呢？这个问题如果去排查代码，那真的是难如登天，首先，没有任何堆栈错误去帮助定位问题。其次，项目代码量大了去了，而且是年头久远。

这时，就需要通过对 JVM 总体的深入理解，去反推问题了。我当时是这样推理的：

内存溢出，GC 无法回收问题，说明了两个问题：

堆内的内存不够用了

占用内存的对象要么就是该关闭的资源没有关闭，要么被大量的暂时放在一起了

那如果我 dump 出内存文件出来，再分析下就知道是哪些对象在占用内存了。

一查发现是大量的字符串在占用内存。

综合我前面的推测，字符串不是数据库连接，肯定没有该关闭未关闭的问题。那就剩一个可能了，就是被大量的暂时放起来了，导致 GC 回收不了。

那么新问题来了，能大量放字符串的，会是什么？

首先就去猜缓存。根据这条线索，直接去源码搜 Cache 关键词，把所有关于 Cache 的代码都看了下。一下子就找到问题了。

原来，我们有个功能是解析一个非常大的文件。文件的格式如下：

转载注明出处：https://www.heiqu.com/zgwydw.html

JVM，我就不信学不会你了 (2)

相关推荐