1.慢慢体会jvm中的码解class文件解析你就懂了
2.Jvm-Sandbox原理分析-Sandbox的启动-01
3.java代码是如何一步步输出结果的?
4.Java Hello world 源码执行流程详解
5.这究竟是为什么呢?都说JVM能实际使用的内存比-Xmx指定的少,头大
6.OpenJDK17-JVM 源码阅读 - ZGC - 并发标记 | 京东物流技术团队
慢慢体会jvm中的class文件解析你就懂了
Java虚拟机(JVM)作为程序执行环境的关键组成部分,通过字节码(Byte Code)实现跨平台特性。码解字节码是码解一种特定的二进制文件格式,存储在Class文件中。码解Java程序首先编译为字节码,码解而非直接生成平台特定的码解dnf辅助源码使用机器语言。Class文件是码解平台无关性实现的基础,它使得Java虚拟机能够加载并执行程序,码解而无需考虑运行环境的码解差异。
Class文件为Java程序提供了一种统一的码解存储格式。每个类对应一个独立的码解Class文件,即使内部类也是码解如此,它们各自生成单独的码解Class文件。这种设计使得Java虚拟机能够专注于加载和解析Class文件,码解而无需处理特定的码解源代码格式。其他编程语言可以将代码编译为符合Java虚拟机规范的Class文件,从而实现跨语言运行。
Java虚拟机并不是直接运行Java程序的,而是通过加载Class文件来执行程序。Class文件包含了程序执行所需的所有信息,包括类的结构、方法、属性等。Java程序和Class文件之间存在着密切的联系,学习Class文件有助于深入了解代码的编译后形态。
以下是Class文件的解析内容:
1. Class文件格式:Class文件本质上是一个二进制文件,存储了Java程序的结构化信息。从一个.java文件编译出来的Class文件,可以通过IDE工具如 IntelliJ IDEA查看,展示了一个简单的二进制格式。借助于BinEd插件,可以进一步深入分析Class文件的结构。
2. Class文件结构:Class文件由多个部分组成,包括通用信息、常量池、接口列表、属性列表、方法列表和附加属性等。彩虹提示指标源码这些部分共同描述了类的定义、方法、属性以及相关行为。
3. 通用信息:包含Java版本、常量池数量、类修饰符、类名、父类名、接口列表数量、属性数量、方法数量等信息。
4. 常量池:存储了常量、修饰符、方法名、字段名、类型信息等,为解析Class文件提供基础数据。
5. 接口列表:列出类实现的所有接口的索引。
6. 属性列表:包括类文件名、内部类列表、方法字节码、异常列表、源码位置关系、局部变量描述以及常量值等详细信息。
通过解析Class文件,可以深入理解Java程序的编译后形式,以及类、方法、属性等核心元素的结构和功能。这些信息对于开发者来说至关重要,有助于优化代码性能、诊断程序错误以及实现更高级的工具和框架功能。
Jvm-Sandbox原理分析-Sandbox的启动-
Jvm-Sandbox的启动(一):sandbox.sh脚本分析
Sandbox的启动是通过其内置的shell脚本 sandbox.sh 开始执行的,一切的开始皆可从该脚本中探寻出结果。脚本有一定的代码量,大概有+行,这里将该脚本分为如下几个部分进行讲解:
1、汾阳到太原源码变量定义过程这个过程首先预定义了接下来即将使用的一些变量。代码如下:
# 定义sandbox的home目录,并为其赋值 typeset SANDBOX_HOME_DIR [[ -z ${ SANDBOX_HOME_DIR} ]] && SANDBOX_HOME_DIR=${ PWD}/..# 定义 SANDBOX_USER,并为其赋值 typeset SANDBOX_USER=${ USER} [[ -z ${ SANDBOX_USER} ]] && SANDBOX_USER=$(whoami)# 定义 SANDBOX_SERVER_NETWORK typeset SANDBOX_SERVER_NETWORK# 定义lib目录,这个目录下主要存放jar包 typeset SANDBOX_LIB_DIR=${ SANDBOX_HOME_DIR}/lib# 定义 SANDBOX_TOKEN_FILE typeset SANDBOX_TOKEN_FILE="${ HOME}/.sandbox.token"# 定义JVM参数 SANDBOX_JVM_OPS typeset SANDBOX_JVM_OPS="-XmsM -XmxM -Xnoclassgc -ea"# 定义目标JVM的进程号,后面的agent主要attach到该JVM进程上 typeset TARGET_JVM_PID# 定义目标机器IP以及默认机器IP typeset TARGET_SERVER_IP typeset DEFAULT_TARGET_SERVER_IP="0.0.0.0"# 定义目标进程端口 typeset TARGET_SERVER_PORT# 定义名称空间 typeset TARGET_NAMESPACE typeset DEFAULT_NAMESPACE="default"注释和变量命名已经描绘的非常清楚了,在看后面代码遇到忘记了的变量可以到这里来回顾下。
这里为其中一些变量补充说明:
SANDBOX_HOME_DIR:shell脚本中,-z表示检测紧跟的字符串长度是否为0,如果为0返回true。这里使用短路与,如果 ${ SANDBOX_HOME_DIR} 为0,则使用 ${ PWD}/.. 的目录作为sandbox的home目录。这种方式表示优先使用环境变量 SANDBOX_HOME_DIR,如果未定义环境变量SANDBOX_HOME_DIR,则使用当前目录。
SANDBOX_TOKEN_FILE:这个文件主要存放了sandbox attach记录,包括attach进程的host:port。
TARGET_SERVER_IP:一般情况下,我们都是将整个工程打包后上传至目标机器,然后在目标机器上执行该shell脚本,因此默认机器IP一般为localhost即可。
2、执行入口执行入口就比较简单了,就一行代码,其中${ @}会保存我们传递给该shell脚本的所有参数:
main "${ @}"比方说,我们以如下命令启动脚本,则${ @} 就包含了-p 这个参数
./sandbox.sh -p 、main函数main函数是该脚本的重要方法,也是脚本的执行入口,它主要完成了以下几件事:
其代码如下所示:
function main() { # 遍历脚本参数 while getopts "hp:vFfRu:a:A:d:m:I:P:ClSn:X" ARG; do case ${ ARG} in h) # 帮助手册函数,大家可以自行翻阅源码查看 usage exit ;; # 赋值PID p) TARGET_JVM_PID=${ OPTARG} ;; v) OP_VERSION=1 ;; l) OP_MODULE_LIST=1 ;; R) OP_MODULE_RESET=1 ;; F) OP_MODULE_FORCE_FLUSH=1 ;; f) OP_MODULE_FLUSH=1 ;; u) OP_MODULE_UNLOAD=1 ARG_MODULE_UNLOAD=${ OPTARG} ;; a) OP_MODULE_ACTIVE=1 ARG_MODULE_ACTIVE=${ OPTARG} ;; A) OP_MODULE_FROZEN=1 ARG_MODULE_FROZEN=${ OPTARG} ;; d) OP_DEBUG=1 ARG_DEBUG=${ OPTARG} ;; m) OP_MODULE_DETAIL=1 ARG_MODULE_DETAIL=${ OPTARG} ;; # 赋值IP I) TARGET_SERVER_IP=${ OPTARG} ;; # 赋值PORT P) TARGET_SERVER_PORT=${ OPTARG} ;; C) OP_CONNECT_ONLY=1 ;; S) OP_SHUTDOWN=1 ;; n) OP_NAMESPACE=1 ARG_NAMESPACE=${ OPTARG} ;; X) set -x ;; ?) usage exit_on_err 1 ;; esac done # 重置环境 reset_for_env # 校验权限 check_permission# 根据不同的参数,进行相应处理 # 如果没有指定IP,则使用默认值 [ -z "${ TARGET_SERVER_IP}" ] && TARGET_SERVER_IP="${ DEFAULT_TARGET_SERVER_IP}"# 如果没有指定port,使用默认值 [ -z "${ TARGET_SERVER_PORT}" ] && TARGET_SERVER_PORT=0# reset NAMESPACE [[ ${ OP_NAMESPACE} ]] && TARGET_NAMESPACE=${ ARG_NAMESPACE} [[ -z ${ TARGET_NAMESPACE} ]] && TARGET_NAMESPACE=${ DEFAULT_NAMESPACE}if [[ ${ OP_CONNECT_ONLY} ]]; then [[ 0 -eq ${ TARGET_SERVER_PORT} ]] && exit_on_err 1 "server appoint PORT (-P) was missing" SANDBOX_SERVER_NETWORK="${ TARGET_SERVER_IP};${ TARGET_SERVER_PORT}" else # -p was missing [[ -z ${ TARGET_JVM_PID} ]] && exit_on_err 1 "PID (-p) was missing." # attach jvm的核心方法 attach_jvm fi# -v show version [[ -n ${ OP_VERSION} ]] && sandbox_curl_with_exit "sandbox-info/version"# -l list loaded modules [[ -n ${ OP_MODULE_LIST} ]] && sandbox_curl_with_exit "sandbox-module-mgr/list"# -F force flush module [[ -n ${ OP_MODULE_FORCE_FLUSH} ]] && sandbox_curl_with_exit "sandbox-module-mgr/flush" "&force=true"# -f flush module [[ -n ${ OP_MODULE_FLUSH} ]] && sandbox_curl_with_exit "sandbox-module-mgr/flush" "&force=false"# -R reset sandbox [[ -n ${ OP_MODULE_RESET} ]] && sandbox_curl_with_exit "sandbox-module-mgr/reset"# -u unload module [[ -n ${ OP_MODULE_UNLOAD} ]] && sandbox_curl_with_exit "sandbox-module-mgr/unload" "&action=unload&ids=${ ARG_MODULE_UNLOAD}"# -a active module [[ -n ${ OP_MODULE_ACTIVE} ]] && sandbox_curl_with_exit "sandbox-module-mgr/active" "&ids=${ ARG_MODULE_ACTIVE}"# -A frozen module [[ -n ${ OP_MODULE_FROZEN} ]] && sandbox_curl_with_exit "sandbox-module-mgr/frozen" "&ids=${ ARG_MODULE_FROZEN}"# -m module detail [[ -n ${ OP_MODULE_DETAIL} ]] && sandbox_curl_with_exit "sandbox-module-mgr/detail" "&id=${ ARG_MODULE_DETAIL}"# -S shutdown [[ -n ${ OP_SHUTDOWN} ]] && sandbox_curl_with_exit "sandbox-control/shutdown"# -d debug if [[ -n ${ OP_DEBUG} ]]; then sandbox_debug_curl "module//post/java代码是如何一步步输出结果的?
Java代码执行流程分为多个关键步骤:
首先,词法分析(Lexical Analysis)将源代码分解为Token,包括关键字、小程序源码插件标识符、运算符等。
接着,语法分析(Syntax Analysis)将Token序列转换为抽象语法树(AST),表示程序结构。
随后,语义分析(Semantic Analysis)检查AST以确保程序无语法和语义错误,如类型不匹配和未定义变量。
中间代码生成(Intermediate Code Generation)阶段,AST被转换为JVM字节码,为代码执行做准备。
代码优化(Code Optimization)对中间代码进行调整,减少冗余,优化循环,以提升性能和效率。
目标代码生成(Target Code Generation)将优化后的中间代码转换为目标机器的机器代码,供计算机执行。
运行时(Runtime),Java虚拟机(JVM)加载机器代码至内存,执行程序。过程中,JVM负责垃圾回收、内存管理等,优化程序性能。
Java代码输出结果是程序执行过程中多步骤协同作用的结果,涉及编译和运行时的优化处理,以实现高效性能。
Java Hello world 源码执行流程详解
深入解析 Java "Hello World" 程序的执行流程,从源代码到屏幕显示,每一个步骤都充满技术奥秘。理解这一过程,不仅能加深对 Java 语言特性的认识,更能洞察计算机底层机制的精妙。 让我们从最简单的 "Hello World" 程序开始。虽然它看起来极其简单,但其执行逻辑却包含了对 Java 语言、操作系统的小程序源码引入深入理解。 Java "Hello World" 程序的执行,始于源代码的编译过程。Java 代码经过编译器的词法语法语义分析,最终转化为字节码文件(.class)。字节码作为 Java 代码的中间表示形式,便于在不同平台间移植。 随后,字节码文件通过 JVM (Java 虚拟机) 转化为机器码文件。这一过程不仅实现了代码在不同操作系统间的执行,还确保了 Java 程序的跨平台特性。 具体流程如下: 编译过程:将 Java 源代码编译为字节码文件。这些文件包含程序逻辑的抽象表示,便于在 JVM 上执行。 类加载机制:Java 类的加载采用双亲委派机制,确保类加载的唯一性和一致性。加载过程包括验证、准备、解析和初始化阶段,确保类的安全性。 创建栈帧:在 JVM 内存中,为程序入口方法(如 main())创建栈帧。栈帧中包含了方法执行所需的局部变量、操作数栈等数据结构。 在栈帧中,字符串 "Hello World" 通过一系列操作被赋值至变量。具体步骤涉及类加载、字符串常量池、操作数栈的使用,以及方法区的字符常量池。使用工具如 `javap -c Main.class` 可解析 `.class` 文件,深入了解这些过程。 执行 `System.out.println()` 方法时,JVM 加载 `System` 类字节码文件,创建 `System.out` 对象,并调用其 `println` 方法输出字符串。这一过程涉及原始 IO 包的使用,以及字符串的 `toString()` 方法。 接下来,JVM 字节码执行引擎将字节码转换为机器码,分配 CPU 资源执行。CPU 执行包含取值、译码和执行操作,通过操作系统管理内存、磁盘和设备。程序执行涉及 I/O 操作的完成,从文件描述符写入字符串,到操作系统检查字符串位置,直至最终在屏幕上显示 "Hello World"。 这一系列复杂的步骤,从源代码编译到屏幕显示,展示了计算机程序执行的全貌。理解这一过程,不仅有助于提升编程技能,更能加深对计算机底层工作的认知。这究竟是为什么呢?都说JVM能实际使用的内存比-Xmx指定的少,头大
这确实是个挺奇怪的问题,特别是当最常出现的几种解释理由都被排除后,看来JVM并没有耍一些明显的小花招:
要弄清楚这个问题的第一步就是要明白这些工具的实现原理。通过标准APIs,我们可以用以下简单语句得到可使用的内存信息。
而且确实,现有检测工具底层也是用这个语句来进行检测。要解决这个问题,首先我们需要一个可重复使用的测试用例。因此,我写了下面这段代码:
这段代码通过将new int[1__]置于一个循环中来不断分配内存给程序,然后监测JVM运行期的当前可用内存。当程序监测到可用内存大小发生变化时,通过打印出Runtime.getRuntime().maxMemory()返回值来得到当前可用内存尺寸,输出类似下面语句:
实际情况也确实如预估的那样,尽管我已经给JVM预先指定分配了2G对内存,在不知道为什么在运行期有M内存不见了。你大可以把 Runtime.getRuntime().maxMemory()的返回值2,,K 除以来转换成MB,那样你将得到1,M,正好和M差M。
在成功重现了这个问题之后,我尝试用使用不同的GC算法,果然检测结果也不尽相同。
除了G1算法刚好完整使用了我预指定分配的2G之外,其余每种GC算法似乎都不同程度地丢失了一些内存。
现在我们就该看看在JVM的源代码中有没有关于这个问题的解释了。我在CollectedHeap这个类的源代码中找到了如下的解释:
我不得不说这个答案藏得有点深,但是只要你有足够的好奇心,还是不难发现的:有时候,有一块Survivor区是不被计算到可用内存中的。
明白这一点之后问题就好解决了。打开并查看GC logging 信息之后我们发现,在Serial,Parallel以及CMS算法回收过程中丢失的那些内存,尺寸刚好等于JVM从2G堆内存中划分给Survivor区内存的尺寸。例如,在上面的ParallelGC算法运行时,GC logging信息如下:
由上面的信息可以看出,Eden区被分配了,K,两个Survivor区都被分配到了,K,老年代(Old space)则被分配了1,,K。把Eden区、老年代以及一个Survivor区的尺寸求和,刚好等于2,,K,说明丢失的那M(,K)确实就是剩下的那个Survivor区。
总结而言,当JVM在运行时报告的可使用内存小于-Xmx指定的内存时,差值通常对应于一块Survivor区的大小。对于不同的GC算法,这个差值可能有所不同。
OpenJDK-JVM 源码阅读 - ZGC - 并发标记 | 京东物流技术团队
ZGC简介:
ZGC是Java垃圾回收器的前沿技术,支持低延迟、大容量堆、染色指针、读屏障等特性,自JDK起作为试验特性,JDK起支持Windows,JDK正式投入生产使用。在JDK中已实现分代收集,预计不久将发布,性能将更优秀。
ZGC特征:
1. 低延迟
2. 大容量堆
3. 染色指针
4. 读屏障
并发标记过程:
ZGC并发标记主要分为三个阶段:初始标记、并发标记/重映射、重分配。本篇主要分析并发标记/重映射部分源代码。
入口与并发标记:
整个ZGC源码入口是ZDriver::gc函数,其中concurrent()是一个宏定义。并发标记函数是concurrent_mark。
并发标记流程:
从ZHeap::heap()进入mark函数,使用任务框架执行任务逻辑在ZMarkTask里,具体执行函数是work。工作逻辑循环从标记条带中取出数据,直到取完或时间到。此循环即为ZGC三色标记主循环。之后进入drain函数,从栈中取出指针进行标记,直到栈排空。标记过程包括从栈取数据,标记和递归标记。
标记与迭代:
标记过程涉及对象迭代遍历。标记流程中,ZGC通过map存储对象地址的finalizable和inc_live信息。map大小约为堆中对象对齐大小的二分之一。接着通过oop_iterate函数对对象中的指针进行迭代,使用ZMarkBarrierOopClosure作为读屏障,实现了指针自愈和防止漏标。
读屏障细节:
ZMarkBarrierOopClosure函数在标记非静态成员变量的指针时触发读屏障。慢路径处理和指针自愈是核心逻辑,慢路径标记指针,快速路径通过cas操作修复坏指针,并重新标记。
重映射过程:
读屏障触发标记后,对象被推入栈中,下次标记循环时取出。ZGC并发标记流程至此结束。
问题回顾:
本文解答了ZGC如何标记指针、三色标记过程、如何防止漏标、指针自愈和并发重映射过程的问题。
扩展思考:
ZGC在指针上标记,当回收某个region时,如何得知对象是否存活?答案需要结合标记阶段和重分配阶段的代码。
结束语:
本文深入分析了ZGC并发标记的源码细节,对您有启发或帮助的话,请多多点赞支持。作者:京东物流 刘家存,来源:京东云开发者社区 自猿其说 Tech。转载请注明来源。
Java虚拟机(Java Virtual Machine,简称JVM)
Java虚拟机(JVM)是Java语言的基础,负责执行Java字节码。它实现跨平台性,使Java程序能在不同硬件和操作系统上运行,无需修改代码。编写的Java源代码生成字节码,JVM加载并执行。提供内存管理、垃圾回收、安全性、线程管理等功能,确保程序稳定、安全、兼容。JVM适用于Windows、Linux、macOS等系统,实现代码一次编写,到处运行。
核心功能包括:解释或编译字节码为本地机器代码,实现程序执行;提供丰富的内存管理、安全性和多线程支持,保障程序可靠性和安全性;确保跨平台兼容性,无需针对特定平台修改代码。字节码与不同系统的JVM结合,构成Java语言“一次编译,随处运行”的独特优势。
综上所述,JVM作为Java程序运行的核心,其功能强大,确保了Java语言的跨平台性、稳定性和安全性。它将字节码转换为本地代码,执行程序。通过内存管理、垃圾回收、安全机制和线程管理,确保程序在各种环境下运行顺畅。字节码与不同操作系统上的JVM协同工作,实现了Java程序的“一次编写,到处运行”。
Java虚拟机(JVM)作为Java程序执行的关键,实现跨平台性,确保程序在不同系统上稳定运行。它执行字节码,提供内存管理、垃圾回收、安全和线程支持,保障Java程序的可靠性和兼容性。通过将字节码转换为本地代码,JVM使Java程序能够在Windows、Linux、macOS等操作系统上运行,实现“一次编译,到处运行”的优势。