1.OpenJDK17-JVM 源码阅读 - ZGC - 并发标记 | 京东物流技术团队
2.08.从源码揭秘偏向锁的码阅升级
3.面试必问的CAS,你懂了吗?
4.从HotSpot源码,码阅深度解读 park 和 unpark
5.Linux基础组件之无锁消息队列ypipe/yqueue详解
6.ListenableFuture源码解析
OpenJDK17-JVM 源码阅读 - ZGC - 并发标记 | 京东物流技术团队
ZGC简介:
ZGC是码阅Java垃圾回收器的前沿技术,支持低延迟、码阅大容量堆、码阅染色指针、码阅icp认证源码读屏障等特性,码阅自JDK起作为试验特性,码阅JDK起支持Windows,码阅JDK正式投入生产使用。码阅在JDK中已实现分代收集,码阅预计不久将发布,码阅性能将更优秀。码阅
ZGC特征:
1. 低延迟
2. 大容量堆
3. 染色指针
4. 读屏障
并发标记过程:
ZGC并发标记主要分为三个阶段:初始标记、码阅并发标记/重映射、码阅重分配。本篇主要分析并发标记/重映射部分源代码。
入口与并发标记:
整个ZGC源码入口是ZDriver::gc函数,其中concurrent()是一个宏定义。并发标记函数是concurrent_mark。
并发标记流程:
从ZHeap::heap()进入mark函数,使用任务框架执行任务逻辑在ZMarkTask里,具体执行函数是work。工作逻辑循环从标记条带中取出数据,直到取完或时间到。此循环即为ZGC三色标记主循环。之后进入drain函数,从栈中取出指针进行标记,直到栈排空。标记过程包括从栈取数据,标记和递归标记。
标记与迭代:
标记过程涉及对象迭代遍历。标记流程中,ZGC通过map存储对象地址的finalizable和inc_live信息。map大小约为堆中对象对齐大小的二分之一。接着通过oop_iterate函数对对象中的b站源码go指针进行迭代,使用ZMarkBarrierOopClosure作为读屏障,实现了指针自愈和防止漏标。
读屏障细节:
ZMarkBarrierOopClosure函数在标记非静态成员变量的指针时触发读屏障。慢路径处理和指针自愈是核心逻辑,慢路径标记指针,快速路径通过cas操作修复坏指针,并重新标记。
重映射过程:
读屏障触发标记后,对象被推入栈中,下次标记循环时取出。ZGC并发标记流程至此结束。
问题回顾:
本文解答了ZGC如何标记指针、三色标记过程、如何防止漏标、指针自愈和并发重映射过程的问题。
扩展思考:
ZGC在指针上标记,当回收某个region时,如何得知对象是否存活?答案需要结合标记阶段和重分配阶段的代码。
结束语:
本文深入分析了ZGC并发标记的源码细节,对您有启发或帮助的话,请多多点赞支持。作者:京东物流 刘家存,来源:京东云开发者社区 自猿其说 Tech。转载请注明来源。
.从源码揭秘偏向锁的升级
深入探讨偏向锁的升级至轻量级锁的过程,主要涉及HotSpot虚拟机的源码分析。在学习synchronized机制时,将通过本篇文章解答关于synchronized功能的相关问题。首先,进行一些准备工作,了解在分析synchronized源码前的必要步骤。然后,通过示例代码的编译结果,揭示synchronized修饰代码块后生成的字节码指令,以及这些指令对应的主指标公式源码操作。进一步地,使用jol工具跟踪对象状态,提供更直观的数据支持。
接下来,重点解析monitorenter指令的执行过程,包括其与templateTable_x和interp_masm_x方法之间的关联。通过分析注释中的参数设置,可以理解偏向锁升级为重量级锁的逻辑,以及epoch在偏向锁有效性判断中的作用。进一步,详细介绍对象头(markOop)的结构和其在偏向锁实现中的具体功能,包括epoch的含义及其在更新过程中的角色。
在理解了偏向锁的原理后,将分析其在不同条件下的执行流程,包括是否可偏向、是否重入偏向、是否依旧可偏向、epoch是否过期以及重新偏向等分支逻辑。接着,介绍偏向锁撤销和重偏向的过程,以及在获取偏向锁失败后的操作,即执行轻量级锁加锁的过程。最后,讨论偏向锁与轻量级锁的区别,总结它们的关键技术和性能特点,并简述偏向锁的争议与现状。
在偏向锁的实现中,关键点在于CAS操作的使用,以及在CAS竞争失败时导致的锁升级。偏向锁适用于单线程执行的场景,但在线程交替持有执行时,撤销和重偏向逻辑的复杂性导致性能下降,因此引入轻量级锁以保证“轻微”竞争情况的安全性。尽管偏向锁在Java 中已被弃用,但在当前广泛应用的天狼影视源码Java 8环境下,了解偏向锁的原理仍然具有重要意义。
总结而言,偏向锁与轻量级锁分别针对不同场景进行了优化,它们的核心逻辑基于CAS操作,但在处理线程竞争时的表现有所不同。通过深入学习这两种锁的升级过程,可以更好地理解synchronized机制在Java并发编程中的应用。
面试必问的CAS,你懂了吗?
CAS(Compare-and-Swap)是一种实现并发算法时常用的技术,Java并发包中的多个类采用了CAS技术。面试中经常涉及这一概念,本文旨在深入解析CAS的原理。
在介绍CAS之前,我们通过一个例子来理解其应用。这个例子在运行过程中可能会陷入死循环,通过检查线程状态,发现IDEA监控线程的介入导致了问题。解决这一死循环的方法是使用DEBUG模式运行程序或调整代码逻辑。
通过volatile关键字的使用,我们可以观察到,其只能确保可见性,而不能保证原子性。在并发场景下,对于自增操作等非原子操作,volatile并不能保证正确结果。因此,解决这类问题的关键是引入原子操作。
引入synchronized关键字是一种常见的解决方法,通过加锁实现原子操作,确保每次操作的正确性。然而,频繁使用synchronized会导致性能下降,因此引入Java并发包中的原子操作类(如AtomicInteger)成为了更优选择。
AtomicInteger的`getAndIncrement()`方法即是CAS操作的实例,它通过一系列原子操作确保每次自增操作的zedboard的uboot源码正确性和性能。进一步分析,我们发现其底层实现调用了`compareAndSwapInt`方法,即CAS的核心实现。
CAS(Compare-and-Swap)本质上是一个比较并替换操作,它需要三个操作数:内存地址、旧的预期值和目标值。执行过程中,当内存地址的值与预期值相等时,CAS尝试将内存地址的值修改为目标值。若失败,则获取最新值,重新尝试,直至修改成功。
深入到源码层面,可以看到`AtomicInteger`类中的`getAndIncrement()`方法最终调用了`compareAndSwapInt`方法,而`compareAndSwapInt`在Unsafe类中被实现。通过调用`Atomic::cmpxchg`方法,我们能够看到具体的汇编指令实现。
`Atomic::cmpxchg`方法的实现依赖于系统是否为多处理器环境,以优化性能。它通过`LOCK_IF_MP`宏决定是否添加`lock`前缀,这一优化措施在单处理器环境下通常没有必要,但在多核处理器中能够提升性能。
CAS操作的缺点包括循环时间长导致的开销大、仅支持单一共享变量的原子操作,以及ABA问题。ABA问题是由于CAS操作的特性导致,即在读取值后,值在后续操作中可能被改回原始值,从而产生误判。为解决ABA问题,Java并发包提供了带有版本控制的原子引用类`AtomicStampedReference`。
在使用CAS操作时,需要考虑其对并发正确性的影响,尤其是ABA问题。如果并发场景中存在可能的ABA问题,传统互斥同步可能比原子类更高效。
综上所述,理解CAS的原理和其在并发编程中的应用对于深入学习Java并发技术至关重要。掌握CAS操作的原理、优缺点及其解决方法,将有助于更高效、正确地处理并发问题。
从HotSpot源码,深度解读 park 和 unpark
我最近建立了一个在线自习室(App:番茄ToDO)用于相互监督学习,感兴趣的小伙伴可以加入。自习室加入码:D5A7A
Java并发包下的类大多基于AQS(AbstractQueuedSynchronizer)框架实现,而AQS线程安全的实现依赖于两个关键类:Unsafe和LockSupport。
其中,Unsafe主要提供CAS操作(关于CAS,在文章《读懂AtomicInteger源码(多线程专题)》中讲解过),LockSupport主要提供park/unpark操作。实际上,park/unpark操作的最终调用还是基于Unsafe类,因此Unsafe类才是核心。
Unsafe类的实现是由native关键字说明的,这意味着这个方法是原生函数,是用C/C++语言实现的,并被编译成了DLL,由Java去调用。
park函数的作用是将当前调用线程阻塞,而unpark函数则是唤醒指定线程。
park是等待一个许可,unpark是为某线程提供一个许可。如果线程A调用park,除非另一个线程调用unpark(A)给A一个许可,否则线程A将阻塞在park操作上。每次调用一次park,需要有一个unpark来解锁。
并且,unpark可以先于park调用,但不管unpark先调用多少次,都只提供一个许可,不可叠加。只需要一次park来消费掉unpark带来的许可,再次调用会阻塞。
在Linux系统下,park和unpark是通过Posix线程库pthread中的mutex(互斥量)和condition(条件变量)来实现的。
简单来说,mutex和condition保护了一个叫_counter的信号量。当park时,这个变量被设置为0,当unpark时,这个变量被设置为1。当_counter=0时线程阻塞,当_counter>0时直接设为0并返回。
每个Java线程都有一个Parker实例,Parker类的部分源码如下:
由源码可知,Parker类继承于PlatformParker,实际上是用Posix的mutex和condition来实现的。Parker类里的_counter字段,就是用来记录park和unpark是否需要阻塞的标识。
具体的执行逻辑已经用注释标记在代码中,简要来说,就是检查_counter是不是大于0,如果是,则把_counter设置为0,返回。如果等于零,继续执行,阻塞等待。
unpark直接设置_counter为1,再unlock mutex返回。如果_counter之前的值是0,则还要调用pthread_cond_signal唤醒在park中等待的线程。源码如下:
(如果不会下载JVM源码可以后台回复“jdk”,获得下载压缩包)
Linux基础组件之无锁消息队列ypipe/yqueue详解
CAS定义
比较并交换(compare and swap, CAS),在多线程编程中用于实现不被打断的数据交换,避免数据不一致问题。该操作通过比较内存值与指定数据,当数值相同则替换内存数据。
为什么需要无锁队列
锁引起的问题:cache损坏/失效、同步机制上的争抢、动态内存分配。
有锁导致线程切换引发cache损坏
大量线程切换导致cache数据失效,处理器与主存之间数据传输效率下降,影响性能。
在同步机制上的争抢队列
阻塞队列导致任务暂停或睡眠,大量时间浪费在获取互斥锁,而非处理数据,引发严重争用。
动态内存分配
多线程中动态分配内存导致互斥,线程频繁分配内存影响应用性能。
无锁队列的实现
无锁队列由ypipe_t和yqueue_t类构成,适用于一读一写场景。通过chunk模式批量分配结点,减少动态内存分配的互斥问题。批量分配大小根据业务场景调整,通常设置较大较为安全。利用spare_chunk存储未释放的chunk,降低频繁分配释放。预写机制减少CAS调用。巧妙的唤醒机制,读端等待无数据时进入等待状态,写端根据返回值判断队列是否为空以唤醒读端。
无锁队列使用
yqueue.write(count,false)用于写入元素并标记完成状态,yqueue.flush()使读端可见更新后数据。yqueue.read(&value)读取元素,返回true表示读到元素,返回false表示队列为空。
ypipe_t使用
write(val, false)更新写入位置,flush()刷新数据到管道,read()读取数据并更新可读位置。
yqueue_t构造函数
初始化队列,end_chunk总是指向最后分配的chunk,back_chunk仅在有元素插入时指向对应的chunk。
front()和back()函数
返回队列头和尾的可读写元素位置。
push()和pop()函数
push()更新写入位置,pop()更新读取位置并检测释放chunk,保持数据流。
源码分析
yqueue_t内部使用chunk批量分配,减少内存操作,spare_chunk存储释放的chunk以供再次使用。ypipe_t构建单写单读无锁队列,通过CAS操作控制读写位置,实现高效数据交换。
ypipe_t / yqueue_t无锁队列利用chunk机制避免频繁内存动态分配,提升性能。通过局部性原理复用回收的chunk,减少资源消耗。flush()检测队列状态通知唤醒,优化数据交换过程。
ListenableFuture源码解析
ListenableFuture 是 spring 中对 JDK Future 接口的扩展,主要应用于解决在提交线程池的任务拿到 Future 后在 get 方法调用时会阻塞的问题。通过使用 ListenableFuture,可以向其注册回调函数(监听器),当任务完成时,触发回调。Promise 在 Netty 中也实现了类似的功能,用于处理类似 Future 的场景。
实现 ListenableFuture 的关键在于 FutureTask 的源码解析。FutureTask 是实现 Future 接口的基础类,ListenableFutureTask 在其基础上做了扩展。其主要功能是在任务提交后,当调用 get 方法时能够阻塞当前业务线程,直到任务完成时唤醒。
FutureTask 通过在内部实现一个轻量级的 Treiber stack 数据结构来管理等待任务完成的线程。这个数据结构由 WaitNode 节点组成,每个节点代表一个等待的线程。当业务线程调用 get 方法时,会将自己插入到 WaitNode 栈中,并且在插入的同时让当前线程进入等待状态。在任务执行完成后,会遍历 WaitNode 栈,唤醒等待的线程。
为了确保并发安全,FutureTask 使用 CAS(Compare and Swap)操作来管理 WaitNode 栈。每个新插入的节点都会使用 CAS 操作与栈顶节点进行比较,并在满足条件时更新栈顶。这一过程保证了插入操作的原子性,防止了并发条件下的数据混乱。同时,插入操作与栈顶节点的更新操作相互交织,确保了数据的一致性和完整性。
在 FutureTask 中,还利用了 LockSupport 类提供的 park 和 unpark 方法来实现线程的等待和唤醒。当线程插入到 WaitNode 栈中后,通过 park 方法将线程阻塞;任务执行完成后,通过 unpark 方法唤醒线程,完成等待与唤醒的流程。
综上所述,ListenableFuture 通过扩展 FutureTask 的功能,实现了任务执行与线程等待的高效管理。通过注册监听器并利用 CAS 操作与 LockSupport 方法,实现了在任务完成时通知回调,解决了异步任务执行时的线程阻塞问题,提高了程序的并发处理能力。