皮皮网
皮皮网

【fastdfs源码解析】【源码的执行步骤】【python源码统计爬虫】arraylist源码原理

时间:2025-01-07 23:54:17 来源:boost源码学习

1.ArrayList详解及扩容源码分析
2.面试题:ArrayList扩容时扩容多少?
3.List LinkedList HashSet HashMap底层原理剖析
4.如何自己实现一个简单的ArrayList
5.arraylist如何实现序列化?码原
6.arraylist为什么线程不安全

arraylist源码原理

ArrayList详解及扩容源码分析

       在集合框架中,ArrayList作为普通类实现List接口,码原如下图所示。码原

       它实现了RandomAccess接口,码原表明支持随机访问;Cloneable接口,码原表明可以实现克隆;Serializable接口,码原fastdfs源码解析表明支持序列化。码原

       与其他类不同,码原如Vector,码原ArrayList在单线程环境下的码原线程安全性较差,但适用于多线程环境下的码原Vector或CopyOnWriteArrayList。

       ArrayList底层基于连续的码原空间实现,为动态可扩展的码原顺序表。

       一、码原构造方法解析

       使用ArrayList(Collection c)构造方法时,码原传入类型必须为E或其子类。

       二、扩容分析

       不带参数的构造方法初始容量为,此时底层数组为空,即`DEFAULT_CAPACITY_EMPTY_ELEMENTDATA`长度为0。

       元素添加时,默认插入数组末尾,调用`ensureCapacityInternal(size + 1)`增加容量。源码的执行步骤

       若当前容量无法满足增加需求,计算新的容量以达到所需规模,确保添加元素成功并避免频繁扩容。

       三、常用方法

       通过List.subList(int fromIndex, int toIndex)方法获取子列表,修改原列表元素亦会改变此子列表。

       四、遍历方式

       ArrayList提供for循环、foreach循环、迭代器三种遍历方法。

       五、缺陷与替代方案

       ArrayList基于数组实现,插入或删除元素导致频繁元素移动,时间复杂度高。在需要任意位置频繁操作的场景下,性能不佳。

       因此,在Java集合中引入了更适合频繁插入和删除操作的LinkedList类。

       版权声明:本文内容基于阿里云实名注册用户的贡献,遵循相关协议规定,包括用户服务协议和知识产权保护指引。发现抄袭内容,python源码统计爬虫可通过侵权投诉表单举报,确保社区内容健康、合规。

面试题:ArrayList扩容时扩容多少?

       大家好,我是你们的小米!今天要和大家一起来探讨一个在Java面试中经常被问到的问题:“ArrayList扩容时扩容多少?”相信很多小伙伴都在面试中遇到过这个问题,那么接下来,我就为大家详细解析一下这个问题,希望能够帮助大家在面试中游刃有余!

       了解ArrrayList的内部实现

       在深入解析扩容策略之前,我们首先要了解一下ArrayList的内部实现原理。ArrayList是Java集合框架中的一个动态数组,它可以根据需要动态地增加或减少元素。ArrayList的底层是通过数组实现的,当数组容量不足以存放新增的元素时,就需要进行扩容操作。

       扩容策略简介

       ArrayList在扩容时,并不是每次新增一个元素就扩容一次,这样效率会很低。相反,它采取了一种“倍增”策略,即当数组容量不够用时,高通bsp源码它会将当前容量翻倍。这样做的好处是,在一次扩容操作中,可以一次性扩充一大块内存,减少了频繁扩容带来的性能损耗。

       源码分析

       ArrayList的扩容逻辑实际上是由ensureCapacityInternal方法来完成的。我们一起来看一下这段源码:

       从上面的代码中,我们可以看到,在grow方法中,新的容量(newCapacity)是通过将旧容量(oldCapacity)右移一位(即除以2),然后再加上旧容量得到的。这样就实现了容量的翻倍扩容策略。

       理解扩容的触发条件

       在源码分析的基础上,我们来总结一下ArrayList扩容的触发条件:

       需要注意的是,虽然数组会根据倍增策略进行扩容,但也并不是无限制地扩容下去的。在源码中,有一个MAX_ARRAY_SIZE的限制,如果计算得到的新容量超过了这个值,就会进行特殊处理。

       END

       通过对ArrayList扩容策略的源码分析和解释,我们可以得出ArrayList在扩容时采用了倍增策略,dede有声小说源码每次扩容都会将当前容量翻倍,从而有效地减少了频繁扩容带来的性能损耗。同时,也要注意到MAX_ARRAY_SIZE的限制,防止无限制地扩容。掌握了这些知识,相信在面试中回答关于ArrayList扩容策略的问题时,大家已经游刃有余了!

List LinkedList HashSet HashMap底层原理剖析

       ArrayList底层数据结构采用数组。数组在Java中连续存储,因此查询速度快,时间复杂度为O(1),插入数据时可能会慢,特别是需要移动位置时,时间复杂度为O(N),但末尾插入时时间复杂度为O(1)。数组需要固定长度,ArrayList默认长度为,最大长度为Integer.MAX_VALUE。在添加元素时,如果数组长度不足,则会进行扩容。JDK采用复制扩容法,通过增加数组容量来提升性能。若数组较大且知道所需存储数据量,可设置数组长度,或者指定最小长度。例如,设置最小长度时,扩容长度变为原有容量的1.5倍,从增加到。

       LinkedList底层采用双向列表结构。链表存储为物理独立存储,因此插入操作的时间复杂度为O(1),且无需扩容,也不涉及位置挪移。然而,查询操作的时间复杂度为O(N)。LinkedList的add和remove方法中,add默认添加到列表末尾,无需移动元素,相对更高效。而remove方法默认移除第一个元素,移除指定元素时则需要遍历查找,但与ArrayList相比,无需执行位置挪移。

       HashSet底层基于HashMap。HashMap在Java 1.7版本之前采用数组和链表结构,自1.8版本起,则采用数组、链表与红黑树的组合结构。在Java 1.7之前,链表使用头插法,但在高并发环境下可能会导致链表死循环。从Java 1.8开始,链表采用尾插法。在创建HashSet时,通常会设置一个默认的负载因子(默认值为0.),当数组的使用率达到总长度的%时,会进行数组扩容。HashMap的put方法和get方法的源码流程及详细逻辑可能较为复杂,涉及哈希算法、负载因子、扩容机制等核心概念。

如何自己实现一个简单的ArrayList

       ArrayList是Java集合框架中一个经典的实现类。他比起常用的数组而言,明显的优点在于,可以随意的添加和删除元素而不需考虑数组的大小。

       å®žçŽ°ä¸€ä¸ªç®€å•çš„ArrayList,实现的过程:

       å®žçŽ°çš„ArrayList主要的功能如下:

       é»˜è®¤æž„造器和一个参数的有参构造器

       add方法

       get方法

       indexOf方法

       contains方法

       size方法

       isEmpty方法

       remove方法

       è¿™ä¸ªç®€å•çš„ArrayListç±» 取名为SimpleArrayList,全部的代码查看SimpleArrayList代码

       æž„造器

       æºç ArrayList一共有三个构造器,一个无参构造器,一个参数为int型有参构造器,一个参数为Collection型的有参构造器。参数为Collection型的构造器用来实现将其他继承Collection类的容器类转换成ArrayList。SimpleArrayList类因为还没有手动实现其他的容器类,所以实现的构造方法只有2个。代码如下:

   public SimpleArrayList(){        this(DEFAULT_CAPACITY);

          }    public SimpleArrayList(int size){        if (size < 0){            throw new IllegalArgumentException("默认的大小" + size);

              }else{

                  elementData = new Object[size];

              }

          }

       æ— å‚构造器中的 DEFAULT_CAPACITY是定义的私有变量,默认值是,用来创建一个大小为的数组。有参构造器中,int参数是用来生成一个指定大小的Object数组。将创建好的数组传给elementData。elementData是真正的用来存储元素的数组。

       add方法

       add 方法用来往容器中添加元素,add方法有两个重载方法,一个是add(E e),另一个是add(int index, E e)。add本身很简单,但是要处理动态数组,即数组大小不满足的时候,扩大数组的内存。具体的代码如下:

   public void add(E e){

              isCapacityEnough(size + 1);

              elementData[size++] = e;

          }

       æ–¹æ³•isCapacityEnough就是来判断是否需要扩容,传入的参数就是最小的扩容空间。因为add一个元素,所以最小的扩容空间,即新的长度是所有元素+ 1。这里的size就是真正的元素个数。

  private void isCapacityEnough(int size){        if (size > DEFAULT_CAPACITY){

                  explicitCapacity(size);

              }       if (size < 0){            throw new OutOfMemoryError();

              }

          }

       åˆ¤æ–­æ‰©å®¹çš„方法也很简单,判断需要扩容的空间是不是比默认的空间大。如果需要的空间比默认的空间大,就调用explicitCapacity进行扩容。这里有个size小于0的判断,出现size小于0主要是因为当size超过Integer.MAX_VALUE就会变成负数。

   private final static int MAX_ARRAY_LENGTH = Integer.MAX_VALUE - 8;    private void explicitCapacity(int capacity){        int newLength = elementData.length * 2;        if (newLength - capacity < 0){

                  newLength = capacity;

              }        if (newLength > (MAX_ARRAY_LENGTH)){

                  newLength = (capacity > MAX_ARRAY_LENGTH ? Integer.MAX_VALUE : MAX_ARRAY_LENGTH);

              }

              elementData = Arrays.copyOf(elementData, newLength);

          }

       ä¸Šé¢çš„代码是扩容的代码,首先,定义一个数组最大的容量的常量为最大值,这个值按照官方的源码中的解释是要有些VM保留了数组的头部信息在数组中,因此实际存放数据的大小就是整数的最大值 - 8

       ç„¶åŽè®¾å®šä¸€ä¸ªè¦æ‰©å®¹çš„数组的大小,虽然上面说了有一个扩容空间的值 size + 1 ,这个是实际我们最小需要扩容的大小。但为了继续增加元素,而不频繁的扩容,因此一次性的申请多一些的扩容空间。这里newLength 打算申请为 数组长度的2倍,然后去判断这个长度是否满足需要的扩容空间的值。 即有了后续的两段代码

     if (newLength - capacity < 0){            newLength = capacity;

            }      if (newLength > (MAX_ARRAY_LENGTH)){            newLength = (capacity > MAX_ARRAY_LENGTH ? Integer.MAX_VALUE : MAX_ARRAY_LENGTH);

            }

       å¦‚æžœ2倍的长度仍然不满足,则申请到需要的扩容长度。在我们只增加一个元素的情况下,这个判断是永远不会生效的,但是如果有addAll方法,则增加的元素很多,就要导致一次申请2倍的长度是不够的。第二个判断是判断newLength的长度如果超过上面定义的数组最大长度则判断要需要的扩容空间是否大于数组最大长度,如果大于则newLength为 MAX_VALUE ,否则为 MAX_ARRAY_LENGTH。

       æœ€åŽï¼ŒçœŸæ­£å®žçŽ°æ•°ç»„扩容到设定长度的方法就没意思了,调用Arrays.copyOf(elementData, newLength)得到一个扩容后的数组。

       add的另一个重载方法也很简单。

  public void add(int index, E e) {

             //判断是不是越界

              checkRangeForAdd(index);

              //判断需不需要扩容

              isCapacityEnough(size + 1);

              //将index的元素及以后的元素向后移一位

              System.arraycopy(elementData,index,elementData,index + 1,size - index);

              //将index下标的值设为e

              elementData[index] = e;        size++;

          }

          private void checkRangeForAdd(int index){        //这里index = size是被允许的,即支持头,中间,尾部插入

              if (index < 0 || index > size){            throw new IndexOutOfBoundsException("指定的index超过界限");

              }

          }

       è‡³æ­¤ï¼Œä¸€ä¸ªç®€å•çš„add方法就实现完了。

       get方法

       get方法用来得到容器中指定下标的元素。方法实现比较简单,直接返回数组中指定下标的元素即可。

   private void checkRange(int index) {        if (index >= size || index < 0){

                  throw new IndexOutOfBoundsException("指定的index超过界限");

              }

          }    public E get(int index){

              checkRange(index);        return (E)elementData[index];

          }

       indexOf方法

       indexOf方法用来得到指定元素的下标。实现起来比较简单,需要判断传入的元素,代码如下:

   public int indexOf(Object o){        if (o != null) {            for (int i = 0 ; i < size ; i++){                if (elementData[i].equals(o)){                    return i;

                      }

                  }

              }else {            for (int i = 0 ; i < size ; i++){                if (elementData[i] == null) {                    return i;

                      }

                  }

              }        return -1;

          }

       åˆ¤æ–­ä¼ å…¥çš„元素是否为null,如果为null,则依次与null。如果不为空,则用equals依次比较。匹配成功就返回下标,匹配失败就返回-1。

       contains方法

       contains用来判断该容器中是否包含指定的元素。在有了indexOf方法的基础上,contains的实现就很简单了。

    public boolean contains(Object o){        return indexOf(o) >= 0;

           }

       size方法

       size方法用来得到容器类的元素个数,实现很简单,直接返回size的大小即可。

   public int size(){        return size;

          }

       isEmpty方法

       isEmpty方法用来判断容器是否为空,判断size方法的返回值是否为0即可。

   public boolean isEmpty(){        return size() == 0;

          }

       remove方法

       remove方法是用来对容器类的元素进行删除,与add一样,remove方法也有两个重载方法,分别是

       remove(Object o)和remove(int index)

    public E remove(int index) {

              E value = get(index);        int moveSize = size - index - 1;        if (moveSize > 0){

                  System.arraycopy(elementData,index + 1, elementData,index,size - index - 1);

              }

              elementData[--size] = null;        return value;

          }    

          public boolean remove(Object o){        if (contains(o)){

                  remove(indexOf(o));            return true;

              }else {            return false;

              }

          }

       ç¬¬ä¸€ä¸ªremove方法是核心方法,首先得到要删除的下标元素的值,然后判断index后面的要前移的元素的个数,如果个数大于零,则调用库方法,将index后面的元素向前移一位。最后elementData[--size] = null;缩减size大小,并将原最后一位置空。

       ç¬¬äºŒä¸ªremove方法不需要向第一个方法一样,需要告诉使用者要删除的下标对应的元素,只需要判断是否删除成功即可。如果要删除的元素在列表中,则删除成功,如果不在则失败。因此调用contains方法就可以判断是否要删除的元素在列表中。在则调用remove(int index),不在则返回失败。

arraylist如何实现序列化?

       小彭为您带来关于 ArrayList 如何实现序列化的内容。在实际业务开发中,我们通常直接使用标准库的数据结构,例如 ArrayList。本篇文章将深入解析 ArrayList 的核心实现,包括源码分析、构造方法、添加与扩容、迭代器、序列化过程、clone() 方法、线程安全特性以及 ArrayList 与 Arrays#ArrayList 的区别,并探讨 ArrayList 是否能完全替代数组。

       首先,ArrayList 是一个动态数组,底层使用 Object 数组存储元素。其构造方法提供了不同初始容量的选项,懒初始化策略使得在首次添加元素时动态分配内存。

       添加元素时,ArrayList 会检查容量是否足够,不足时会进行扩容,以避免频繁扩容带来的性能损耗。扩容过程中涉及数据的移动和复制,以保持数据的连续性。

       迭代器方面,ArrayList 提供了两种迭代器,遵循 Java 的 Iterator 规范。在迭代过程中,迭代器具备 fail-fast 机制,可以检测并处理并发修改数组的情况,确保数据的一致性。

       序列化过程是 ArrayList 的关键特性之一,它重写了 JDK 的序列化逻辑,只序列化有效元素的数组部分,避免了不必要的内存占用。

       在 clone() 方法中,ArrayList 需要实现深拷贝,避免原对象与克隆对象之间的相互影响,确保数据独立。

       关于 ArrayList 的线程安全,有多种实现方式,例如使用 synchronized 关键字、提供 CopyOnWriteArrayList 类等。

       另一个 ArrayList,即 Arrays#ArrayList,实际上是 Arrays 类的一部分,用于数组与 List 之间的转换。其底层实现与 ArrayList 类似,但主要用于数组操作。

       讨论 ArrayList 是否能完全替代数组时,需要考虑性能、内存使用、类型安全等因素。在大多数业务开发场景中,ArrayList 是更好的选择,因为它提供了更高级的抽象和便利性。

       通过解析 ArrayList 的源码和实现细节,我们能更好地理解其工作原理和局限性,从而在实际开发中做出更为合理的选择。在后续文章中,我们将深入探讨 ArrayList 的孪生兄弟 —— LinkedList,敬请期待。

arraylist为什么线程不安全

       é¦–先说一下什么是线程不安全:线程安全就是多线程访问时,采用了加锁机制,当一个线程访问该类的某个数据时,进行保护,其他线程不能进行访问直到该线程读取完,其他线程才可使用。不会出现数据不一致或者数据污染。线程不安全就是不提供数据访问保护,有可能出现多个线程先后更改数据造成所得到的数据是脏数据。 如图,List接口下面有两个实现,一个是ArrayList,另外一个是vector。 从源码的角度来看,因为Vector的方法前加了,synchronized 关键字,也就是同步的意思,sun公司希望Vector是线程安全的,而希望arraylist是高效的,缺点就是另外的优点。 说下原理(百度的,很好理解): 一个 ArrayList ,在添加一个元素的时候,它可能会有两步来完成:

       1. 在 Items[Size] 的位置存放此元素;

       2. 增大 Size 的值。

       åœ¨å•çº¿ç¨‹è¿è¡Œçš„情况下,如果 Size = 0,添加一个元素后,此元素在位置 0,而且 Size=1;

       è€Œå¦‚果是在多线程情况下,比如有两个线程,线程 A 先将元素存放在位置 0。但是此时 CPU 调度线程A暂停,线程 B 得到运行的机会。线程B也向此 ArrayList 添加元素,因为此时 Size 仍然等于 0 (注意哦,我们假设的是添加一个元素是要两个步骤哦,而线程A仅仅完成了步骤1),所以线程B也将元素存放在位置0。然后线程A和线程B都继续运行,都增加 Size 的值。

       é‚£å¥½ï¼ŒçŽ°åœ¨æˆ‘们来看看 ArrayList 的情况,元素实际上只有一个,存放在位置 0,而 Size 却等于 2。这就是“线程不安全”了。

       ç¤ºä¾‹ç¨‹åºï¼š

       package test;

       import java.util.ArrayList;

       import java.util.List;

       public class ArrayListInThread implements Runnable {

       List<String> list1 = new ArrayList<String>();// not thread safe

       // List<String> list1 = Collections.synchronizedList(new ArrayList<String>());// thread safe

       public void run() {

       try {

       Thread.sleep((int)(Math.random() * 2));

       }

       catch (InterruptedException e) {

       e.printStackTrace();

       }

       list1.add(Thread.currentThread().getName());

       }

       public static void main(String[] args) throws InterruptedException {

       ThreadGroup group = new ThreadGroup("mygroup");

       ArrayListInThread t = new ArrayListInThread();

       for (int i = 0; i < ; i++) {

       Thread th = new Thread(group, t, String.valueOf(i));

       th.start();

       }

       while (group.activeCount() > 0) {

       Thread.sleep();

       }

       System.out.println();

       System.out.println(t.list1.size()); // it should be if thread safe collection is used.

       }

       }

更多内容请点击【时尚】专栏