String 类源码分析_随笔

String 类源码分析源码分析 1、成员变量

public final class String implements java.io.Serializable, Comparable, CharSequence {
    
    // 用不可变的 char 数组用来存放字符串
    private final char value[];

    // 缓存 String 的 hash 值
    private int hash; // Default to 0

    // 实现序列化的标识
    private static final long serialVersionUID = -6849794470754667710L;
    
    private static final ObjectStreamField[] serialPersistentFields = new ObjectStreamField[0];

1）String 是一个 final 类，既不能被继承的类。
2）String类实现了 java.io.Serializable 接口，可以实现序列化。
3）String类实现了 Comparable< String>，可以用于比较大小（按顺序比较单个字符的ASCII码）。
4）String 类实现了 CharSequence 接口，表示是一个有序字符的序列，因为 String 的本质是一个 char 类型数组。
5）private final char value[] 这是 String 字符串的本质，是一个字符集合，而且是 final 的，是不可变的。

2、构造函数

（1）无参构造方法（不用）

// 初始化 String 对象，将 "" 空字符串的 value 赋值给实例对象的 value，也是空字符,因为字符串是不可变的，所以不需要用这个方法
    public String() {
        this.value = "".value;
    }
示例：
String str = new String() 
str = "hello"; 
先创建了一个空的 String 对象，引用 str 指向该空对象，接着又在常量池中创建了一个 “hello”，并赋值给引用 str。这种方式实际上创建了两个对象。

（2）参数为 String 的有参构造方法

// 参数为一个String对象   	
// 将形参的value和hash赋值给实例对象作为初始化 	
// 相当于深拷贝了一个形参String对象
    public String(String original) {
        this.value = original.value;
        this.hash = original.hash;
    }

示例：

String str = new String("hello")

（3）参数为字符数组的有参构造方法

    // 参数为一个 char 字符数组
    // 将数组值拷贝赋给不可变字符数组
    // 这里为什么不直接赋值呢: 因为参数 char value[] 是可变的，如果直接赋值，当参数数组发生变化时，就会影响到新生成的 String 对象，着就破坏的 String 的“不可变性”。 
    public String(char value[]) {
    	// 使用java.utils包中的Arrays类复制
        this.value = Arrays.copyOf(value, value.length);
    }

该方式数组值拷贝给不可变字符数组而不是直接赋值。

（4）参数为字符数组(指定起止位置)的有参构造方法

 	
    public String(char value[], int offset, int count) {
        if (offset < 0) {
            throw new StringIndexOutOfBoundsException(offset);
        }
        if (count <= 0) {
            if (count < 0) {
                throw new StringIndexOutOfBoundsException(count);
            }
            if (offset <= value.length) {
                this.value = "".value;
                return;
            }
        }
        // Note: offset or count might be near -1>>>1.
        if (offset > value.length - count) {
            throw new StringIndexOutOfBoundsException(offset + count);
        }
        this.value = Arrays.copyOfRange(value, offset, offset+count);
    }

（5）参数为 int 数组(指定起止位置)的有参构造方法

	
    public String(int[] codePoints, int offset, int count) {
        if (offset < 0) {
            throw new StringIndexOutOfBoundsException(offset);
        }
        if (count <= 0) {
            if (count < 0) {
                throw new StringIndexOutOfBoundsException(count);
            }
            if (offset <= codePoints.length) {
                this.value = "".value;
                return;
            }
        }
        // Note: offset or count might be near -1>>>1.
        if (offset > codePoints.length - count) {
            throw new StringIndexOutOfBoundsException(offset + count);
        }

        final int end = offset + count;

        // Pass 1: Compute precise size of char[]
        int n = count;
        for (int i = offset; i < end; i++) {
            int c = codePoints[i];
            if (Character.isBmpCodePoint(c))
                continue;
            else if (Character.isValidCodePoint(c))
                n++;
            else throw new IllegalArgumentException(Integer.toString(c));
        }

        // Pass 2: Allocate and fill in char[]
        final char[] v = new char[n];

        for (int i = offset, j = 0; i < end; i++, j++) {
            int c = codePoints[i];
            if (Character.isBmpCodePoint(c))
                v[j] = (char)c;
            else
                Character.toSurrogates(c, v, j++);
        }

        this.value = v;
    }

int 数组的元素则是字符对应的 ASCII 整数值。

（6）参数为 byte 数组(指定起止位置、字符编码)的有参构造方法

	
	 //从bytes数组中的offset位置开始，将长度为length的字节，以charsetName格式编码，拷贝到value
    public String(byte bytes[], int offset, int length, String charsetName)
            throws UnsupportedEncodingException {
        if (charsetName == null)
            throw new NullPointerException("charsetName");
        //判断byte数组是否越界    
        checkBounds(bytes, offset, length);
        this.value = StringCoding.decode(charsetName, bytes, offset, length);
    }

（7）参数为 StringBuffer 的有参构造方法

	
    public String(StringBuffer buffer) {
        synchronized(buffer) {
            this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
        }
    } 
以 StringBuffer 为构造参数是线程安全的；也可以使用 StringBuilder 为参数构造，但不是线程安全的。

3、常用方法

4、重点方法源码

（1）长度

    // 返回value数组的长度
    public int length() {
        return value.length;
    }

（2）判空

     
    public boolean isEmpty() {
        return value.length == 0;
    }

（3）取字符

   
    public char charAt(int index) {
        if ((index < 0) || (index >= value.length)) {
            throw new StringIndexOutOfBoundsException(index);
        }
        return value[index];
    }

（4）比较 —— equals、equalsIgnoreCase、compareTo

   
    public boolean equals(Object anObject) {
        //如果比较地址是否相等，是同一个对象（==比较的是地址）
        if (this == anObject) {
            return true;
        }
        //判断anObject是否是String类型
        if (anObject instanceof String) {
           //将anObject转换为String类型
            String anotherString = (String)anObject;
            int n = value.length;
            //判断anotherString是否和当前String的value数组长度相同
            if (n == anotherString.value.length) {
                 //v1为当前String的值，v2为参数对象anotherString的值
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                //每次循环长度-1,直到长度消耗完，循环结束 
                while (n-- != 0) {
                   //相同下标位置字符串比较，有一个不相同，返回false
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                //如比较期间没有问题，则说明相等，返回true
                return true;
            }
        }
        return false;
    }


	
    public boolean equalsIgnoreCase(String anotherString) {
       //先判断是否为同一个对象
        return (this == anotherString) ? true
                : (anotherString != null)
                //再判断长度是否相等
                && (anotherString.value.length == value.length)
                //再调用regionMatchs方法 
                && regionMatches(true, 0, anotherString, 0, value.length);
    }


	
    public int compareTo(String anotherString) {
    	// 自身对象字符串长度len1
        int len1 = value.length;
        // 被比较对象字符串长度len2
        int len2 = anotherString.value.length;
        // 取两个字符串长度的最小值lim
        int lim = Math.min(len1, len2);
        char v1[] = value;
        char v2[] = anotherString.value;

        int k = 0;
        // 从 value 的第一个字符开始到最小长度lim处为止，如果字符不相等，返回自身（对象不相等处字符-被比较对象不相等字符）
        while (k < lim) {
            char c1 = v1[k];
            char c2 = v2[k];
            if (c1 != c2) {
                return c1 - c2;
            }
            k++;
        }
        // 如果前面都相等，则返回（自身长度-被比较对象长度）
        return len1 - len2;
    }

（1）equals方法：

1）内存地址相同，则为真。
2）如果对象类型不是 String 类型，则为假。否则继续判断。
3）如果对象长度不相等，则为假。否则继续判断。
4）从后往前，判断 String 类中 char 数组 value 的单个字符是否相等，有不相等则为假。如果一直相等直到第一个数，则返回真。

（2）compareTo 方法写的很巧妙，先从0开始判断字符大小。如果两个对象能比较字符的地方比较完了还相等，就直接返回自身长度减被比较对象长度，如果两个字符串长度相等，则返回的是0，巧妙地判断了三种情况。

（5）包含——startsWith、endsWith、contains

	
    public boolean startsWith(String prefix, int toffset) {
      //获得当前对象的值
        char ta[] = value;
        //获得需要判断的起始位置，偏移量
        int to = toffset;
        //获得前缀字符串的值
        char pa[] = prefix.value;
        int po = 0;
        int pc = prefix.value.length;
        // 如果起始地址小于0或者（起始地址+所比较对象长度）大于自身对象长度，返回假
        if ((toffset < 0) || (toffset > value.length - pc)) {
            return false;
        }
         //从所比较对象的末尾开始比较：循环pc次，既prefix的长度
        while (--pc >= 0) {
        //每次比较当前对象的字符串的字符是否跟prefix一样
            if (ta[to++] != pa[po++]) {
                //一样则pc--,to++,po++,有一个不同则返回false
                return false;
            }
        }
        return true;
    }


	// 判断当前对象[0, prefix.value.lenght]区间的字符串片段等于prefix。
    public boolean startsWith(String prefix) {
        return startsWith(prefix, 0);
    }


	//判断当前字符串对象是否以字符串prefix结尾
    public boolean endsWith(String suffix) {
        return startsWith(suffix, value.length - suffix.value.length);
    }


	//是否含有CharSequence这个子类元素，通常用于StrngBuffer,StringBuilder
    public boolean contains(CharSequence s) {
        return indexOf(s.toString()) > -1;
    }

（6）hashCode

String 类重写了 hashCode 方法，Object 中的 hashCode 方法是一个 Native 调用。String 类的 hash 采用多项式计算得来，我们完全可以通过不相同的字符串得出同样的 hash，所以两个 String 对象的 hashCode 相同，并不代表两个 String 是一样的。

	
    public int hashCode() {
       //hash是成员变量，所以默认为0
        int h = hash;
        如果hash为0，且字符串对象长度大于0，不为""
        if (h == 0 && value.length > 0) {
            //获取当前对象的value
            char val[] = value;
            // 通过算法s[0]31^(n-1) + s[1]31^(n-2) + ... + s[n-1]计算hash值 
            for (int i = 0; i < value.length; i++) {
                //每次都是31 * 每次循环获得的h +第i个字符的ASSIC码
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

（7）查询索引——indexOf、lastIndexOf

 public int indexOf(int ch, int fromIndex) {
        final int max = value.length;
        if (fromIndex < 0) {
            fromIndex = 0;
        } else if (fromIndex >= max) {
            // Note: fromIndex might be near -1>>>1.
            return -1;
        }
       一个char占用两个字节，如果ch小于2的16次方（65536），绝大多数字符都在此范围内
        if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) {
            // handle most cases here (ch is a BMP code point or a
            // negative value (invalid code point))
            final char[] value = this.value;
            //从 fromIndex位置起遍历value数组
            for (int i = fromIndex; i < max; i++) {
                //存在相等的字符，返回第一次出现该字符的索引位置，并终止循环
                if (value[i] == ch) {
                    return i;
                }
            }
            return -1;
        } else {
            return indexOfSupplementary(ch, fromIndex);
        }
    }

      public int indexOf(int ch) {
        return indexOf(ch, 0);//从第一个字符开始搜索
      }




static int indexOf(char[] source, int sourceOffset, int sourceCount, String target, int fromIndex) {
    return indexOf(source, sourceOffset, sourceCount, target.value, 0, target.value.length,fromIndex);
    }

public int indexOf(String str, int fromIndex) {
     return indexOf(value, 0, value.length, str.value, 0, str.value.length, fromIndex);
    }

	
    public int indexOf(String str) {
        return indexOf(str, 0);
    }



   
    public int lastIndexOf(int ch) {
        return lastIndexOf(ch, value.length - 1);
    }



  
    public int lastIndexOf(int ch, int fromIndex) {
        if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) {
            // handle most cases here (ch is a BMP code point or a
            // negative value (invalid code point))
            final char[] value = this.value;
            int i = Math.min(fromIndex, value.length - 1);
            for (; i >= 0; i--) {
                if (value[i] == ch) {
                    return i;
                }
            }
            return -1;
        } else {
            return lastIndexOfSupplementary(ch, fromIndex);
        }
    }

（8）获取子串

   
    public String substring(int beginIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        int subLen = value.length - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        //利用构造函数生成新的String对象
        return (beginIndex == 0) ? this : new String(value, beginIndex, subLen);
    }


   	
    public String substring(int beginIndex, int endIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        if (endIndex > value.length) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        int subLen = endIndex - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        return ((beginIndex == 0) && (endIndex == value.length)) ? this
                : new String(value, beginIndex, subLen);
    }

（9）拼接——concat、join

   
    public String concat(String str) {
        int otherLen = str.length();
        if (otherLen == 0) {
            return this;
        }
        //获得当前String对象的长度 
        int len = value.length;
        //将数组扩容，将value数组拷贝到buf数组中，长度为len + str.lenght
        char buf[] = Arrays.copyOf(value, len + otherLen);
        //然后将str字符串从buf字符数组的len位置开始覆盖，得到一个完整的buf字符数组
        str.getChars(buf, len);
        //生成新的Strintg对象
        return new String(buf, true);
    }



   
    public static String join(CharSequence delimiter, CharSequence... elements) {
        Objects.requireNonNull(delimiter);
        Objects.requireNonNull(elements);
        // Number of elements not likely worth Arrays.stream overhead.
        StringJoiner joiner = new StringJoiner(delimiter);
        for (CharSequence cs: elements) {
            joiner.add(cs);
        }
        return joiner.toString();
    }

（10）替换——replace、replaceAll

   //替换，将字符串中的oldChar字符全部替换成newChar
    public String replace(char oldChar, char newChar) {
        if (oldChar != newChar) {
            int len = value.length;
            int i = -1;
            char[] val = value; 
            //循环len次 
            while (++i < len) {
                //找到第一个旧字符，打断循环
                if (val[i] == oldChar) {
                    break;
                }
            }
            //如果第一个旧字符的位置小于len
            if (i < len) {
               //new一个字符数组，len个长度
                char buf[] = new char[len];
                for (int j = 0; j < i; j++) {
                   //把旧字符的前面的字符都复制到新字符数组上
                    buf[j] = val[j];
                }
                 //从i位置开始遍历
                while (i < len) {
                    char c = val[i];
                    //发现旧字符就替换，不相关的则直接复制
                    buf[i] = (c == oldChar) ? newChar : c;
                    i++;
                }
                //通过新字符数组buf重构一个新String对象
                return new String(buf, true);
            }
        }
        return this;
    }



   //当不是正规表达式时，与replace效果一样，都是全体换。如果字符串的正则表达式，则规矩表达式全体替换
    public String replaceAll(String regex, String replacement) {
        return Pattern.compile(regex).matcher(this).replaceAll(replacement);
    }

replace 方法最开始先找出旧值出现的位置，这样节省了一部分对比的时间。replace(String oldStr,String newStr)方法通过正则表达式来判断。

（11）切割

   
    public String[] split(String regex, int limit) {
      
        char ch = 0;
        if (((regex.value.length == 1 &&
             ".$|()[{^?*+\".indexOf(ch = regex.charAt(0)) == -1) ||
             (regex.length() == 2 &&
              regex.charAt(0) == '\' &&
              (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
              ((ch-'a')|('z'-ch)) < 0 &&
              ((ch-'A')|('Z'-ch)) < 0)) &&
            (ch < Character.MIN_HIGH_SURROGATE ||
             ch > Character.MAX_LOW_SURROGATE))
        {
            int off = 0;
            int next = 0;
            //大于0，limited==true,反之limited==false
            boolean limited = limit > 0;
            ArrayList list = new ArrayList<>();
            while ((next = indexOf(ch, off)) != -1) {
            //当参数limit<=0 或者 集合list的长度小于 limit-1
                if (!limited || list.size() < limit - 1) {
                    list.add(substring(off, next));
                    off = next + 1;
                } else {    // last one
                    //判断最后一个list.size() == limit - 1
                    list.add(substring(off, value.length));
                    off = value.length;
                    break;
                }
            }
            //如果没有一个能匹配的，返回一个新的字符串，内容和原来的一样
            if (off == 0)
                return new String[]{this};

           // 当 limit<=0 时，limited==false,或者集合的长度 小于 limit是，截取添加剩下的字符串
            if (!limited || list.size() < limit)
                list.add(substring(off, value.length));

            // 当 limit == 0 时，如果末尾添加的元素为空（长度为0），则集合长度不断减1，直到末尾不为空
            int resultSize = list.size();
            if (limit == 0) {
                while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {
                    resultSize--;
                }
            }
            String[] result = new String[resultSize];
            return list.subList(0, resultSize).toArray(result);
        }
        return Pattern.compile(regex).split(this, limit);
    }



    public String[] split(String regex) {
        return split(regex, 0);
    }

（12）大小写转换

  
  public String toLowerCase(Locale locale) {
        if (locale == null) {
            throw new NullPointerException();
        }

        int firstUpper;
        final int len = value.length;

        
        scan: {
            for (firstUpper = 0 ; firstUpper < len; ) {
                char c = value[firstUpper];
                //判断字符是否大写
                if ((c >= Character.MIN_HIGH_SURROGATE)
                        && (c <= Character.MAX_HIGH_SURROGATE)) {
                    int supplChar = codePointAt(firstUpper);
                    if (supplChar != Character.toLowerCase(supplChar)) {
                        break scan;
                    }
                    firstUpper += Character.charCount(supplChar);
                } else {
                    if (c != Character.toLowerCase(c)) {
                        break scan;
                    }
                    firstUpper++;
                }
            }
            return this;
        }

        char[] result = new char[len];
        int resultOffset = 0;  

        
        System.arraycopy(value, 0, result, 0, firstUpper);

        String lang = locale.getLanguage();
        boolean localeDependent =
                (lang == "tr" || lang == "az" || lang == "lt");
        char[] lowerCharArray;
        int lowerChar;
        int srcChar;
        int srcCount;
        for (int i = firstUpper; i < len; i += srcCount) {
            srcChar = (int)value[i];
            if ((char)srcChar >= Character.MIN_HIGH_SURROGATE
                    && (char)srcChar <= Character.MAX_HIGH_SURROGATE) {
                srcChar = codePointAt(i);
                srcCount = Character.charCount(srcChar);
            } else {
                srcCount = 1;
            }
            if (localeDependent ||
                srcChar == 'u03A3' || // GREEK CAPITAL LETTER SIGMA
                srcChar == 'u0130') { // LATIN CAPITAL LETTER I WITH DOT ABOVE
                lowerChar = ConditionalSpecialCasing.toLowerCaseEx(this, i, locale);
            } else {
                lowerChar = Character.toLowerCase(srcChar);
            }
            if ((lowerChar == Character.ERROR)
                    || (lowerChar >= Character.MIN_SUPPLEMENTARY_CODE_POINT)) {
                if (lowerChar == Character.ERROR) {
                    lowerCharArray =
                            ConditionalSpecialCasing.toLowerCaseCharArray(this, i, locale);
                } else if (srcCount == 2) {
                    resultOffset += Character.toChars(lowerChar, result, i + resultOffset) - srcCount;
                    continue;
                } else {
                    lowerCharArray = Character.toChars(lowerChar);
                }

                
                int mapLen = lowerCharArray.length;
                if (mapLen > srcCount) {
                    char[] result2 = new char[result.length + mapLen - srcCount];
                    System.arraycopy(result, 0, result2, 0, i + resultOffset);
                    result = result2;
                }
                for (int x = 0; x < mapLen; ++x) {
                    result[i + resultOffset + x] = lowerCharArray[x];
                }
                resultOffset += (mapLen - srcCount);
            } else {
                result[i + resultOffset] = (char)lowerChar;
            }
        }
        return new String(result, 0, len + resultOffset);
    }

（13）去空格

   
    public String trim() {
        //代表尾指针，实际是尾指针+1的大小
        int len = value.length;
        //代表头指针
        int st = 0;
        char[] val = value;    
        // 找到字符串前段没有空格的位置：st 0) || (len < value.length)) ? substring(st, len) : this;
    }

（14）字符/字符串转换——toString、toCharArray、valueOf

    //返回自己
    public String toString() {
        return this;
    }


   
    public char[] toCharArray() {
        // Cannot use Arrays.copyOf because of class initialization order issues
        char result[] = new char[value.length];
        System.arraycopy(value, 0, result, 0, value.length);
        return result;
    }


   //将Object转换为字符串
    public static String valueOf(Object obj) {
        return (obj == null) ? "null" : obj.toString();
    }

（15）格式化

   //JAVA字符串格式化
	//新字符串使用本地语言环境，制定字符串格式和参数生成格式化的新字符串。
    public static String format(String format, Object... args) {
        return new Formatter().format(format, args).toString();
    }



   //使用指定的语言环境，制定字符串格式和参数生成格式化的字符串。
    public static String format(Locale l, String format, Object... args) {
        return new Formatter(l).format(format, args).toString();
    }

（16）intern()

// 一个本地方法。
// 当调用intern方法时，如果池中已经包含一个与该String确定的字符串相同equals(Object)的字符串，则返回该字符串。否则，将此String对象添加到池中，并返回此对象的引用。
  public native String intern();

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5660780.html

String 类源码分析

发表评论

评论列表（0条）