public final class String implements java.io.Serializable, Comparable, CharSequence { // 用不可变的 char 数组用来存放字符串 private final char value[]; // 缓存 String 的 hash 值 private int hash; // Default to 0 // 实现序列化的标识 private static final long serialVersionUID = -6849794470754667710L; private static final ObjectStreamField[] serialPersistentFields = new ObjectStreamField[0];
2、构造函数
1)String 是一个 final 类,既不能被继承的类 。
2)String类实现了 java.io.Serializable 接口,可以实现序列化。
3)String类实现了 Comparable< String>,可以用于比较大小(按顺序比较单个字符的ASCII码) 。
4)String 类实现了 CharSequence 接口,表示是一个有序字符的序列,因为 String 的本质是一个 char 类型数组。
5)private final char value[] 这是 String 字符串的本质,是一个字符集合,而且是 final 的,是不可变的。
(1)无参构造方法(不用)
// 初始化 String 对象,将 "" 空字符串的 value 赋值给实例对象的 value,也是空字符,因为字符串是不可变的,所以不需要用这个方法 public String() { this.value = "".value; }示例:
String str = new String() str = "hello";先创建了一个空的 String 对象,引用 str 指向该空对象,接着又在常量池中创建了一个 “hello”,并赋值给引用 str。 这种方式实际上创建了两个对象。
(2)参数为 String 的有参构造方法
// 参数为一个String对象 // 将形参的value和hash赋值给实例对象作为初始化 // 相当于深拷贝了一个形参String对象 public String(String original) { this.value = original.value; this.hash = original.hash; }示例:
String str = new String("hello")
(3)参数为字符数组的有参构造方法
// 参数为一个 char 字符数组 // 将数组值拷贝赋给不可变字符数组 // 这里为什么不直接赋值呢: 因为参数 char value[] 是可变的,如果直接赋值,当参数数组发生变化时,就会影响到新生成的 String 对象,着就破坏的 String 的“不可变性”。 public String(char value[]) { // 使用java.utils包中的Arrays类复制 this.value = Arrays.copyOf(value, value.length); }该方式数组值拷贝给不可变字符数组而不是直接赋值。
(4)参数为字符数组(指定起止位置)的有参构造方法
public String(char value[], int offset, int count) { if (offset < 0) { throw new StringIndexOutOfBoundsException(offset); } if (count <= 0) { if (count < 0) { throw new StringIndexOutOfBoundsException(count); } if (offset <= value.length) { this.value = "".value; return; } } // Note: offset or count might be near -1>>>1. if (offset > value.length - count) { throw new StringIndexOutOfBoundsException(offset + count); } this.value = Arrays.copyOfRange(value, offset, offset+count); }
(5)参数为 int 数组(指定起止位置)的有参构造方法
public String(int[] codePoints, int offset, int count) { if (offset < 0) { throw new StringIndexOutOfBoundsException(offset); } if (count <= 0) { if (count < 0) { throw new StringIndexOutOfBoundsException(count); } if (offset <= codePoints.length) { this.value = "".value; return; } } // Note: offset or count might be near -1>>>1. if (offset > codePoints.length - count) { throw new StringIndexOutOfBoundsException(offset + count); } final int end = offset + count; // Pass 1: Compute precise size of char[] int n = count; for (int i = offset; i < end; i++) { int c = codePoints[i]; if (Character.isBmpCodePoint(c)) continue; else if (Character.isValidCodePoint(c)) n++; else throw new IllegalArgumentException(Integer.toString(c)); } // Pass 2: Allocate and fill in char[] final char[] v = new char[n]; for (int i = offset, j = 0; i < end; i++, j++) { int c = codePoints[i]; if (Character.isBmpCodePoint(c)) v[j] = (char)c; else Character.toSurrogates(c, v, j++); } this.value = v; }int 数组的元素则是字符对应的 ASCII 整数值。
(6)参数为 byte 数组(指定起止位置、字符编码)的有参构造方法
//从bytes数组中的offset位置开始,将长度为length的字节,以charsetName格式编码,拷贝到value public String(byte bytes[], int offset, int length, String charsetName) throws UnsupportedEncodingException { if (charsetName == null) throw new NullPointerException("charsetName"); //判断byte数组是否越界 checkBounds(bytes, offset, length); this.value = StringCoding.decode(charsetName, bytes, offset, length); }
(7)参数为 StringBuffer 的有参构造方法
3、常用方法public String(StringBuffer buffer) { synchronized(buffer) { this.value = Arrays.copyOf(buffer.getValue(), buffer.length()); } }以 StringBuffer 为构造参数是线程安全的;也可以使用 StringBuilder 为参数构造,但不是线程安全的。
4、重点方法源码
(1)长度
// 返回value数组的长度 public int length() { return value.length; }
(2)判空
public boolean isEmpty() { return value.length == 0; }
(3)取字符
public char charAt(int index) { if ((index < 0) || (index >= value.length)) { throw new StringIndexOutOfBoundsException(index); } return value[index]; }
(4)比较 —— equals、equalsIgnoreCase、compareTo
public boolean equals(Object anObject) { //如果比较地址是否相等,是同一个对象(==比较的是地址) if (this == anObject) { return true; } //判断anObject是否是String类型 if (anObject instanceof String) { //将anObject转换为String类型 String anotherString = (String)anObject; int n = value.length; //判断anotherString是否和当前String的value数组长度相同 if (n == anotherString.value.length) { //v1为当前String的值,v2为参数对象anotherString的值 char v1[] = value; char v2[] = anotherString.value; int i = 0; //每次循环长度-1,直到长度消耗完,循环结束 while (n-- != 0) { //相同下标位置字符串比较,有一个不相同,返回false if (v1[i] != v2[i]) return false; i++; } //如比较期间没有问题,则说明相等,返回true return true; } } return false; } public boolean equalsIgnoreCase(String anotherString) { //先判断是否为同一个对象 return (this == anotherString) ? true : (anotherString != null) //再判断长度是否相等 && (anotherString.value.length == value.length) //再调用regionMatchs方法 && regionMatches(true, 0, anotherString, 0, value.length); } public int compareTo(String anotherString) { // 自身对象字符串长度len1 int len1 = value.length; // 被比较对象字符串长度len2 int len2 = anotherString.value.length; // 取两个字符串长度的最小值lim int lim = Math.min(len1, len2); char v1[] = value; char v2[] = anotherString.value; int k = 0; // 从 value 的第一个字符开始到最小长度lim处为止,如果字符不相等,返回自身(对象不相等处字符-被比较对象不相等字符) while (k < lim) { char c1 = v1[k]; char c2 = v2[k]; if (c1 != c2) { return c1 - c2; } k++; } // 如果前面都相等,则返回(自身长度-被比较对象长度) return len1 - len2; }
(1)equals方法:
1)内存地址相同,则为真。
2)如果对象类型不是 String 类型,则为假。否则继续判断。
3)如果对象长度不相等,则为假。否则继续判断。
4)从后往前,判断 String 类中 char 数组 value 的单个字符是否相等,有不相等则为假。如果一直相等直到第一个数,则返回真。(2)compareTo 方法写的很巧妙,先从0开始判断字符大小。如果两个对象能比较字符的地方比较完了还相等,就直接返回自身长度减被比较对象长度,如果两个字符串长度相等,则返回的是0,巧妙地判断了三种情况。
(5)包含——startsWith、endsWith、contains
public boolean startsWith(String prefix, int toffset) { //获得当前对象的值 char ta[] = value; //获得需要判断的起始位置,偏移量 int to = toffset; //获得前缀字符串的值 char pa[] = prefix.value; int po = 0; int pc = prefix.value.length; // 如果起始地址小于0或者(起始地址+所比较对象长度)大于自身对象长度,返回假 if ((toffset < 0) || (toffset > value.length - pc)) { return false; } //从所比较对象的末尾开始比较:循环pc次,既prefix的长度 while (--pc >= 0) { //每次比较当前对象的字符串的字符是否跟prefix一样 if (ta[to++] != pa[po++]) { //一样则pc--,to++,po++,有一个不同则返回false return false; } } return true; } // 判断当前对象[0, prefix.value.lenght]区间的字符串片段等于prefix。 public boolean startsWith(String prefix) { return startsWith(prefix, 0); } //判断当前字符串对象是否以字符串prefix结尾 public boolean endsWith(String suffix) { return startsWith(suffix, value.length - suffix.value.length); } //是否含有CharSequence这个子类元素,通常用于StrngBuffer,StringBuilder public boolean contains(CharSequence s) { return indexOf(s.toString()) > -1; }
(6)hashCode
String 类重写了 hashCode 方法,Object 中的 hashCode 方法是一个 Native 调用。String 类的 hash 采用多项式计算得来,我们完全可以通过不相同的字符串得出同样的 hash,所以两个 String 对象的 hashCode 相同,并不代表两个 String 是一样的。
public int hashCode() { //hash是成员变量,所以默认为0 int h = hash; 如果hash为0,且字符串对象长度大于0,不为"" if (h == 0 && value.length > 0) { //获取当前对象的value char val[] = value; // 通过算法s[0]31^(n-1) + s[1]31^(n-2) + ... + s[n-1]计算hash值 for (int i = 0; i < value.length; i++) { //每次都是31 * 每次循环获得的h +第i个字符的ASSIC码 h = 31 * h + val[i]; } hash = h; } return h; }
(7)查询索引——indexOf、lastIndexOf
public int indexOf(int ch, int fromIndex) { final int max = value.length; if (fromIndex < 0) { fromIndex = 0; } else if (fromIndex >= max) { // Note: fromIndex might be near -1>>>1. return -1; } 一个char占用两个字节,如果ch小于2的16次方(65536),绝大多数字符都在此范围内 if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) { // handle most cases here (ch is a BMP code point or a // negative value (invalid code point)) final char[] value = this.value; //从 fromIndex位置起遍历value数组 for (int i = fromIndex; i < max; i++) { //存在相等的字符,返回第一次出现该字符的索引位置,并终止循环 if (value[i] == ch) { return i; } } return -1; } else { return indexOfSupplementary(ch, fromIndex); } } public int indexOf(int ch) { return indexOf(ch, 0);//从第一个字符开始搜索 } static int indexOf(char[] source, int sourceOffset, int sourceCount, String target, int fromIndex) { return indexOf(source, sourceOffset, sourceCount, target.value, 0, target.value.length,fromIndex); } public int indexOf(String str, int fromIndex) { return indexOf(value, 0, value.length, str.value, 0, str.value.length, fromIndex); } public int indexOf(String str) { return indexOf(str, 0); } public int lastIndexOf(int ch) { return lastIndexOf(ch, value.length - 1); } public int lastIndexOf(int ch, int fromIndex) { if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) { // handle most cases here (ch is a BMP code point or a // negative value (invalid code point)) final char[] value = this.value; int i = Math.min(fromIndex, value.length - 1); for (; i >= 0; i--) { if (value[i] == ch) { return i; } } return -1; } else { return lastIndexOfSupplementary(ch, fromIndex); } }
(8)获取子串
public String substring(int beginIndex) { if (beginIndex < 0) { throw new StringIndexOutOfBoundsException(beginIndex); } int subLen = value.length - beginIndex; if (subLen < 0) { throw new StringIndexOutOfBoundsException(subLen); } //利用构造函数生成新的String对象 return (beginIndex == 0) ? this : new String(value, beginIndex, subLen); } public String substring(int beginIndex, int endIndex) { if (beginIndex < 0) { throw new StringIndexOutOfBoundsException(beginIndex); } if (endIndex > value.length) { throw new StringIndexOutOfBoundsException(endIndex); } int subLen = endIndex - beginIndex; if (subLen < 0) { throw new StringIndexOutOfBoundsException(subLen); } return ((beginIndex == 0) && (endIndex == value.length)) ? this : new String(value, beginIndex, subLen); }
(9)拼接——concat、join
public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } //获得当前String对象的长度 int len = value.length; //将数组扩容,将value数组拷贝到buf数组中,长度为len + str.lenght char buf[] = Arrays.copyOf(value, len + otherLen); //然后将str字符串从buf字符数组的len位置开始覆盖,得到一个完整的buf字符数组 str.getChars(buf, len); //生成新的Strintg对象 return new String(buf, true); } public static String join(CharSequence delimiter, CharSequence... elements) { Objects.requireNonNull(delimiter); Objects.requireNonNull(elements); // Number of elements not likely worth Arrays.stream overhead. StringJoiner joiner = new StringJoiner(delimiter); for (CharSequence cs: elements) { joiner.add(cs); } return joiner.toString(); }
(10)替换——replace、replaceAll
//替换,将字符串中的oldChar字符全部替换成newChar public String replace(char oldChar, char newChar) { if (oldChar != newChar) { int len = value.length; int i = -1; char[] val = value; //循环len次 while (++i < len) { //找到第一个旧字符,打断循环 if (val[i] == oldChar) { break; } } //如果第一个旧字符的位置小于len if (i < len) { //new一个字符数组,len个长度 char buf[] = new char[len]; for (int j = 0; j < i; j++) { //把旧字符的前面的字符都复制到新字符数组上 buf[j] = val[j]; } //从i位置开始遍历 while (i < len) { char c = val[i]; //发现旧字符就替换,不相关的则直接复制 buf[i] = (c == oldChar) ? newChar : c; i++; } //通过新字符数组buf重构一个新String对象 return new String(buf, true); } } return this; } //当不是正规表达式时,与replace效果一样,都是全体换。如果字符串的正则表达式,则规矩表达式全体替换 public String replaceAll(String regex, String replacement) { return Pattern.compile(regex).matcher(this).replaceAll(replacement); }
replace 方法最开始先找出旧值出现的位置,这样节省了一部分对比的时间。replace(String oldStr,String newStr)方法通过正则表达式来判断。
(11)切割
public String[] split(String regex, int limit) { char ch = 0; if (((regex.value.length == 1 && ".$|()[{^?*+\".indexOf(ch = regex.charAt(0)) == -1) || (regex.length() == 2 && regex.charAt(0) == '\' && (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 && ((ch-'a')|('z'-ch)) < 0 && ((ch-'A')|('Z'-ch)) < 0)) && (ch < Character.MIN_HIGH_SURROGATE || ch > Character.MAX_LOW_SURROGATE)) { int off = 0; int next = 0; //大于0,limited==true,反之limited==false boolean limited = limit > 0; ArrayListlist = new ArrayList<>(); while ((next = indexOf(ch, off)) != -1) { //当参数limit<=0 或者 集合list的长度小于 limit-1 if (!limited || list.size() < limit - 1) { list.add(substring(off, next)); off = next + 1; } else { // last one //判断最后一个list.size() == limit - 1 list.add(substring(off, value.length)); off = value.length; break; } } //如果没有一个能匹配的,返回一个新的字符串,内容和原来的一样 if (off == 0) return new String[]{this}; // 当 limit<=0 时,limited==false,或者集合的长度 小于 limit是,截取添加剩下的字符串 if (!limited || list.size() < limit) list.add(substring(off, value.length)); // 当 limit == 0 时,如果末尾添加的元素为空(长度为0),则集合长度不断减1,直到末尾不为空 int resultSize = list.size(); if (limit == 0) { while (resultSize > 0 && list.get(resultSize - 1).length() == 0) { resultSize--; } } String[] result = new String[resultSize]; return list.subList(0, resultSize).toArray(result); } return Pattern.compile(regex).split(this, limit); } public String[] split(String regex) { return split(regex, 0); }
(12)大小写转换
public String toLowerCase(Locale locale) { if (locale == null) { throw new NullPointerException(); } int firstUpper; final int len = value.length; scan: { for (firstUpper = 0 ; firstUpper < len; ) { char c = value[firstUpper]; //判断字符是否大写 if ((c >= Character.MIN_HIGH_SURROGATE) && (c <= Character.MAX_HIGH_SURROGATE)) { int supplChar = codePointAt(firstUpper); if (supplChar != Character.toLowerCase(supplChar)) { break scan; } firstUpper += Character.charCount(supplChar); } else { if (c != Character.toLowerCase(c)) { break scan; } firstUpper++; } } return this; } char[] result = new char[len]; int resultOffset = 0; System.arraycopy(value, 0, result, 0, firstUpper); String lang = locale.getLanguage(); boolean localeDependent = (lang == "tr" || lang == "az" || lang == "lt"); char[] lowerCharArray; int lowerChar; int srcChar; int srcCount; for (int i = firstUpper; i < len; i += srcCount) { srcChar = (int)value[i]; if ((char)srcChar >= Character.MIN_HIGH_SURROGATE && (char)srcChar <= Character.MAX_HIGH_SURROGATE) { srcChar = codePointAt(i); srcCount = Character.charCount(srcChar); } else { srcCount = 1; } if (localeDependent || srcChar == 'u03A3' || // GREEK CAPITAL LETTER SIGMA srcChar == 'u0130') { // LATIN CAPITAL LETTER I WITH DOT ABOVE lowerChar = ConditionalSpecialCasing.toLowerCaseEx(this, i, locale); } else { lowerChar = Character.toLowerCase(srcChar); } if ((lowerChar == Character.ERROR) || (lowerChar >= Character.MIN_SUPPLEMENTARY_CODE_POINT)) { if (lowerChar == Character.ERROR) { lowerCharArray = ConditionalSpecialCasing.toLowerCaseCharArray(this, i, locale); } else if (srcCount == 2) { resultOffset += Character.toChars(lowerChar, result, i + resultOffset) - srcCount; continue; } else { lowerCharArray = Character.toChars(lowerChar); } int mapLen = lowerCharArray.length; if (mapLen > srcCount) { char[] result2 = new char[result.length + mapLen - srcCount]; System.arraycopy(result, 0, result2, 0, i + resultOffset); result = result2; } for (int x = 0; x < mapLen; ++x) { result[i + resultOffset + x] = lowerCharArray[x]; } resultOffset += (mapLen - srcCount); } else { result[i + resultOffset] = (char)lowerChar; } } return new String(result, 0, len + resultOffset); }
(13)去空格
public String trim() { //代表尾指针,实际是尾指针+1的大小 int len = value.length; //代表头指针 int st = 0; char[] val = value; // 找到字符串前段没有空格的位置:st0) || (len < value.length)) ? substring(st, len) : this; }
(14)字符/字符串转换——toString、toCharArray、valueOf
//返回自己 public String toString() { return this; } public char[] toCharArray() { // Cannot use Arrays.copyOf because of class initialization order issues char result[] = new char[value.length]; System.arraycopy(value, 0, result, 0, value.length); return result; } //将Object转换为字符串 public static String valueOf(Object obj) { return (obj == null) ? "null" : obj.toString(); }
(15)格式化
//JAVA字符串格式化 //新字符串使用本地语言环境,制定字符串格式和参数生成格式化的新字符串。 public static String format(String format, Object... args) { return new Formatter().format(format, args).toString(); } //使用指定的语言环境,制定字符串格式和参数生成格式化的字符串。 public static String format(Locale l, String format, Object... args) { return new Formatter(l).format(format, args).toString(); }
(16)intern()
// 一个本地方法。 // 当调用intern方法时,如果池中已经包含一个与该String确定的字符串相同equals(Object)的字符串,则返回该字符串。否则,将此String对象添加到池中,并返回此对象的引用。 public native String intern();
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)