网站首页 > java教程 正文
从 Java 9 开始,JDK 开始引入了一个叫做 缩小字符串( Compact String)。
在中文语境下,压缩和缩小都是削减的意思,很多时候是可以通用的,但是实际上还是有区别的。
JDK 9 的处理方式是不改变字符串存储使用的 char[] 数组,而是根据字符集来进行处理。
当 String 在创建的时候,如果我们知道这个字符集使用的 LATIN-1 来表示的话,我们就使用一个字节来存储。
如果是中文,或者我们知道不能用 1 个字节来存储的话,我们还是使用 2 个字节来存储,与原来的存储方式保持一致。
换句话说就是尝试用 1 个字节来存储我们可以存储的自己,而不再浪费存储空间。
现在我们需要知道的问题就是,针对 String 的操作是不是会因为这种存储格式的改变而有影响呢,因为我们在数组中存储了 2 个字符集, LATIN-1 和 UTF-16 字符集之间的混合操作是不是会受到改变?
本文章的后续部分就对这种情况进行一些说明和演示,来让我们大致了解这个改进对我们的影响。
针对日常使用 Java 的开发人员来说,这个改变是感觉不到的,至于你使用的比较等操作还是会按照正常的处理方式来处理,对你来说这个是透明的。
Java 9 中的字符串实现
直到现在,我们应该非常明确的了解到 Java 中存储 String 是使用 char[] 来处理的,这个是没有改变的。
首先,我们先定义一个 char[] 数组
private final char[] value;
然后我们再定义一个 byte[] 数组:
private final byte[] value;
定义一个 coder 变量:
private final byte coder;
这个 Code 的变量可以为下面 2 个值:
static final byte LATIN1 = 0;
static final byte UTF16 = 1;
大部分情况下,Stgring 将会对 Coder 进行判断,然后根据值使用不同的实现:
public int indexOf(int ch, int fromIndex) {
return isLatin1()
? StringLatin1.indexOf(value, ch, fromIndex)
: StringUTF16.indexOf(value, ch, fromIndex);
}
private boolean isLatin1() {
return COMPACT_STRINGS && coder == LATIN1;
}
CompactString 在 JVM 中是默认启用的,如果你不想启用,你可以使用下面的参数告诉 JVM 不使用 String 压缩功能:
+XX:-CompactStrings
coder 是如何工作的
在 Java 9 的 String 类实现中,有关字符串的长度是下面的方法来进行计算的:
public int length() {
return value.length >> coder;
}
如果 String 只含有 LATIN-1 字符的话, coder 的值为 0,那么获得 String 字符串长度的方法就直接返回字节数组的的长度,因为你这个数组的长度就是一个自己一个元素。
在另外的一种情况,如果 Stirng 使用了 UTF-16 字符集的话,coder 的值为 1 Java 将会使用数组中存储的元素的字节实际长度来返回,这是因为数组中存储的字符可能是 2 字节的。
需要注意的是,这个修改是针对 String 的内部修改,针对绝大部分开发者来说,所有有关 String 的处理方法都是透明的。
如果你想了解更多 String 有关的内部实现,这个是你值得深入的地方。
猜你喜欢
- 2024-11-18 一个小技巧,Maven 打 Jar 包体积缩小100倍
- 2024-11-18 两天两夜,1M图片优化到100kb
- 2024-11-18 Java 6 压缩字符串(Compressed String)
- 2024-11-18 java实现对rar压缩包的解压
- 2024-11-18 看了就会:多线程下载图片并压缩,多线程下载能提高效率吗?
- 2024-11-18 Java 9 中的字符串(String)压缩的改进
- 2024-11-18 Java压缩算法性能比较
- 2024-11-18 Spire.PDF for Java 9.3.11 优化了压缩图片时内存的占用
- 2024-11-18 Java实现LWZ压缩算法
- 2024-11-18 既然内存不值钱,为什么java还要搞一个压缩指针?
你 发表评论:
欢迎- 最近发表
-
- Java内存溢出紧急处理:10个必知的Linux命令快速定位OOM
- 面试常问的 25+ 个 Linux 命令(linux面试命令大全)
- Java堆外内存溢出紧急处理实战:Linux命令定位与Spring Boot解决
- java开发常用的Linux命令,高频的没你想象的多
- Java 应用 CPU 飙升?8 个 Linux 命令组合拳快速锁定异常线程
- Java 开发者线上问题排查常用的 15 个 Linux 命令
- Java程序员必备的Linux命令:让你的工作效率翻倍
- Java程序员必备的Linux命令全解析
- [超全整理] Java 程序员必备的 100 条 Linux 命令大全
- SAP ABAP资源导航(sap aatp)
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)