Java Bean Memory

Introduction

Java Object Structure

一个Java对象在Heap的表示,可以分为三部分:

  • Object Header
  • Class Pointer
  • Fields

每个普通Java对象在堆(heap)中都有一个头信息(object header),头信息是必不可少的,记录着对象的状态。

  • 32位:hash(25) + age(4) + lock(3) = 32bit
  • 64位:unused(25+1) + hash(31) + age(4) + lock(3) = 64bit

在Java中,一切皆对象;每个类都有一个父类,Class Pointer就是当前对象父类的一个指针,在32位系统中,这个指针为4byte;在64位系统中,如果开启指针压缩(-XX:+UseCompressedOops)或者JVM堆的最大值小于32G,这个指针也是4byte,否则是8byte。

关于字段(Fields),这里指的是类的实例字段;也就是说不包括静态字段,因为这个字段是共享内存的,只会存在一份。

java.lang.Integer

在32位系统上,计算java.lang.Integer对象内存占用。

Object Header和Pointer都是固定的,4 + 4 = 8 byte,数值int占用4 byte,所以总共占用 4 + 4 + 4 = 12byte。此外,Heap的内存分配是按照 8byte 对齐的,因此该对象实际内存占用是 16byte。

Array

在Java中还有一种特殊的对象,数组!这个对象有点特殊,它比其他对象多了一个属性:长度(length)。所以我们计算数组长度的时候,需要额外加上一个长度的字段,即一个int的大小。

1
int[] arr = new int[10];

4(object header) + 4(pointer) + 4(length) + 4*10(10个int大小) = 52byte,由于需要8位对齐,所以最终大小为 56byte。


节约内存原则

尽量使用基本类型,而不是包装类型

一个java.lang.Integer占用 16byte,而一个int占用 4byte,4:1 的比例!也就是说整数类的类型是基本类型内存的4倍!

斟酌字段类型,在满足容量前提下,尽量用小字段

数据库建表的时候字段类型需要仔细推敲,同样JavaBean中的属性字段类型也需要仔细斟酌。不要吝啬使用short,byte,boolean,如果短类型能放下数据,尽量不要使用更长的类型。一个long比一个int才多4byte,但是你要想,如果内存中有100W个long,那就白白浪费了约4MB空间,不要小看这一点点的空间浪费,因为随便一个应用的JVM中,对象都能达到上千万!内存是节省出来的。

如果可能,尽量用数组,少用集合

你知道一个ArrayList集合,如果里面放了10个数字,占用多少内存吗?让我们算算:

ArrayList中有两个字段:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
/**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
* will be expanded to DEFAULT_CAPACITY when the first element is added.
*/
transient Object[] elementData; // non-private to simplify nested class access

/**
* The size of the ArrayList (the number of elements it contains).
*
* @serial
*/
private int size;

Object Header占 4byte,Pointer占 4byte,一个int字段(size)占 4byte,elementData数组本身占 12(4+4+4)byte,数组中10个Integer对象占 10 × 16 = 160byte。所以整个集合空间大小为 4 + 4 + 4 + 12 + 160 = 184byte。

如果我们用int[]代替集合呢,12 + 4 × 10 = 52byte,对其后 56byte。集合跟数组的比例是 184:56,超过3:1。

数组中是可以使用基本类型的,但是集合中只能放包装类型!

如果实在需要使用集合,推荐一个比较节约内存的集合工具,fastutil。这里面包含了JKD集合中绝大部分的实现,而且比较省内存。

Other

以下方法根具体场景的数据有关系,可以根据实际情况进行激进优化节省内存。

  • 时间用long/int表示,不用 Date 或者 String。
  • 短字符串如果能穷举或者转换成ascii表示,可以用long或者int表示。

Reference