JVM类加载子系统
类加载子系统
- 类加载器子系统负责从文件系统或者网络中加载Class文件,class文件在文件开头有特定的文件标识。
- ClassLoader
只负责
class文件的加载
,至于它是否可以运行,则由Execution Engine
(执行引擎)决定。 - 加载的类信息存放于一块称为
方法区
的内存空间。除了类的信息外,方法区中还会存放运行时常最池信息,可能还包括字符串字而量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
- class file存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到JVM当中来根据这个文件实例画出n个一模一样的实例。
- class file加载到JVM中,被称为DNA元数据模板,放在
方法区
。 - 在.class文件-> JVM ->最终成为元数据模板,此过程就要一个
运输工具(类装载器Class Loader)
,扮演一个快递员的角色。
类的加载过程通过类加载子系统加载,分为三个过程:加载(Loading),链接(Linking),初始化(Initalization)。
加载-Loading
- 通过一个类的
全限定名
获取定义此类的二进制字节流
(以物理磁盘为例) - 将这个字节流所代表的静态存储结构转化为
方法区
的运行时数据结构 - 在内存中生成一个代表这个类的java. lang.
Class
对象,作为方法区这个类的各种数据的访问入口
加载. class文件的方式
- 从本地系统中直接加载
- 通过网络获取,典型场景: web Applet
- 从zip压缩包中读取,成为日后jar、war格式的基础
- 运行时计算生成,使用最多的是:动态代理技术
- 由其他文件生成,典型场景: JSP应用
- 从专有数据库中提取. class文件,比较少见
- 从加密文件中获取,典型的防Class文件被反编译的保护措施
生成java.lang.Class对象在这个阶段出现
链接-Linking
验证(Verify)
- 目的在于
确保Class文件的字节流中包含信息符合当前虚拟机要求
,保证被加载类的正确性
,不会危害虚拟机自身安全。(虚拟机要求:例如字节码文件以cafebabe
开头等) - 主要包括
四种验证
,文件格式验证,元数据验证,字节码验证,符号引用验证。(验证出错会报VerifyError错误)
查看字节码文件 (我这使用的是vim命令。%!xxd),也可以使用相关工具
准备(Prepare)
- 为类变量分配内存并且设置该类变量的默认初始值。
- 这里
不包含用final修饰的static,
因为final在编译的时候就会分配了,准备阶段会显式初始化;
- 这里不会为
实例变量分配初始化
,类变量会在方法区中,而实例变量是会随着对象一起分配到Java堆中
。
如图该int型变量显示赋值为1,在类加载过程中的链接Linking阶段中,该变量在准备阶段Prepare为该变量分配内存,并且设置该类变量的默认初始值a = 0;
在初始化(Initalization)阶段才会赋值a = 2;
解析(Resolve)
- 将
常量池内
的符号引用转换为直接引用的过程。 - 事实上,
解析操作
往往会伴随着JVM在执行完*初始化*之后再执行
。 - 符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等
。对应常量池中的CONSTANT_ Class_ info、 CONSTANT_ Fieldref_ info、 CONSTANT Methodref_ info等。
初始化-Initialization
- 初始化阶段就是执行
类构造器方法< clinit > ()
的过程。(注意:这个方法和类中定义的构造方法不一样) - 此方法不需定义,
是javac编译器
自动收集类中的所有类变量(静态变量)
的赋值动作和静态代码块
中的语句(也就是static修饰的)合并而来
。Clinit构造器会把显示初始化和构造代码块初始化合并在一起构成构造器方法,如果没有类变量(静态变量)的赋值动作或者是静态代码块语句那么就不会生成这个clinit方法了。还有一点:< init > ()
这个就是默认的构造方法。 - 构造器方法中指令按语句在源文件中出现的
顺序执行
。类成员加载顺序是:父类的静态字段——>父类静态代码块——>子类静态字段——>子类静态代码块——>父类成员变量(非静态字段)——>父类非静态代码块——>父类(无参)构造器——>子类成员变量——>子类非静态代码块——>子类构造器,这里要注意的就是静态字段和静态代码块之间对类(静态)变量的初始化,是按照书写顺序的,并不是按照先字段初始化再代码块初始化
。 - < clinit >()
不同于类的构造器
。(关联: 构造器是虚拟机视角下的< init > ()) - 若该类具有父类,JVM会保证子类的< clinit >()执行前,父类的< clinit >()已经执行完毕。
- 虚拟机必须保证一个类的< clinit >()方法在
多线程下被同步加锁
。
1 | public class ClassInitTest { |
使用Jclasslib
插件查看该类的字节码文件
可以看到该变量一开始赋值为1,后赋值为2。构造器方法中指令按语句在源文件中出现的顺序执行
构造器方法中指令按语句在源文件中出现的顺序执行
。类成员加载顺序是:父类的静态字段——>父类静态代码块——>子类静态字段——>子类静态代码块——>父类成员变量(非静态字段)——>父类非静态代码块——>父类(无参)构造器——>子类成员变量——>子类非静态代码块——>子类构造器,这里要注意的就是静态字段和静态代码块之间对类(静态)变量的初始化,是按照书写顺序的,并不是按照先字段初始化再代码块初始化
。
1 | public class ClassInitTest { |
静态代码块中的int型变量number的值变化为,在链接-Linking阶段中的prepare准备阶段初始化值为0,再在初始-Initializationg阶段顺序执行 number = 20
在number = 10
。
linking之prepare: number = 0 –> initial: 20 –> 10
< clinit >() 不同于类的构造器
。(关联: 构造器是虚拟机视角下的< init > ())
当我们类中没有静态的变量和静态代码块,此时的字节码文件中Methods是没有<clinit>
的。
类的构造器就是字节码中Methods的<init>
可以看见在Methods中的<init>
对a,d变量进行了赋值。
1 | public class ClinitTest { |
若该类具有父类,JVM会保证子类的< clinit >()执行前,父类的< clinit >()已经执行完毕。
虚拟机必须保证一个类的< clinit >()方法在多线程下被同步加锁
。
1 | public class DeadThreadTest { |
资源类DeadThread
中创建了一个静态代码块(保证在该类的< cInit >)中有一个打印语句,后进行无限循环。
接着主函数中两线程分别调用该资源类。查看效果当其中一个线程首先被调用执行后进实例化资源类而输出打印语句。按理来说我们是没有对其进行加锁同步操作的,所以一般情况下当一线程首先对资源类进行实例化后,可能会被另个线程个打断,从而再次输出打印语句。
但是我们从运行结果得知当有一个线程对该类进行实例化输出打印语句而死循环后,是没有被抢占的。也就是该过程是被加锁的。原因就是:虚拟机必须保证一个类的< clinit >()方法在多线程下被同步加锁
。也就是static代码块只被加载一次。
类加载器分类
- JVM支持两种类型的类加载器,分别为
引导类加载器
( Bootstrap ClassLoader它不是java语言编写)和自定义类加载器
(User- Defined ClassLoader) - 从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是Java虚拟机规范却没有这么定义,而是
将所有派生于抽象类ClassLoader的类加载器都划分为自定义类加载器
- 无论类加载器的类型如何划分,
在程序中我们最常见的类加载器始终只有3个
,如下所示:
这里的四者之间的关系是包含关系。不是上层下层,也不是子父类的继承关系。
1 | public class ClassLoaderTest { |
Java的核心类库都是使用引导类加载器进行加载的。
启动类加载器
启动类加载器,又称引导类加载器,Bootstrap Clas sLoader。
- 这个类加载使用
C/C++语言实现
的,并不继承java体系机构的java. lang. ClassLoader,没有父加载器
,嵌自在JVM内部。这个类加载器我们是获取不到的 - 它
用来加载Java的核心库
(JAVA HOME/j re/lib/rt. jar、resources. j ar或sun. boot . class . path路径下的内容) ,用于提供JVM自身需要的类 加载扩展类和应用程序类加载器
,并指定为他们的父类加载器。- 出于安全考虑,
Bootstrap启动类加载器只加载包名为java、javax、sun等开头的类
通过代码查看BootstrapClassLoader能够加载的api的路径。
我们从jre/lib/jsse.jar
包下查看,找到Provider
类,获取它的类加载器。来验证。
类加载器为null,也即就是启动类加载器。
1 | public class ClassLoaderTest1 { |
扩展类加载器
Java语言编写
,由sun . misc . LauncherSExtClassLoader实现。派生于ClassLoader类
父类加载器为启动类加载器
- 从
java. ext.dirs系统属性所指定的目录中加载类库
,或从JDK的安装目录的jre/lib/ext子目录
(扩展目录)下加载类库。如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载。
我们找到jre/lib/ext/sunec.jar
下的CurveDB
使用的是sun.misc.Launcher$ExtClassLoader@7229724f
扩展类加载器
应用程序类加载器
系统类加载器,AppClassLoader
- jaya语言编写,由sun . mi sc . LauncherSAppClassLoader实现
- 派生于ClassLoader类
- 父类加载器为扩展类加载器
- 它负责加载环境变量classpath或系统属性java.class.path 指定路径下的类库
该类加载是程序中默认的类加载器
,一般来说,Java应用的类 都是由它来完成加载- 通过ClassLoader#getSystemClassLoader ()方法可以获取到该类加载器
用户自定义类加载器
在Java的日 常应用程序开发中,类的加载几乎是由上述3种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。
- 为什么要自定义类加载器?
隔离加载类、修改类加载的方式、扩展加载源、防止源码泄漏
实现步骤
- 开发人员可以通过
继承抽象类java. lang. ClassLoader类的方式
, 实现自己的类加载器,以满足一些特殊的需求 - 在JDK1.2之前, 在自定义类加载器时,总会去继承ClassLoader类并重写loadClass()方法,从而实现自定义的类加载类,但是在
JDK1.2之后
已不再建议用户去覆盖loadClass()方法,而是建议把自定义的类加载逻辑写在findClass()方法中
- 在编写自定义类加载器时,如果没有太过于复杂的需求,
可以直接继承URLClassLoader类
,这样就可以避免自己去编写findClass()方法
及其获取字节码流的方式
,使自定义类加载器编写更加简洁。
ClassLoader类
ClassLoader类,它是一个抽象类,其后所有的类加载器都继承自ClassLoader(不包括启动类加载器)
方法名称 | 描述 |
---|---|
getParent() | 返回该类加载器的超类加载器 |
loadClass(String name) | 加载名称为name的类,返回结果为java.lang.Class类的实例 |
findClass(String name) | 查找名称为name的类,返回结果为java.lang.Class类的实例 |
findLoadedClass(String name) | 查找名称为name的已经被加载过的类,返回结果为java.lang.Class类的实例 |
defineClass(String name, byte[] b, int offing len) | 把字节数组b中的内容转换为一个Java类,返回结果为java.lang.Class类的实例 |
resolveClass(Class<?> c) | 连接指定的一个Java类 |
获取ClassLoader的途径
方式一:获取当前类的ClassLoader clazz.getClassLoader()
方式二:获取当前线程上下文的ClassLoaderThread.currentThread().getContextClassLoader()
方式三:获取系统的ClassLoader ClassLoader.getSystemClassLoader()
方式四:获取调用者的ClassLoaderDriverMannger.getCallerClassLoader()
1 | public class ClassLoaderTest2 { |
双亲委派机制
Java虚拟机对class文件采用的是按需加载的方式
,也就是说当需要使用该类时才会将它的class文件加载
到内存生成class对象。而且加载某个类的class文件时,Java虚拟机采用的是双亲委派模式
,即把请求交由父类处理,它是一“种任务委派模式
。
工作原理
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行;|
- 如果父类加载器还存在其父类加)载器,则进一步向上委托,依次递归,请求最终将到达项层的启动类加载器;
- 如果父类加载器可以完成类加载;任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自已去加载,这就是双亲委派模式。
案例,首先我们自己创建一个java.lang
包,在这个包下创建一个String
类。
1 | package java.lang; |
接着我们在别的包下创建一个StringTest
测试类。
实例化一个String
对象,此时是调用的是Java的核心包下的String还是我们自定的String呢?通过运行可以查看,调用的还是Java核心包下的String,该类加载器为启动类加载器,无法获取。
具体过程是首先由系统类加载器Application ClassLoader
向上委托,扩展类加载器Extension ClassLoader
无法加载,向上委托到启动引导类加载器Bootstrap ClassLoader
可以完成对String类的加载,成功返回。
而我们自己的StringTest类则是一路向上委托无法处理,最后由系统类加载器Application ClassLoader
加载。
我们运行一下我们创建的String类
发现报错误: 在类 java.lang.String 中找不到 main 方法
这是因为使用了Bootstarp ClassLoader
加载了Java核心包下的String类,该类中没有main方法。
案例二
在Java应用中存在着很多服务提供者接口(Service Provider Interface,SPI),这些接口允许第三方为它们提供实现,如常见的 SPI 有 JDBC、JNDI等,这些 SPI 的接口属于 Java 核心库,一般存在rt.jar包中,由Bootstrap类加载器加载。而Bootstrap类加载器无法直接加载SPI的实现类,同时由于双亲委派模式的存在,Bootstrap类加载器也无法反向委托AppClassLoader加载器SPI的实现类。在这种情况下,我们就需要一种特殊的类加载器来加载第三方的类库,而线程上下文类加载器
(双亲委派模型的破坏者
)就是很好的选择。
从图可知rt.jar核心包是有Bootstrap类加载器加载的,其内包含SPI核心接口类,由于SPI中的类经常需要调用外部实现类的方法,而jdbc.jar包含外部实现类(jdbc.jar存在于classpath路径)无法通过Bootstrap类加载器加载,因此只能委派线程上下文类加载器把jdbc.jar中的实现类加载到内存以便SPI相关类使用。显然这种线程上下文类加载器的加载方式破坏了“双亲委派模型”,它在执行过程中抛弃双亲委派加载链模式,使程序可以逆向使用类加载器,当然这也使得Java类加载器变得更加灵活。
优势
- 避免类的重复加载
- 保护程序安全,防止核心API被随意篡改(例如:自定义类: java. lang . String, 自定义类: java. lang . String1111
这种方式防止了(有意或无意的)攻击,例如:建了一个java.lang包并自定义一个String类。有了这种双亲委派机制,在加载String类时仍然会加载由jdk提供的String类,不会进行覆盖。如果这个包下创建String1111类那么会抛出java.lang.SecurtyException
异常,不安全的包名。
自定义创建java.lang
KylinStart类。
运行产生异常Exception in thread "main" java.lang.SecurityException: Prohibited package name: java.lang
沙箱安全机制
自定义String类,但是在加载自定义String类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载jdk自带的文件(rt. jar包中java\lang\String . class),报错信息说没有main方法,就是因为加载的是rt. jar包中的String类。这样可以保证对java核心源代码的保护,这就是沙箱安全机制。
在JVM中表示两个class对象是否为同一个类存在两个必要条件
- 类的完整类名必须一致,包括包名。
- 加载这个类的ClassLoader (指ClassLoader实例对象)必须相同。
换句话说,在JVM中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的ClassLoader实例对象不同
,那么这两个类对象也是不相等
的。
对类加载器的引用
JVM必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么JVM会将这个类加载器的一一个引用作为类型信息的一部分保存在方法区中。
当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同
的。
类的主动使用和被动使用
Java程序对类的使用方式分为:主动使用和被动使用。区别在于会不会导致类的初始化。
主动使用,又分为七种情况:
- 创建类的实例
- 访问某个类或接口的静态变量,或者对该静态变量赋值
- 调用类的静态方法
- 反射(比如: Class. forName (“com. kylin. Test”) )
- .初始化一个类的子类
- Java虛拟机启动时被标明为启动类的类
- JDK 7开始提供的动态语言支持: java. lang. invoke . MethodHandle实例的解析结果REF_ getStatic、 REF_ putStatic、REF_ invokeStatic句柄对应的类没有初始化,则初始化。
除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化
。