想了解JDK动态代理和CGLIB的实现原理和细节的同学,看过来, 本文将向你们展示如何从零开始构建构建一个动态代理对象。

ASM字节码操纵框架,可以直接以二进制的形式来来修改已经存在的类或者创建新的类。ASM封装了操作字节码的大部分细节,并提供了非常方便的接口来对字节码进行操作。ASM框架是全功能的,使用ASM字节码框架,可以方便地对类增加成员,修改方法,创建新的类等。关于ASM的学习,可以参考:Learn ASM CoreApi。作为学习ASM框架的第一篇总结,本文的主要内容是使用ASM框架实现一个简单的JDK动态代理和CGLIB代理。

设定代理类和被代理类

被代理类

被代理类非常简单。

public interface CalculatorInterface {
    int add(int i, int j);
    int sub(int i, int j);
}

public class Calculator implements CalculatorInterface {
    public int add(int i, int j) {
        return i + j;
    }

    public int sub(int i, int j) {
        return i - j;
    }
}

代理类目标代码原型

CGLIB版本的代理类如下,直接从Calculator继承。如果是JDK版本的,则改为实现CalculatorInterface即可。
这里简化了,对要拦截的方法的个数写死了(m1,m2),实际在生成字节码的时候并没有写死。
这一份代码,就是我要用字节码方式生成的代码。

public class CalculatorProxy extends Calculator {
    private InvocationHandler handler;
    private Object target
    private Method m1;
    private Method m2;

    public CalculatorProxy(Object o, InvocationHandler h, Method targetMethod1, Method targetMethod2) {
        super();
        target = o;
        handler = h;
        m1 = targetMethod1;
        m2 = targetMethod2;
    }

    @Override
    public int add(final int i, final int j) {
        try {
            return (int)handler.invoke(this, m1, new Object[] {i, j});
        } catch (Throwable throwable) {
            throw new UndeclaredThrowableException(throwable);
        }
    }
}

代理工厂

代理工厂类似JDK的Proxy对象,只需要向代理工厂对象提供被代理对象和一个InvocationHandler即可使用CGLIB的方式来生成代理类,如果要使用JDK的方式来生成代理对象,则需要再额外提供一下待实现接口。使用newProxy方法得到代理对象。

public class AopProxy {
    public AopProxy(Object target, InvocationHandler handler) {
        ...
    }
    public AopProxy(Object target, InvocationHandler handler, Class<?>[] interfaces) {
        ...
    }
    public Object newProxy() throws Exception{
    } 
}

生成代理类

基本指令

使用ASM生成一个类最复杂的地方在于方法体的生成,相当于直接写字节码。生成上文的目标类需要用到如下指令:
这个表格说的指令参数,并不是真正的JVM指令的参数,而是使用ASM框架生成相应字节码时需要传递的参数

指令名称

指令参数说明

指令含义

操作数栈

ILOAD

index: unsigned byte

从局部变量表中加载下标为index的int到操作数栈

无参数出栈,结果入栈

ALOAD

index: unsigned byte

将栈顶的引用写入到局部变量表中下标为index的引用

无参数出栈,结果入栈

ASTORE

index: unsigned byte

从局部变量表中加载下标为index的引用到操作数栈

objectRef 引用 出栈

INVOKESPECIAL

owner: string 类名

name: string 方法名

desc:方法签名

itf:boolean 是否是接口(false)

调用构造器,私有方法,或显示调用父类的方法,静态绑定

objectRef:实例对象 出栈

arg1:第一个参数 出栈

arg...

有返回的话入栈

INVOKEVIRTUAL

owner: string 类名

name: string 方法名

desc:方法签名

itf:boolean 是否是接口(false)

根据对象类型多态调用,动态绑定

objectRef:实例对象 出栈

arg1:第一个参数 出栈

arg...

有返回的话入栈

INVOKEINTERFACE

owner: string 类名

name: string 方法名

desc:方法签名

itf:boolean 是否是接口(true)

根据对象类型多态调用,动态绑定

objectRef:实例对象 出栈

arg1:第一个参数 出栈

arg...

有返回的话入栈

NEW

name: string

构造一个类型为name的对象,分配内存,并完成成员初始化,但是并不调用构造方法

无参数出栈,结果入栈

PUTFIELD

owner: string 类名

name: string 成员名

desc: string 成员类型描述

设置一个field值

objectRef 实例对象 出栈

value 成员的值 出栈

GETFIELD

owner: string 类名

name: string 成员名

desc: string 成员类型描述

读取一个field值

objectRef 实例对象 出栈

value 成员的值 入栈

ANEWARRAY

type: string 类型名称

新建引用类型为type的数组

count:int 数组长度 出栈

arrayref:数组引用 入栈

DUP

无参

复制栈顶的数据

value 栈顶的值 出栈

value 栈顶的值 入栈两次

AASTORE

无参

将引用存入数组指定位置

arrayRef 数组引用 出栈

index 下标 出栈

value 引用 出栈

INVOKEVIRTUAL 和 INVOKEINTERFACE的区别见:链接。如果调用一个方法的时候,能够确定这个方法在方法表中的位置,就调用INVOKEVIRTUAL,如果不能,就调用INVOKEINTERFACE。具体一点来说:如果一个变量的静态类型是接口,就使用INVOKEINTERFACE,如果是类,就使用INVOKEVIRTUAL。

方法调用基本知识

  • 调用一个方法之前,需要确保方法需要的参数都已经加载到操作数栈中。如果是实例方法,需要将隐含的this也加载到栈中。
  • 参数入栈的顺序和参数声明的顺序一致。实际弹出参数时,和声明顺序相反。(后进先出)。

关键代码生成

获取要代理的方法

比较简单,兼容了基于接口和基于类的代理两种场景

private List<Method> getProxyMethods() {
    List<Method> methods = new LinkedList<>();
    List<Class<?>> superClassList = interfaceList;
    if (superClassList.isEmpty()) {  //如果没有指定接口,就代理父类的所有公有方法
        superClassList = Collections.singletonList(targetClass);
    }
    for (final Class<?> aClass : superClassList) {
        methods.addAll(filterObjectMethods(aClass.getMethods())); //将来自Object的方法过滤掉
    }
    return methods;
}

写入类描述

ClassWriter cw = new ClassWriter(ClassWriter.COMPUTE_FRAMES);  //COMPUTE_FRAMES能够帮我们省去很多麻烦
cw.visit(Opcodes.V1_8,                  //字节码版本
        Opcodes.ACC_PUBLIC,            //类是public的
        convertClassName(className),  //类名
        null,                          //类的签名
        getSuperClassName(),          //父类
        getInterfaceNames());          //要实现的接口

写入域

生成如下几个域:target,handler,以及和要拦截的方法个数对应的Method域m1,m2...

public void writeFields(ClassWriter cw, List<Method> methods) {
    int i = 1;
    //为每一个要代理的方法,生成一个Method类型的成员,用于后面保存目标对象的方法
    for (final Method method : methods) {
        cw.visitField(Opcodes.ACC_PRIVATE, "m" + i++, "Ljava/lang/reflect/Method;", null, null).visitEnd();
    }
    //生成一个handler成员,保存回调接口
    cw.visitField(Opcodes.ACC_PRIVATE, "handler",
                  convertClassNameToDesc(InvocationHandler.class.getCanonicalName()),
                  null, null).visitEnd();

    //生成一个target成员,保存被代理对象
    cw.visitField(Opcodes.ACC_PRIVATE, "target",
                  convertClassNameToDesc(Object.class.getCanonicalName()),
                  null, null).visitEnd();
}

写构造方法

1 生成方法签名并调用父类构造方法

MethodVisitor mv =
    cw.visitMethod(Opcodes.ACC_PUBLIC,
                  "<init>",
                  "(Ljava/lang/Object;Ljava/lang/reflect/InvocationHandler;[Ljava/lang/reflect/Method;)V",
                  null, null);
mv.visitVarInsn(Opcodes.ALOAD, 0);  //调用构造方法需要传入隐式参数this
mv.visitMethodInsn(Opcodes.INVOKESPECIAL, convertClassName(superClass.getCanonicalName()), "<init>", "()V",
                  false);

2 初始化target和handler
从局部变量表中加载数据并赋值到各field种即可,构造函数的入参为:target,handler,method[],因此target和handler在局部变量表中的位置是1和2. 使用javap -v -p -l classfile 可以查看相关信息。

//初始化targe
mv.visitVarInsn(Opcodes.ALOAD, 0); //this
mv.visitVarInsn(Opcodes.ALOAD, 1); //局部变量target
mv.visitFieldInsn(Opcodes.PUTFIELD, convertClassName(className), "target",
                  convertClassNameToDesc(Object.class.getCanonicalName()));
//初始化handler
mv.visitVarInsn(Opcodes.ALOAD, 0);//this
mv.visitVarInsn(Opcodes.ALOAD, 2);//局部变量handler
mv.visitFieldInsn(Opcodes.PUTFIELD, convertClassName(className), "handler",
                  convertClassNameToDesc(InvocationHandler.class.getCanonicalName()));

3 初始化method域
构造函数的第三个参数时Method数组,需要将这些值依次保存到多个method域中。

//初始化mi
int i = 1;
for (final Method method : methods) {
    mv.visitVarInsn(Opcodes.ALOAD, 0);  //加载this,为putfield指令做准备
    mv.visitVarInsn(Opcodes.ALOAD, 3); // 加载入参method数组
    mv.visitLdcInsn(i - 1); //将i-1作为常量载入,这个常量和上面的method数组是AALoad质量的操作数,表示要加载数组中某个位置的值
    mv.visitInsn(Opcodes.AALOAD); //aaload指令消耗了上面的两个操作数,并将结果放入到操作数栈顶,这个结果和this将被putfield使用
    mv.visitFieldInsn(Opcodes.PUTFIELD, convertClassName(className), "m" + i,
                      convertClassNameToDesc(Method.class.getCanonicalName()));
    i++;
}

4 完成构造函数

mv.visitInsn(Opcodes.RETURN);  //写入return指令
mv.visitMaxs(1, 1); //计算栈和局部变量的大小,传入的参数会被忽略,因为ClassWriter被设置了COMPUTE_FRAMES,操作数栈大小,局部变量表大小,还有StackMapFrame都会在此时被重新计算。
mv.visitEnd();

写入要代理的方法

写方法构造一个类最复杂的地方,需要非常小心地处理操作数栈,否则很容易出各种奇怪的问题。

private void writeMethods(ClassWriter cw, List<Method> methods) {
    int i = 1;
    for (Method x : methods) {
        writeMethod(cw, x, i++);  //写入方法,i表示是第几个方法,用来和method域对应
    }
}

private void writeMethod(ClassWriter cw, Method method, int i) {
大招都在这里了
}
写入方法描述
String name = method.getName();  //方法名称
String desc = DescHelper.getDesc(method); //方法描述,包含形参列表和返回值类型
Class<?>[] exceptionTypes = method.getExceptionTypes();
List<String> exceptionDescList = new LinkedList<>();
for (final Class<?> exceptionType : exceptionTypes) {
    exceptionDescList.add(DescHelper.getDesc(exceptionType)); //异常声明
}
MethodVisitor mv =
    cw.visitMethod(Opcodes.ACC_PUBLIC, name, desc, null,
                  exceptionDescList.toArray(new String[exceptionDescList.size()])); //写入方法签名
mv.visitCode();
写入方法体

方法体核心代码其实就一句话:

public int add(int i, int j) {
    return (Integer)this.handler.invoke(this, this.m1, new Object[]{i,j});
    ...
}

调用invoke方法,invoke方法需要的参数含handler自己的this引用在内,总共有四个:this,proxy,method,args。这四个参数需要先计算好并放依次入操作数栈之后,才能调用invoke方法。接下来就按照准备这几个参数的顺序来说明怎么生成字节码。

准备参数:this

域handler的引用,其实就是handler.invoke方法需要的this指针。

mv.visitVarInsn(Opcodes.ALOAD, 0);  //加载this参数
mv.visitFieldInsn(Opcodes.GETFIELD,
                  convertClassName(className), //指定field的owner
                  "handler", //指定field的名称
                  convertClassNameToDesc(invocationHandlerClassName)); //指定field的描述

GETFIELD执行完之后,handler的引用会被放到操作数栈顶。此时,invoke方法第一个参数:this准备就绪。

准备参数:proxy

handler.invoke 需要的proxy参数,是指代理对象的引用。有于handler.invoke是在代理对象中执行的代码,因此代理对象就是当前方法的this指针。

mv.visitVarInsn(Opcodes.ALOAD, 0);  //加载this指针。此时,invoke方法的第二个参数:proxy准备就绪。
准备参数:method

生成类的代码是通用的,并不清楚当前是在生成哪一个代理方法,因此需要使用哪个method域取决于入参i。

mv.visitVarInsn(Opcodes.ALOAD, 0);  //加载this,为GETFIELD指令准备操作数栈
mv.visitFieldInsn(Opcodes.GETFIELD,
                  convertClassName(className),  //域的owner
                  "m" + i,  //域的名称
                  convertClassNameToDesc(Method.class.getCanonicalName())); //域的描述

GETFIELD指令执行完成之后,响应的method域就进入操作数栈。此时invoke方法的第三个参数:method准备就绪。

准备参数args

args参数是一个数组,当前上下文int add(i,j)中并不存在,需要手动构造出来。
代码:new Object[]{i,j} 的生成步骤如下:
1 调用new指令

int parameterCount = method.getParameterCount();
mv.visitLdcInsn(parameterCount);  //将数组大小作为常量加载的操作数栈中
mv.visitTypeInsn(Opcodes.ANEWARRAY, convertClassName(Object.class.getCanonicalName()));  //生成数组,栈顶的int参数出栈,数组引用入栈

执行完ANEWARRAY指令之后,数组的引用Arrayref位于栈顶。
2 填入数组值
由于数组元素是Object,对于基本类型需要装箱,装箱之后再加入到数组中

int paramIndex = 0;
for (final Class<?> paramClass : method.getParameterTypes()) {
    mv.visitInsn(Opcodes.DUP); //备份一下栈顶的Arrayref,aastore指令会消耗掉这个参数,aastore指令的第一个操作数
    mv.visitLdcInsn(paramIndex); //aastore 的第二个操作数,数组下标
    mv.visitVarInsn(Opcodes.ILOAD, paramIndex + 1);  //载入局部变量 ,第一次载入i,第二次载入j
    mv.visitMethodInsn(Opcodes.INVOKESTATIC, convertClassName(Integer.class.getCanonicalName())
        , "valueOf", "(I)Ljava/lang/Integer;", false); //装箱,valueOf会消耗到栈顶元素并返回一个Integer对象入栈
    mv.visitInsn(Opcodes.AASTORE);  //装箱操作生成aastore指令的第三个参数 ,数组元素值,之后,就可以进行指令调用了。这个指令会导致操作数栈出栈三次。
    paramIndex++;
}

AASTORE执行完之前,入栈三个操作数,执行完之后,三个操作数出栈,操作数栈不变,Arrayref依然位于栈顶。此时handler.invoke的方法就全部准备就绪了。

调用invoke方法
mv.visitMethodInsn(Opcodes.INVOKEINTERFACE,
                  invocationHandlerClassName,
                  INVOKE, INVOKE_DESC, true);

INVOKEINTERFACE按照invoke方法的参数列表,依次将需要的参数出栈。执行完之后,将结果入栈。根据invoke方法的签名,结果Object类型,是一个引用。

unbox

add方法的返回值是int,invoke方法的返回值是Object,需要unbox才能返回。

mv.visitTypeInsn(Opcodes.CHECKCAST, "java/lang/Integer"); //类型检查
mv.visitMethodInsn(Opcodes.INVOKEVIRTUAL, "java/lang/Integer", "intValue", "()I", false); //调用intValue方法,object引用出栈,结果入栈。
mv.visitInsn(Opcodes.IRETURN);  //返回栈顶的整数
异常处理

由于InvocationHandler的invoke方法抛出Throwable异常,需要捕获,因此,实际生成的add方法,还需要捕获异常。

private void writeMethod(ClassWriter cw, Method method, int i) {
    ...
    mv.visitCode();
    Label begin = new Label(); //方法入口加一个labe 
    mv.visitLabel(begin);
  ...
    Label end = new Label();  //方法出口加一个label
    mv.visitLabel(end);
//加入try catch,并指明捕获的异常类型
    mv.visitTryCatchBlock(begin, end, end, convertClassName(Throwable.class.getCanonicalName()));
    mv.visitVarInsn(Opcodes.ASTORE, 3); //将异常存入到局部变量
//构造UndeclaredThrowableException对象
    mv.visitTypeInsn(Opcodes.NEW, convertClassName(UndeclaredThrowableException.class.getCanonicalName()));
//准备UndeclaredThrowableException构造方法的参数
    mv.visitInsn(Opcodes.DUP);  //准备UndeclaredThrowableException构造器的this参数
    mv.visitVarInsn(Opcodes.ALOAD, 3);//准备UndeclaredThrowableException构造器的undeclaredThrowable参数
    mv.visitMethodInsn(Opcodes.INVOKESPECIAL,
                      convertClassName(UndeclaredThrowableException.class.getCanonicalName()),
                      "<init>",
                      "(Ljava/lang/Throwable;)V", false);
    mv.visitInsn(Opcodes.ATHROW);  抛出UndeclaredThrowableException对象
    mv.visitMaxs(1, 1);
    mv.visitEnd();
}

至此,动态代理类就生成完了。生成的动态代理类如下:

Android asm字节码插桩点击防抖 asm字节码编程_操作数

小结

使用ASM字节码框架生成代码,可以先自己用Java代码写出目标代码,然后转成字节码来查看。也可以使用ASMifer工具来生成ASM代码。

java jdk.internal.org.objectweb.asm.util.ASMifier classfilename

ASMifier很好用,但是它生成的ASM代码,是针对一个给定的类的硬编码,不一定符合业务逻辑,但是非常值得参考。
另外,对于JVM字节码指令有不清楚的地方,可以参考文档:JVM虚拟机指令集