java 字节流生成文件 java生成字节码文件

转载

flybirdfly 2023-10-31 18:19:56

文章标签 java 字节流生成文件 java 工作操作数 文章分类 Java 后端开发

Java字节码（.class文件）的代码解析

Java二进制指令代码以以下格式紧凑排列（opcode占一个字节）：
opcode operand*
除了tableswitch和lookupswitch两条指令中间存在填充字节以外，其他指令都没有填充字节，即使在两条指令之间也没有。因而在读取指令的时候，要根据指令的定义读取。
通过对上面Java指令集的分析可以知道，Java指令集中很大一部分没有操作数，因而对这部分指令，只需要读取一个字节的操作码，将操作码映射成助记符即可。
而对其他带操作数的指令，则需要根据不同类型分析（由于apache中的bcel（Binary Code Engineering Library）对字节码的支持，操作码和助记符的映射可以用com.sun.org.apache.bcel.internal.Constats中提供的映射表数组来完成）。
1. 处理两条特殊的指令tableswitch和lookupswitch指令。
对这两条指令，首先都要去掉填充字符以使defaultbyte1索引号是字对齐的。

private static void make4ByteAlignment(ByteSequence codes) { 
 int usedBytes = codes.getIndex() % 4; 
 int paddingBytes = (usedBytes == 0) ? 0 : 4 - usedBytes; 
 for(int i = 0;i < paddingBytes;i++) { 
 codes.readByte(); 
 } 
}

对tableswitch指令，读取defaultoffset值，最小项的值，最大项的值以及在最小项和最大项之间每一项的offset值。并且将读取到的offset值和当前指令的基地址相加：

int defaultOffset1 = baseOffset + codes.readInt(); 
 builder.append("\tdefault = #" + defaultOffset1); 
 int low = codes.readInt(); 
 int high = codes.readInt(); 
 int npair1 = high - low + 1; 
 builder.append(", npairs = " + npair1 + "\n"); 
 for(int i = low;i <= high;i++) { 
 int match = i; 
 offset = baseOffset + codes.readInt(); 
 builder.append(String.format("\tcase %d : #%d\n", match, offset)); 
 }

对lookupswitch指令，读取defaultoffset值，键值对数值（npairs），以及npairs对的键值对，将得到的offset值和当前指令的基地址相加：

int defaultOffset2 = baseOffset + codes.readInt(); 
 builder.append("\tdefault = #" + defaultOffset2); 
 int npairs2 = codes.readInt(); 
 builder.append(", npairs = " + npairs2 + "\n"); 
 for(int i = 0;i < npairs2;i++) { 
 int match = codes.readInt(); 
 offset = baseOffset + codes.readInt(); 
 builder.append(String.format("\tcase %d : #%d\n", match, offset)); 
 }

2. 所有条件跳转指令都有两个字节的偏移量操作数（if<cond>, if_icmp<cond>, ifnull, ifnonnull, if_acmp<cond>）。无条件跳转指令goto和子例程跳转指令jsr也都是两个字节的偏移量作为操作数。

offset = baseOffset + codes.readShort(); 
builder.append(String.format("\t\t#%d\n", offset));

3. 对宽偏移量的跳转指令goto_w和子例程跳转指令jsr_w的操作数是四个字节的偏移量。

offset = baseOffset + codes.readInt(); 
builder.append(String.format("\t\t#%d\n", offset));

4. wide指令，则继续读取下一条指令，并将wide参数设置为true。

byteCodeToString(codes, pool, verbose, true);

5. 还有一些指令值以一个字节的局部变量索引号作为操作数的，如果有wide修饰，则用两个字节作为操作数，代表局部变量索引号。这样的指令有：aload, iload, fload, lload, dload, astore, istore, fstore, lstore, dstore, ret。

if(wide) { 
 index = codes.readUnsignedShort(); 
} else { 
 index = codes.readUnsignedByte(); 
} 
builder.append(String.format("\t\t%%%d\n", index));

6. iinc指令，以一个字节的局部变量索引号和一个自己的常量作为参数；如果以wide修饰，则该指令的局部变量索引号和常量都占两个字节。

if(wide) { 
 index = codes.readUnsignedShort(); 
 constValue = codes.readShort(); 
 } else { 
 index = codes.readUnsignedByte(); 
 constValue = codes.readByte(); 
 } 
builder.append(String.format("\t\t%d %d\n", index, constValue));

7. 对象操作指令，它们的操作数都是常量池中的索引，长度为两个字节。指向CONSTANT_Class_info类型的结构，这些指令有new, checkcast, instanceof, anewarray。

index = codes.readUnsignedShort(); 
builder.append("\t\t" + pool.getClassInfo(index).toInstructionString(verbose) + "\n");

8. 所有字段操作指令，它们的操作数都是常量池中的索引，长度为两个字节。指向CONSTANT_Fieldref_info类型结构，这些指令有getfield, putfield, getstatic, putstatic。

index = codes.readUnsignedShort(); 
builder.append("\t\t" + pool.getFieldRefInfo(index).toInstructionString(verbose) + "\n");

9. 非接口方法调用指令，也都是以两个字节的索引号作为操作数，指向常量池中的CONSTANT_Methodref_info类型结构，这些指令有invokespecial, invokevirtual, invokestatic。

index = codes.readUnsignedShort(); 
builder.append("\t\t" + pool.getMethodRefInfo(index).toInstructionString(verbose) + "\n");

10. 接口方法调用指令invokeinterface，它有四个字节的操作数，前两个字节为常量池的索引号，指向CONSTANT_InterfaceMethodref_info类型，第三个字节为count，表示参数的字节数，最后一个字节为0值。

index = codes.readUnsignedShort(); 
int nargs = codes.readUnsignedByte(); //Historical, redundant 
builder.append("\t\t" + pool.getInterfaceMethodRefInfo(index).toInstructionString(verbose)); 
builder.append(" : " + nargs + "\n"); 
codes.readUnsignedByte(); //reserved should be zero

11. 基本类型的数组创建指令newarray，它的操作数为一个字节的类型标识。

String type = Constants.TYPE_NAMES[codes.readByte()]; 
builder.append(String.format("\t\t(%s)\n", type));

12. 多维数组的创建指令multianewarray，它有三个字节的操作数，前两个字节为索引号，指向CONSTANT_Class_info类型，表示数组的类型，最后一个字节指定数组的维度。

index = codes.readUnsignedShort(); 
int dimensions = codes.readUnsignedByte(); 
builder.append(String.format("\t\t%s (%d)\n", pool.getClassInfo(index).getName(), dimensions));

13. 常量入栈指令ldc，以一个字节的索引号作为参数，指向CONSTANT_Integer_info、CONSTANT_Float_info、CONSTANT_String_info、CONSTANT_Class_info类型，表示要入栈的常量值（int类型值、float类型值、String引用类型值或对象引用类型值）。

index = codes.readUnsignedByte(); 
builder.append("\t\t" + pool.getPoolItem(index).toInstructionString(verbose) + "\n");

14. 宽索引的常量入栈指令ldc_w，以两个字节的索引号作为参数，指向CONSTANT_Integer_info、CONSTANT_Float_info、CONSTANT_String_info、CONSTANT_Class_info类型，表示要入栈的常量值（int类型值、float类型值、String引用类型值或对象引用类型值）。

index = codes.readUnsignedShort(); 
builder.append("\t\t" + pool.getPoolItem(index).toInstructionString(verbose) + "\n");

15. 宽索引的常量入栈指令ldc2_w，以两个字节的索引号作为参数，指向CONSTANT_Long_info、CONSTANT_Double_info类型，表示要入栈的常量值（long类型值、double类型值）。

index = codes.readUnsignedShort(); 
builder.append("\t\t" + pool.getPoolItem(index).toInstructionString(verbose) + "\n");

16. bipush指令，以一个字节的常量作为操作数。

byte constByte = codes.readByte(); 
builder.append(“\t” + constByte);

17. sipush指令，以两个字节的常量作为操作数。

short constShort = codes.readShort(); 
builder.append(“\t” + constShort);

以上还有一些没有完成的代码，包括字段（方法）的签名和描述符没有解析，有一些解析的格式还需要调整等。不管怎么样，总体的结构就是这样了，其它的都是细节问题，这里不讨论了。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：sehll脚本如何放到java代码里运行 sh脚本执行jar包

下一篇：android 介面視頻裁切视频裁切安卓

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

java 字节流生成文件 java生成字节码文件

java 字节流生成文件 java生成字节码文件

51CTO博客