Code Golf中的一位挑战者在比赛中写了下面这段代码:(译注:Code Golf是一个编程挑战比赛,提交的代码越短越好)
import java.util.*;public class Main { public static void main(String[] args) { int size = 3; String[] array = new String[size]; Arrays.fill(array, ""); for(int i = 0; i <= 100; ) { array[i++%size] += i + " "; } for(String element: array) { System.out.println(element); } }}
在Java 8中运行代码,得到结果如下:
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99
在Java 10中运行代码,得到结果如下:
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100
在Java 10中编号似乎完全失效了。这中间发生了什么?这是Java 10的bug吗?
来自评论区的讨论:
用Java 9或更高版本编译会出现问题(我们在Java 10中找到了问题)。在Java 8上编译这段代码,然后在Java 9或更高版本(包括Java 11 EA)中运行,可以得到预期结果。
虽然这种代码不标准,但符合Java规范。Kevin Cruijssen在一个Code Golf挑战中发现了这个问题,看起来结果很奇怪。
Didier L发现可以用更短、更容易理解的代码重现该问题:
class Main { public static void main(String[] args) { String[] array = { "" }; array[test()] += "a"; } static int test() { System.out.println("evaluated"); return 0; }}
用Java 8编译,运行结果:
evaluated
用Java 9和10编译,运行结果
evaluatedevaluated
问题似乎与字符串连接操作和赋值运算符(+=)有关,当作为左操作符时会出现副作用,例如array[test()]+="a"、array[ix++]+="a"、test()[index]+="a"或test().field+="a"。字符串连接要求至少有一边的对象类型为String。其他类型或结构无法复现该错误。
答案
这是JDK 9开始引入的一个javac bug(疑似在字符串拼接过程中进行了修改),已由javac团队确认,bug id JDK-8204322。查看该行对应的字节码:
array[i++%size] += i + " ";
字节码:
21: aload_2 22: iload_3 23: iinc 3, 1 26: iload_1 27: irem 28: aload_2 29: iload_3 30: iinc 3, 1 33: iload_1 34: irem 35: aaload 36: iload_3 37: invokedynamic #5, 0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String; 42: aastore
最后的aaload从数组中实际加载数据。但是,下面这段
21: aload_2 // load 数组引用 22: iload_3 // load 'i' 23: iinc 3, 1 // 'i' 加1 (不影响已加载的数组值) 26: iload_1 // load 'size' 27: irem // 计算余数
基本上能与array[i++%size]表达式对应(去掉实际的load和store),问题是这里出现了两次。按照jls-15.26.2规范中的描述,这是不正确的:
复合表达式E1 op= E2与E1 = (T) ((E1) op (E2))等价,其中T的类型是E1,除了E1应该只执行一次。
因此,表达式array[i++%size] += i + " ";中array[i++%size]应该只计算一次。但是这里会计算两次(load一次,store一次)。
可以确认,这是一个bug。
更新:
该bug已在JDK 11中修复,并且对应更新到JDK 10(但JDK 9不会修复,因为它不再进行public updates)。
Aleksey ShipilevJBS 页面上提到(@DidierL在此进行了评论):
解决方法:使用-XDstringConcat=inline编译。
这样会使用StringBuilder进行字符串连接,不会出现该bug。
原作者:ImportNew/唐尤华
原文链接:Java 表达式之谜:为什么 index 增加了两次?
原出处:公众号