Java 表达式之谜:为什么 index 增加了两次?_java

Code Golf中的一位挑战者在比赛中写了下面这段代码:(译注:Code Golf是一个编程挑战比赛,提交的代码越短越好)


import java.util.*;public class Main {
  public static void main(String[] args) {
    int size = 3;
    String[] array = new String[size];
    Arrays.fill(array, "");
    for(int i = 0; i <= 100; ) {
      array[i++%size] += i + " ";
    }
    for(String element: array) {
      System.out.println(element);
    }
  }}


在Java 8中运行代码,得到结果如下:


1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99


在Java 10中运行代码,得到结果如下:


2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100


在Java 10中编号似乎完全失效了。这中间发生了什么?这是Java 10的bug吗?


来自评论区的讨论:


用Java 9或更高版本编译会出现问题(我们在Java 10中找到了问题)。在Java 8上编译这段代码,然后在Java 9或更高版本(包括Java 11 EA)中运行,可以得到预期结果。


虽然这种代码不标准,但符合Java规范。Kevin Cruijssen在一个Code Golf挑战中发现了这个问题,看起来结果很奇怪。


Didier L发现可以用更短、更容易理解的代码重现该问题:


class Main {
  public static void main(String[] args) {
    String[] array = { "" };
    array[test()] += "a";
  }
  static int test() {
    System.out.println("evaluated");
    return 0;
  }}


用Java 8编译,运行结果:


evaluated


用Java 9和10编译,运行结果


evaluatedevaluated


问题似乎与字符串连接操作和赋值运算符(+=)有关,当作为左操作符时会出现副作用,例如array[test()]+="a"、array[ix++]+="a"、test()[index]+="a"或test().field+="a"。字符串连接要求至少有一边的对象类型为String。其他类型或结构无法复现该错误。


答案


这是JDK 9开始引入的一个javac bug(疑似在字符串拼接过程中进行了修改),已由javac团队确认,bug id  JDK-8204322。查看该行对应的字节码:


array[i++%size] += i + " ";


字节码:


  21: aload_2
  22: iload_3
  23: iinc          3, 1
  26: iload_1
  27: irem
  28: aload_2
  29: iload_3
  30: iinc          3, 1
  33: iload_1
  34: irem
  35: aaload
  36: iload_3
  37: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;
  42: aastore


最后的aaload从数组中实际加载数据。但是,下面这段


  21: aload_2             // load 数组引用
  22: iload_3             // load 'i'
  23: iinc          3, 1  // 'i' 加1  (不影响已加载的数组值)
  26: iload_1             // load 'size'
  27: irem                // 计算余数


基本上能与array[i++%size]表达式对应(去掉实际的load和store),问题是这里出现了两次。按照jls-15.26.2规范中的描述,这是不正确的:


复合表达式E1 op= E2与E1 = (T) ((E1) op (E2))等价,其中T的类型是E1,除了E1应该只执行一次。


因此,表达式array[i++%size] += i + " ";中array[i++%size]应该只计算一次。但是这里会计算两次(load一次,store一次)。


可以确认,这是一个bug。


更新:


该bug已在JDK 11中修复,并且对应更新到JDK 10(但JDK 9不会修复,因为它不再进行public updates)。


Aleksey ShipilevJBS 页面上提到(@DidierL在此进行了评论):


解决方法:使用-XDstringConcat=inline编译。


这样会使用StringBuilder进行字符串连接,不会出现该bug。


原作者:ImportNew/唐尤华
原文链接:Java 表达式之谜:为什么 index 增加了两次?
原出处:公众号

Java 表达式之谜:为什么 index 增加了两次?_java_02