为什么数组[idx++]+=“a”在Java8中增加一次idx,但在Java9和10中增加两次?

对于一个挑战,一个代号高尔夫球手编写了以下代码

import java.util.*;public class Main {public static void main(String[] args) {int size = 3;String[] array = new String[size];Arrays.fill(array, "");for (int i = 0; i <= 100;) {array[i++ % size] += i + " ";}for (String element: array) {System.out.println(element);}}}

当在Java8中运行这段代码时,我们得到以下结果:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 1002 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 1013 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99

在Java10中运行这段代码时,我们得到以下结果:

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 982 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 1022 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100

使用Java10的编号完全错误。那么这里发生了什么?是Java10的bug吗?

评论的后续跟进:

  • 使用Java9或更高版本编译时出现此问题(我们在Java10中发现它)。在Java8上编译此代码,然后在Java9或任何更高版本(包括Java11早期访问)中运行,会产生预期结果。

  • 这种代码是非标准的,但根据规范是有效的。它是由kevincruijssen高尔夫挑战中的讨论中发现的,因此遇到了奇怪的用例。

  • didierl使用更小、更易于理解的代码简化了问题:

      class Main {public static void main(String[] args) {String[] array = { "" };array[test()] += "a";}static int test() {System.out.println("evaluated");return 0;}}

    在Java8中编译时的结果:

      evaluated

    在Java9和10中编译时的结果:

      evaluatedevaluated
  • 问题似乎仅限于字符串连接和赋值操作符(+=),其表达式的左侧操作数具有副作用,如array[test()]+="a"array[ix++]+="a"test()[index]+="a"test().field+="a"。要启用字符串连接,至少有一个边必须具有类型String。尝试在其他类型或构造上复制此操作失败。

74428 次浏览

这是从JDK 9开始的javac中的bug(它对字符串连接进行了一些更改,我怀疑这是问题的一部分),由#0团队在bugID JDK-8204322下确认。如果您查看该行的相应字节码:

array[i++%size] += i + " ";

它是:

  21: aload_222: iload_323: iinc          3, 126: iload_127: irem28: aload_229: iload_330: iinc          3, 133: iload_134: irem35: aaload36: iload_337: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;42: aastore

其中最后一个aaload是数组的实际负载。然而,部分

  21: aload_2             // load the array reference22: iload_3             // load 'i'23: iinc          3, 1  // increment 'i' (doesn't affect the loaded value)26: iload_1             // load 'size'27: irem                // compute the remainder

它大致对应于表达式array[i++%size](减去实际加载和存储),在那里有两次。这是不正确的,正如规范在jls-15.26.2中所说:

形式为E1 op= E2的复合赋值表达式等价于E1 = (T) ((E1) op (E2)),其中TE1除了#3只评估一次。的类型

因此,对于表达式array[i++%size] += i + " ";,部分array[i++%size]应该只计算一次。但它会计算两次(一次用于加载,一次用于存储)。

是的,这是一个bug。


部分更新:

bug在JDK 11中修复,并被反向移植到JDK 10(这里这里),但从它不再接收公共更新开始没有移植到JDK 9。

Aleksey Shipiev在jbs页面上提到(和@DidierL在这里的评论中):

解决方法:使用-XDstringConcat=inline编译

这将恢复到使用StringBuilder进行连接,并且没有bug。