呃,你是不是写Java已经有些年头了?还依稀记得这些吧: 那些年,它还叫做Oak;那些年,OO还是个热门话题;那些年,C++同学们觉得Java是没有出路的;那些年,Applet还风头正劲……


但我打赌下面的这些事中至少有一半你还不知道。这周我们来聊聊这些会让你有些惊讶的Java内部的那些事儿吧。


1. 其实没有受检异常(checked exception)


是的!JVM才不知道这类事情,只有Java语言才会知道。


今天,大家都赞同受检异常是个设计失误,一个Java语言中的设计失误。正如 Bruce Eckel 在布拉格的GeeCON会议上演示的总结中说的, Java之后的其它语言都没有再涉及受检异常了,甚至Java 8的新式流API(Streams API)都不再拥抱受检异常 (以lambda的方式使用IO和JDBC,这个API用起来还是有些痛苦的。)


http://www.geecon.cz/speakers/?id=2


想证明JVM不理会受检异常?试试下面的这段代码:


public class Test {

 

    // 方法没有声明throws

    public static void main(String[] args) {

        doThrow(new SQLException());

    }

 

    static void doThrow(Exception e) {

        Test.<RuntimeException> doThrow0(e);

    }

 

    @SuppressWarnings("unchecked")

    static <E extends Exception>

    void doThrow0(Exception e) throws E {

        throw (E) e;

    }

}


不仅可以编译通过,并且也抛出了SQLException,你甚至都不需要用上Lombok的@SneakyThrows。


更多细节,可以再看看这篇文章,或Stack Overflow上的这个问题


这篇文章

http://blog.jooq.org/2012/09/14/throw-checked-exceptions-like-runtime-exceptions-in-java/


问题

http://stackoverflow.com/q/12580598/521799


2. 可以有只是返回类型不同的重载方法


下面的代码不能编译,是吧?


class Test {

    Object x() { return "abc"; }

    String x() { return "123"; }

}


是的!Java语言不允许一个类里有2个方法是『重载一致』的,而不会关心这2个方法的throws子句或返回类型实际是不同的。


但是等一下!来看看Class.getMethod(String, Class...)方法的Javadoc:


注意,可能在一个类中会有多个匹配的方法,因为尽管Java语言禁止在一个类中多个方法签名相同只是返回类型不同,但是JVM并不禁止。 这让JVM可以更灵活地去实现各种语言特性。比如,可以用桥方法(bridge method)来实现方法的协变返回类型;桥方法和被重载的方法可以有相同的方法签名,但返回类型不同。


嗯,这个说的通。实际上,当写了下面的代码时,就发生了这样的情况:


abstract class Parent<T> {

    abstract T x();

}

 

class Child extends Parent<String> {

    @Override

    String x() { return "abc"; }

}


查看一下Child类所生成的字节码:


// Method descriptor #15 ()Ljava/lang/String;

// Stack: 1, Locals: 1

java.lang.String x();

  0  ldc <String "abc"> [16]

  2  areturn

    Line numbers:

      [pc: 0, line: 7]

    Local variable table:

      [pc: 0, pc: 3] local: this index: 0 type: Child

 

// Method descriptor #18 ()Ljava/lang/Object;

// Stack: 1, Locals: 1

bridge synthetic java.lang.Object x();

  0  aload_0 [this]

  1  invokevirtual Child.x() : java.lang.String [19]

  4  areturn

    Line numbers:

      [pc: 0, line: 1]


在字节码中,T实际上就是Object类型。这很好理解。


合成的桥方法实际上是由编译器生成的,因为在一些调用场景下,Parent.x()方法签名的返回类型期望是Object。 添加泛型而不生成这个桥方法,不可能做到二进制兼容。 所以,让JVM允许这个特性,可以愉快解决这个问题(实际上可以允许协变重载的方法包含有副作用的逻辑)。 聪明不?呵呵~


你是不是想要扎入语言规范和内核看看?可以在这里找到更多有意思的细节。


http://stackoverflow.com/q/442026/521799


3. 所有这些写法都是二维数组!


class Test {

    int[][] a()  { return new int[0][]; }

    int[] b() [] { return new int[0][]; }

    int c() [][] { return new int[0][]; }

}


是的,这是真的。尽管你的人肉解析器不能马上理解上面这些方法的返回类型,但都是一样的!下面的代码也类似:


class Test {

    int[][] a = {{}};

    int[] b[] = {{}};

    int c[][] = {{}};

}


是不是觉得这个很2B?想象一下在上面的代码中使用JSR-308/Java 8的类型注解。 语法糖的数目要爆炸了吧!


@Target(ElementType.TYPE_USE)

@interface Crazy {}

 

class Test {

    @Crazy int[][]  a1 = {{}};

    int @Crazy [][] a2 = {{}};

    int[] @Crazy [] a3 = {{}};

 

    @Crazy int[] b1[]  = {{}};

    int @Crazy [] b2[] = {{}};

    int[] b3 @Crazy [] = {{}};

 

    @Crazy int c1[][]  = {{}};

    int c2 @Crazy [][] = {{}};

    int c3[] @Crazy [] = {{}};

}


类型注解。这个设计引入的诡异在程度上仅仅被它解决问题的能力超过。


或换句话说:


在我4周休假前的最后一个提交里,我写了这样的代码,然后。。。


【译注:然后,亲爱的同事你,就有得火救啦,哼,哼哼,哦哈哈哈哈~】


请找出上面用法合适的使用场景,还是留给你作为一个练习吧。


4. 你没有掌握条件表达式


呃,你认为自己知道什么时候该使用条件表达式?面对现实吧,你还不知道。大部分人会下面的2个代码段是等价的:


Object o1 = true ? new Integer(1) : new Double(2.0);


等同于:


Object o2;

 

if (true)

    o2 = new Integer(1);

else

    o2 = new Double(2.0);


让你失望了。来做个简单的测试吧:


System.out.println(o1);

System.out.println(o2);


打印结果是:


1.0

1


哦!如果『需要』,条件运算符会做数值类型的类型提升,这个『需要』有非常非常非常强的引号。因为,你觉得下面的程序会抛出NullPointerException吗?


Integer i = new Integer(1);

if (i.equals(1))

    i = null;

Double d = new Double(2.0);

Object o = true ? i : d; // NullPointerException!

System.out.println(o);


关于这一条的更多的信息可以在这里找到。


http://blog.jooq.org/2013/10/08/java-auto-unboxing-gotcha-beware/


5. 你没有掌握复合赋值运算符


是不是觉得不服?来看看下面的2行代码:


i += j;

i = i + j;


直觉上认为,2行代码是等价的,对吧?但结果即不是!JLS(Java语言规范)指出:


复合赋值运算符表达式 E1 op= E2 等价于 E1 = (T)((E1) op (E2)) 其中T是E1的类型,但E1只会被求值一次。


这个做法太漂亮了,请允许我引用Peter Lawrey在Stack Overflow上的回答


http://stackoverflow.com/a/8710747/521799


使用*=或/=作为例子可以方便说明其中的转型问题:


byte b = 10;

b *= 5.7;

System.out.println(b); // prints 57

 

byte b = 100;

b /= 2.5;

System.out.println(b); // prints 40

 

char ch = '0';

ch *= 1.1;

System.out.println(ch); // prints '4'

 

char ch = 'A';

ch *= 1.5;

System.out.println(ch); // prints 'a'


为什么这个真是太有用了?如果我要在代码中,就地对字符做转型和乘法。然后,你懂的……


6. 随机Integer


这条其实是一个迷题,先不要看解答。看看你能不能自己找出解法。运行下面的代码:


for (int i = 0; i < 10; i++) {

  System.out.println((Integer) i);

}


…… 然后要得到类似下面的输出(每次输出是随机结果):


92

221

45

48

236

183

39

193

33

84


这怎么可能?!


我要剧透了…… 解答走起……


好吧,解答在这里(http://blog.jooq.org/2013/10/17/add-some-entropy-to-your-jvm/), 和用反射覆盖JDK的Integer缓存,然后使用自动打包解包(auto-boxing/auto-unboxing)有关。 同学们请勿模仿!或换句话说,想想会有这样的状况,再说一次:


在我4周休假前的最后一个提交里,我写了这样的代码,然后。。。


【译注:然后,亲爱的同事你,就有得火救啦,哼,哼哼,哦哈哈哈哈~】


7. GOTO


这条是我的最爱。Java是有GOTO的!打上这行代码:


int goto = 1;


结果是:


Test.java:44: error: <identifier> expected

    int goto = 1;

        ^


这是因为goto是个还未使用的关键字,保留了为以后可以用……


但这不是我要说的让你兴奋的内容。让你兴奋的是,你是可以用break、continue和有标签的代码块来实现goto的:


向前跳:


label: {

  // do stuff

  if (check) break label;

  // do more stuff

}


对应的字节码是:


2  iload_1 [check]

3  ifeq 6          // 向前跳

6  ..


向后跳:


label: do {

  // do stuff

  if (check) continue label;

  // do more stuff

  break label;

} while(true);


对应的字节码是:


2  iload_1 [check]

3  ifeq 9

6  goto 2          // 向后跳

9  ..

8. Java是有类型别名的


在别的语言中(比如,Ceylon), 可以方便地定义类型别名:


interface People => Set<Person>;


这样定义的People可以和Set<Person>互换地使用:


People?      p1 = null;

Set<Person>? p2 = p1;

People?      p3 = p2;


在Java中不能在顶级(top level)定义类型别名。但可以在类级别、或方法级别定义。 如果对Integer、Long这样名字不满意,想更短的名字:I和L。很简单:


class Test<I extends Integer> {

    <L extends Long> void x(I i, L l) {

        System.out.println(

            i.intValue() + ", " + 

            l.longValue()

        );

    }

}


上面的代码中,在Test类级别中I是Integer的『别名』,在x方法级别,L是Long的『别名』。可以这样来调用这个方法:


new Test().x(1, 2L);


当然这个用法不严谨。在例子中,Integer、Long都是final类型,结果I和L 效果上是个别名 (大部分情况下是。赋值兼容性只是单向的)。如果用非final类型(比如,Object),还是要使用原来的泛型参数类型。


玩够了这些恶心的小把戏。现在要上干货了!


9. 有些类型的关系是不确定的


好,这条会很稀奇古怪,你先来杯咖啡,再集中精神来看。看看下面的2个类型:


// 一个辅助类。也可以直接使用List

interface Type<T> {}

 

class C implements Type<Type<? super C>> {}

class D<P> implements Type<Type<? super D<D<P>>>> {}


类型C和D是啥意思呢?


这2个类型声明中包含了递归,和java.lang.Enum的声明类似 (但有微妙的不同):


public abstract class Enum<E extends Enum<E>> { ... }


有了上面的类型声明,一个实际的enum实现只是语法糖:


// 这样的声明

enum MyEnum {}

 

// 实际只是下面写法的语法糖:

class MyEnum extends Enum<MyEnum> { ... }


记住上面的这点后,回到我们的2个类型声明上。下面的代码可以编译通过吗?


class Test {

    Type<? super C> c = new C();

    Type<? super D<Byte>> d = new D<Byte>();

}


很难的问题,Ross Tate回答过这个问题。答案实际上是不确定的:


C是Type<? super C>的子类吗?

 

步骤 0) C <?: Type<? super C>

步骤 1) Type<Type<? super C>> <?: Type (继承)

步骤 2) C (检查通配符 ? super C)

步骤 . . . (进入死循环)

然后:


D是Type<? super D<Byte>>的子类吗?

 

步骤 0) D<Byte> <?: Type<? super C<Byte>>

步骤 1) Type<Type<? super D<D<Byte>>>> <?: Type<? super D<Byte>>

步骤 2) D<Byte> <?: Type<? super D<D<Byte>>>

步骤 3) List<List<? super C<C>>> <?: List<? super C<C>>

步骤 4) D<D<Byte>> <?: Type<? super D<D<Byte>>>

步骤 . . . (进入永远的展开中)


试着在你的Eclipse中编译上面的代码,会Crash!(别担心,我已经提交了一个Bug。)


我们继续深挖下去……


在Java中有些类型的关系是不确定的!


如果你有兴趣知道更多古怪Java行为的细节,可以读一下Ross Tate的论文『驯服Java类型系统的通配符』 (由Ross Tate、Alan Leung和Sorin Lerner合著),或者也可以看看我们在子类型多态和泛型多态的关联方面的思索


『驯服Java类型系统的通配符』

http://www.cs.cornell.edu/~ross/publications/tamewild/tamewild-tate-pldi11.pdf


子类型多态和泛型多态的关联方面的思索

http://blog.jooq.org/2013/06/28/the-dangers-of-correlating-subtype-polymorphism-with-generic-polymorphism/


10. 类型交集(Type intersections)


Java有个很古怪的特性叫类型交集。你可以声明一个(泛型)类型,这个类型是2个类型的交集。比如:


class Test<T extends Serializable & Cloneable> {

}


绑定到类Test的实例上的泛型类型参数T必须同时实现Serializable和Cloneable。比如,String不能做绑定,但Date可以:


// 编译不通过!

Test<String> s = null;

 

// 编译通过

Test<Date> d = null;


Java 8保留了这个特性,你可以转型成临时的类型交集。这有什么用? 几乎没有一点用,但如果你想强转一个lambda表达式成这样的一个类型,就没有其它的方法了。 假定你在方法上有了这个蛋疼的类型限制:


<T extends Runnable & Serializable> void execute(T t) {}


你想一个Runnable同时也是个Serializable,这样你可能在另外的地方执行它并通过网络发送它。lambda和序列化都有点古怪。


lambda是可以序列化的:


如果lambda表达式的目标类型和它捕获的参数(captured arguments)是可以序列化的,则这个lambda表达式是可序列化的。


但即使满足这个条件,lambda表达式并没有自动实现Serializable这个标记接口(marker interface)。 为了强制成为这个类型,就必须使用转型。但如果只转型成Serializable …


execute((Serializable) (() -> {}));


… 则这个lambda表达式不再是一个Runnable。


呃……


So……


同时转型成2个类型:


execute((Runnable & Serializable) (() -> {}));


结论


一般我只对SQL会说这样的话,但是时候用下面的话来结束这篇文章了:


Java中包含的诡异在程度上仅仅被它解决问题的能力超过。