关于问题
我在工作的时候,有一位组员问题一个问题:如果wait()方法不放在同步代码块会怎样?
我马上要开会忙得不可开交,只是回答了一句话:”规定“。
等到有时间了,我仔细回顾下,如果wait()方法不在同步块中,代码的确会抛出IllegalMonitorStateException:
@Test
public void test() {
try {
new Object().wait();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
但是,为毛呢??为毛呢?我也不知道啊,经过一番查阅,我找到了答案。
Lost Wake-Up Problem
事情得从一个多线程编程里面臭名昭著的问题"Lost wake-up problem"说起。
这个问题并不是说只在Java语言中会出现,而是会在所有的多线程环境下出现。
假如我们有两个线程,一个消费者线程,一个生产者线程。生产者线程的任务可以简化成先将count加一,而后唤醒消费者;消费者则是先将count减一,而后在减到0的时候陷入睡眠:
生产者伪代码:
count+1;
notify();
消费者伪代码:
while(count<=0)
wait()
count--
这里面有问题。什么问题呢?
生产者是两个步骤:count+1;
notify();
消费者也是两个步骤:检查count值;
睡眠或者减一;
如果这些步骤混在一起会怎样呢?
比如说,初始的时候count等于0,这个时候消费者检查count的值,发现count小于等于0的条件成立;就在这个时候,发生了上下文切换,生产者进来了,噼噼啪啪一顿操作,把两个步骤都执行完了,也就是发出了通知,准备唤醒一个线程。这个时候消费者刚决定睡觉,还没睡呢,所以这个通知就会被丢掉。紧接着,消费者就睡过去了,消费者成睡美人了。
这就是所谓的lost wake up问题。
尝试解决
问题的根源在于,消费者在检查count到调用wait()之间,count就可能被改掉了。
常见的解决方式是加锁,让消费者和生产者竞争一把锁,竞争到了的,才能够修改count的值。
我这里将两者的两个操作都放进去了同步块中,于是生产者的代码是:
tryLock()
count+1
notify()
releaseLock()
消费者的代码是:
tryLock()
while(count <= 0)
wait()
count-1
releaseLock()
但是这样改后依旧会出现lost wake up问题,而且和无锁的表现是一样的。
最终解决
为了避免出现这种lost wake up问题,在这种模型之下,应该将我们的代码放进去的同步块中。
Java强制我们的wait()/notify()调用必须要在一个同步块中,就是不想让我们在不经意间出现这种lost wake up问题。
不仅仅是这两个方法,包括java.util.concurrent.locks.Condition的await()/signal()也必须要在同步块中:
private ReentrantLock lock = new ReentrantLock();
private Condition condition = lock.newCondition();
@Test
public void test2() {
try {
condition.signal();
} catch (Exception e) {
e.printStackTrace();
}
}
准确的来说,即便是我们自己在实现自己的锁机制的时候,也应该要确保类似于wait()和notify()这种调用,要在同步块内,防止使用者出现lost wake up问题。
Java的这种检测是很严格的。它要求的是,一定要处于锁对象的同步块中。举例来说:
private Object obj = new Object();
private Object anotherObj = new Object();
@Test
public void test3() {
synchronized (obj) {
try {
anotherObj.notify();
} catch (Exception e) {
e.printStackTrace();
}
}
}
这样也是没什么用的。一样出现IllegalMonitorStateException。
提高面试技巧
假如面试官问你这个问题了,你不要一五一十的全部说出来。只需要轻描淡写地说:“这是Java设计者为了避免使用者出现lost wake up问题而搞出来的”,其中的逼格大家自己去体会。