多进程DirectFBX11显示的死锁问题

转载时请注明出处和作者
作者 :李先静

多进程的DirectFBX11SDL显示时,有一个固有的死锁问题,其原理如下:

SLAVE进程调用dfb_layer_region_flip_update去刷新屏幕,这个函数最后会调用虚函数UpdateRegion。对于X11SDL显示的情况下,SLAVE只能通过MASTER才能刷新屏幕,SLAVE是调用fusion_call_executeMASTER刷新屏幕的。这下问题来了:调用fusion_call_execute之前SLAVE可能已经锁住了窗口栈和要更新的RegionMASTER收到调用请求后,又去锁定窗口栈和要更新的Region,结果是SLAVEMASTER执行刷新操作,而MASTER在等SLAVE锁定的锁。

这个死锁问题已经存在好几年了,在最新的DirectFB-1.1.1中仍然存在。很难给这个问题找一个完美的解决方案,不过考虑到在X11/SDL上显示主要是为了开发调试方便,加上手机应用的特殊性(一般只有一个窗口上前)我们可以接受一个有缺陷但实用的解决方案,我做了下列尝试,效果还可以:

修改函数dfb_layer_region_flip_update:

调用 UpdateRegion 之前先解锁:

多进程DirectFB用X11显示的死锁问题_layer#ifdef LINUX_I386
多进程DirectFB用X11显示的死锁问题_layer
多进程DirectFB用X11显示的死锁问题_layerint i = 0;
多进程DirectFB用X11显示的死锁问题_layerint pid = getpid();
多进程DirectFB用X11显示的死锁问题_layerint lock_pid = 0;
多进程DirectFB用X11显示的死锁问题_layerint lock_count = 0;
多进程DirectFB用X11显示的死锁问题_layer
多进程DirectFB用X11显示的死锁问题_layerfusion_skirmish_lock_pid(&region->context->lock, &lock_pid);
多进程DirectFB用X11显示的死锁问题_layerif(pid == lock_pid)
多进程DirectFB用X11显示的死锁问题_layer
多进程DirectFB用X11显示的死锁问题_手机_11多进程DirectFB用X11显示的死锁问题_多线程_12...{
多进程DirectFB用X11显示的死锁问题_layer_13    fusion_skirmish_lock_count(&region->context->lock, &lock_count);
多进程DirectFB用X11显示的死锁问题_layer_13
多进程DirectFB用X11显示的死锁问题_layer_13    for(i = 0; i < lock_count; i++)
多进程DirectFB用X11显示的死锁问题_layer_13
多进程DirectFB用X11显示的死锁问题_layer_17多进程DirectFB用X11显示的死锁问题_多线程_18    ...{
多进程DirectFB用X11显示的死锁问题_layer_13        dfb_layer_context_unlock(region->context);
多进程DirectFB用X11显示的死锁问题_layer_20    }
多进程DirectFB用X11显示的死锁问题_layer_13
多进程DirectFB用X11显示的死锁问题_编程_22}
多进程DirectFB用X11显示的死锁问题_layer
多进程DirectFB用X11显示的死锁问题_layerdfb_layer_region_unlock( region );
多进程DirectFB用X11显示的死锁问题_layer
多进程DirectFB用X11显示的死锁问题_layer#endif
多进程DirectFB用X11显示的死锁问题_layer

调用UpdateRegion之后再加锁:

 

 

多进程DirectFB用X11显示的死锁问题_layer#ifdef LINUX_I386
多进程DirectFB用X11显示的死锁问题_layerif(pid == lock_pid)
多进程DirectFB用X11显示的死锁问题_手机_11多进程DirectFB用X11显示的死锁问题_多线程_12...{
多进程DirectFB用X11显示的死锁问题_layer_13    for(i = 0; i < lock_count; i++)
多进程DirectFB用X11显示的死锁问题_layer_17多进程DirectFB用X11显示的死锁问题_多线程_18    ...{
多进程DirectFB用X11显示的死锁问题_layer_13        dfb_layer_context_lock(region->context);
多进程DirectFB用X11显示的死锁问题_layer_20    }
多进程DirectFB用X11显示的死锁问题_编程_22}
多进程DirectFB用X11显示的死锁问题_layerdfb_layer_region_lock( region );
多进程DirectFB用X11显示的死锁问题_layer#endif 

 

 

fusion_skirmish_lock_pid是新加的函数(要修改fusion),用于获取加锁进程的PID,只有是当前进程加的锁才解锁。这样修改之后,一个原子变成两个原子了,违背了设计者初衷。但根据代码的上下文和手机应用的特殊性(只显示一个窗口)来看,这样修改造成问题的可能性很小。

另外,SLAVE里面除了GUI线程更新窗口外,fusion线程可能会更新光标,为了避免SLAVE多线程同时刷新屏幕,再修改一下IDirectFBWindow_React,注释掉下面两行代码:

 

多进程DirectFB用X11显示的死锁问题_layer    dfb_windowstack_cursor_set_shape( data->window->stack,
多进程DirectFB用X11显示的死锁问题_layer    shape_data->surface,
多进程DirectFB用X11显示的死锁问题_layer    data->cursor.hot_x,
多进程DirectFB用X11显示的死锁问题_layer    data->cursor.hot_y );
多进程DirectFB用X11显示的死锁问题_layer    dfb_windowstack_cursor_set_opacity( data->window->stack, 0xff );

 

 

这个修改的副作用是窗口光标的形状不会及时改变,对功能没有什么影响。

~~end~~