热替换so文件



unity 热更so_unity 热更so


发现nginx的动态模块无法热更新,于是研究了一下相关的问题。


代码准备


reload.c, 启动文件,用来模拟正在运行的程序,不断重建加载so.so文件


#include <dlfcn.h> #include <stdio.h>  typedef void (*F)();  int my_dlopen() {     void* h = dlopen("so.so", RTLD_NOW|RTLD_GLOBAL);     if (!h) {         fprintf(stderr, "%s\n", dlerror());         return 1;     }      F f = (F)dlsym(h, "action");     f();      return 0; }  int main(int argc, char const *argv[]) {     printf("start...\n");      while (1) {         printf("run\n");         if (my_dlopen() != 0) {             return 1;         }         sleep(2);     }      return 0; }


so1.c 模拟其中一个so文件


#include <stdio.h>  void action() {     printf("11111111111111111\n"); }


so2.c 模拟其中另一个so文件,接口相同,打印内容不同


#include <stdio.h>  void action() {     printf("222222222222222222222\n"); }


编译


gcc reload.c -ldl -o reload gcc -fPIC -shared so1.c -o so1.so gcc -fPIC -shared so2.c -o so2.so


注意


所有的实验需要 export LD_LIBRARY_PATH=./


第一次尝试,直接cp替换


先将 so1.so 设置成默认的 so文件


cp so1.so so.so

启动程序, 然后执行 cp so2.so so.so


./reload  start... run 11111111111111111 run 11111111111111111 run 11111111111111111 run 11111111111111111  <-- 执行 cp so2.so so.so run [1]    38314 segmentation fault (core dumped)  ./reload


程序直接崩溃

同时测试了下,rm so.so并不影响执行,但是停止程序再启动显示so.so: cannot open shared object file: No such file or directory


先rm再cp


cp so1.so so.so  ./reload start... run 11111111111111111 run 11111111111111111 run 11111111111111111 run 11111111111111111 run 11111111111111111  <-- rm so.so;cp so2.so so.so run 11111111111111111 run 11111111111111111 run 11111111111111111


结果就是更新无效,猜想还是句柄没关闭的原因。rm的后,程序还指向原来的文件(这个文件外界看不到), cp产生了一个新的文件,程序根本没有理睬这个文件。


dlclose 再加载


在代码中加入 dlclose(h),如下:


int my_dlopen() {     void* h = dlopen("so.so", RTLD_NOW|RTLD_GLOBAL);     if (!h) {         fprintf(stderr, "%s\n", dlerror());         return 1;     }      F f = (F)dlsym(h, "action");     f();      dlclose(h); // <--      return 0; }


这次可以了


./reload start... run 11111111111111111 run 11111111111111111 run 11111111111111111 run 11111111111111111   <-- cp so2.so so.so run 222222222222222222222 run 222222222222222222222 run 222222222222222222222 run 222222222222222222222


说明确实时句柄的问题,这里涉及到linux inode的问题。每个文件都会对应一个inode, 内部都是按照inode来处理的,同一个文件名的不一定是同一个inode。一个文件只有在没有任何引用的时候才被删除,当程序打开一个so文件,这个文件就被引用了,即使外部删除这个文件,程序还是在使用这个so文件,这个文件只有在程序关闭时才被系统回收。cp过来时个全新的文件,只是文件名相同,inode并不相同,其实程序还是用着老的so文件。dlclose恰恰时关闭了这个文件,之后再次按文件名打开就是新的文件。


备注


看了下nginx的代码,貌似先dlopen之后再close旧的handle,这样是无法热更新的,不太清楚处于什么考虑。


The End

My github location

View Source of this website GhostZch.github.io

Commit issues to discuss with me and others