By LiAnLab.org / 宋宝华

《Android架构纵横谈之一——软件自愈能力》已经谈地告了一个段落。接下来这个系列二我们谈Android性能方面的考虑。Android系 统组件繁杂,盘根错节,若非在性能上进行充分的考虑,恐怕会慢如蜗牛。Android有独具特色的Dalvik虚拟机,启动过程中即加载许多资源以便子进 程进行继承的Zygote,广泛使用共享内存的AudioFlinger、 SurfaceFlinger、属性服务,应用程序对图形的direct render,简单高效的新增的IPC 方式binder等。我们大概还是分成多回来谈。

今天我们先谈AndroidJava 世界女娲Zygote 的高妙之处,歌颂其在广阔深蓝到处打渔的壮美举动。广大读者仍然可以透过新浪微博“@宋宝华Barry ”进行交流,写技术博客是个非常痛苦的过程,所以无论是板砖的也好,喝彩的也好,欢迎都上来吆喝几声。我这边特别要声明的是,本系列不着眼于谈细小的知识 点,而更多的是谈设计思想上的考虑。

Java世界的“固有领土”

同志们,进程是一个资源封装的单位,所谓进程,就是讲屌丝们的房子、车子, task_struct是Linux  内核里用于描述进程的数据结构,进程就是资源,故task_struct就是封装了一个个的资源以及进程的属性(如pid等 ),它的定义如下:

struct task_struct {

            屌丝名: comm
            屌丝id: pid
            屌丝房子:mm_struct
            屌丝车子:fs_struct
            屌丝工资: signal_struct
            …
            屌丝状态:  睡、干活、僵尸等
}

所以task_struct天生就是针对当今社会而生的,一个结构体把所有你资产全部囊括。

线程是CPU调度的单元,虽然是一套房子 mm_struct、一部车子fs_struct、一个人工资signal_struct等,如果被2个或者多个屌丝所共享(这里就是这些结构体指针指向 完全相同,pthread_create透过clone实现了这个功能),那么这几个屌丝就是同一个进程里面的多个线程了。

Linux中每 个屌丝都是个task_struct,内核并不区分进程和线程,只是通过一个房子挂到2个task_struct的头上来实现线程的。简单地说,您和您老 婆是2个task_struct,但是有个 房产证mm_struct是同一个。但是作为2个线程,厕所(CPU)这个唯一资源还是要轮着来被调度的。

一 般情况下,Linux的进程通过fork诞生,这个时候,子进程的mm_struct指针并不等于父进程的mm_struct,而是重新分配一个 mm_struct内存并让它等于负进程的mm_struct,所以子进程这个时候也share了父进程的资源。关于这个继承,原因很简单,因为几千年前 咱有几个屌丝去那边打过鱼,属于咱们固有的资源。这些继承的资源是只读的,如果要写,就会造成一个“写时拷贝”,内核会为写的进程重新申请1个page并 拷贝老的page,在新的page上再进行写。

一般情况下,子进程被fork出来后,会调用exec()对userspace进行替换,典型地Android的init使用了该模型:

exec() 用一个可执行文件替换当前子进程的用户空间。注意在exec()对userspace替换后,除pid等id信息保留外,0、1、2这3个代表标准输入、 输出、错误输出的fd依然保留原来的含义,这使得我们Android的 init进程可以启动init.rc的service的时候,将0、 1、2重定向到/dev/null,看看 Android的init启动service的过程:

static void zap_stdio(void)
{
    int fd;
    fd = open("/dev/null", O_RDWR);
    dup2(fd, 0);
    dup2(fd, 1);
    dup2(fd, 2);
    close(fd);
}
void service_start(struct service *svc, const char *dynamic_args)
{
    …

    pid = fork();

    if (pid == 0) {
        …
        if (needs_console) {
            …
        } else {
            zap_stdio();
        }
       …
            execve(svc->args[0], (char**) arg_ptrs, (char**) ENV);
        }
}

     可以看出init创建的service都是被fork+exec整出来的,一般情况下,printf的东西就这样没了,因为在exec()前就被 dup到了/dev/null。

      但是 init并非工作在Java的世界,而Java的世界通过Zygote产生。Java程序最终不会如同C/C++ native代码那样可以被编译和连接为一个可执行文件,Java源程序经过编译得到的并非可执行程序而是中间码,由Java虚拟机解释执行,所以没有办 法被exec()。Java的性能下降了,但是,由于没有exec(),却成就了 fork()对资源的继承性,否则,被exec()后,userspace会被整体替换。

      Zygote启动的SystemServer 和apk都只是先 fork,而后寻找到相应目标类的main()函数并执行,这个过程没有exec()。既然如此,在Android的Java世界里,必然存在某些资源是 可能被许多进程所共同需要的,这个机会绝对不会被我天朝的渔民放过,肯定要先去打个渔以便小白兔直接宣传其为“固有领土”,这个过程主要是 preloadClasses和preloadResources。

     要preload的class存放在 frameworks/base/preloaded-classes文件中,这个文件快2000行了,咱天朝几千年前的屌丝真牛b啊,到处打渔,黄岩 岛、钓鱼岛该去的都去了,还有很多礁什么的,也跑了一遭,直接把天朝打成高富帅了:

android.R$styleable
android.accounts.Account
android.accounts.Account$1    
android.accounts.AccountManager 
岛太多,下面省略

     preloadResources则主要加载framework-res.apk中的资源。这2个preload的过程实在很慢啊,你用bootchart观察Android启动过程,可能发现5000年文明史有一半都被Zygote拿去打渔去了:

     有人说,既然preload东东这么慢,严重影响了开机速度,那我们不要preload不就好了吗?

      同志们啊,preload的意义就是先hold住打个渔,fork()子进程都发生在此之后,子进程如果用的时候直接就可以用了。如果这个过程不做的话, 那么就需要每个子进程自己用的时候再去load,那该多耗费多少内存以及多慢呢?祖先们去打渔好处是明显的。其效果如下:

      最后,我们要说的是没了exec(),Java语言对应的进程就失去了一种能力,举个例子,你如果要透过valgrind检查SystemServer的 native层内存泄露、溢出或者某个 apk的native层内存泄露、溢出 ,你不可能敲个命令行叫:valgrind --tool=memcheck --leak-check=full systemserver吧?

      而这样的需求却真实地存在着,于是Jeff Brown jeffbrown@google.com提交了让Android Java程序以exec方式被启动的patch ,这些patch分布于对dalvik_system_Zygote.c、Zygote.java、app_process/app_main.cpp、 RuntimeInit.java,并新增加了一个WrapperInit.java文件,使得我们可以通过exec()的方式启动Java程序,这样我 们在 Java程序启动前插入 wrap(如valgrind)就很easy了,这个过程实际上就是:

    public static void execApplication(String invokeWith, String niceName,
            FileDescriptor pipeFd, String[] args) {
        StringBuilder command = new StringBuilder(invokeWith);
        command.append(" /system/bin/app_process /system/bin --application");
        if (niceName != null) {
            command.append(" '--nice-name=").append(niceName).append("'");
        }
        command.append(" com.android.internal.os.WrapperInit ");
        command.append(pipeFd != null ? IoUtils.getFd(pipeFd) : 0);
        Zygote.appendQuotedShellArgs(command, args);
        Zygote.execShell(command.toString());
    }

其中最关键的就是/system/bin/app_process /system/bin –application,实际上还由app_process 这个可执行文件(可以被exec了)去创建一个运行Java的进程。同志们,Zygote其实就这app_process改名来的。 app_process是正宗的Java class启动者,Zygote可以看作一个马甲。

因此我们可以以这样的方式让valgrind可以跟踪SystemServer:

adb root 
adb shell setprop wrap.system_server "logwrapper valgrind" 
adb shell stop && adb shell start

其实就是把启动SystemServer的过程变成了fork ->exec(/system/bin/app_process /system/bin –applicationlogwrapper valgrind system_server)的过程。

 本回书就说到这里,预知后事如何,请听下回分解。

      谨以本回,献给最可爱的人——中国军人,无论是国军还是共军,愿日后皆以守土卫国为己任,炎黄子孙永不再兵戎相见。

剑外忽传收蓟北,初闻涕泪满衣裳。

却看妻子愁何在,漫卷诗书喜欲狂。

白日放歌须纵酒,青春作伴好还乡。

即从巴峡穿巫峡,便下襄阳向洛阳。

 

——宋宝华