写一个frida通杀脚本

原创

Hello_wshuo 2022-01-30 00:16:00 ©著作权

文章标签 java sqlite 数据 文章分类 运维

©著作权归作者所有：来自51CTO博客作者Hello_wshuo的原创作品，请联系作者获取转载授权，否则将追究法律责任

1. 前言

过年对我来说和平常没什么区别，该干什么干什么。

之前没接触过 frida 这个工具，前几天用了一些时间学习了一下，相比于 xposed hook 框架，frida 相对于调试方面真的很方便。现在网上也有一些 frida 通杀脚本（也有叫自吐算法脚本的），但是一般都是在 iv向量构造，key 构造分别进行 hook ，这样就导致最后输出结果不是一个整体，加密和解密的数据，iv向量，key，输出不在同一块。我也不想从网上拿来就用（总感觉自己写一遍用起来才舒服，毕竟这个不算太复杂，还能熟悉一下 frida），所以我想制作一个输出以上信息在同一块算法通杀脚本，后面也用C++ Qt写了一个软件用来查看记录的数据。

2. 什么是hook？

这个问题让我想起我在大学期间，当时我用 Linux mint 系统，linux 系统上没有 QQ，所以我用 deepin-wine封装的QQ软件。但是使用过程中我发现有一个bug，就是不能打开接收到文件或文件夹，我当时猜测这个问题是 mint 没有对应的文件管理器导致的，因为我用的是mint，而软件使用的系统是在 deepin 上使用的，所以我在 mint系统上建立了一个与 deepin系统上的文件管理器同名的命令脚本，然后这个命令脚本去调用 mint 本地文件管理器去打开对应的文件夹或文件，这样问题就解决了。

当年文章

这个原理就类似 hook，只不过我没有拦截消息的传递（因为压根就没有接收消息的命令）。通俗来讲就是拦截住消息传递，然后再去处理这个消息。当时我解决 deepin-wine QQ上这个bug，感觉自己这个操作太秀了，现在想想不过是当时自己了解的东西太少，是一种无知的体现。

3. 通杀算法（自吐算法）脚本原理

安卓上调用 AES 加密解密， MD5 摘要算法时，都是需要调用基础的一个类，所以只要 hook 这个基础类，那么无论在什么时候什么地方调用到算法，都会执行到基础类。除非是app 里面自己实现的加密算法，那就只能分析 app 内部的代码了。

例如一个AES加密的调用示例：

public static byte[] aes_enc(byte[] bytesContent, String key) throws Exception
{
    byte[] raw = key.getBytes("utf-8");
    SecretKeySpec skeySpec = new SecretKeySpec(raw, "AES");
    Cipher cipher = Cipher.getInstance("AES/ECB/PKCS5Padding");
    cipher.init(Cipher.ENCRYPT_MODE, skeySpec);
    byte[] enc = cipher.doFinal(bytesContent);
    return enc;
}

可以看到这里有一个关键类 Cipher ，只需 hook doFinal()这个函数，就可以获得密文和明文，而秘钥可以通过 hook SecretKeySpec() 这个类构造函数来获得。

这些类的实现都在 jce.jar 中实现，在 JDK中有。

Cipher 类：

写一个frida通杀脚本_数据

SecretKeySpec 类

写一个frida通杀脚本_数据_02

4. 分析

在 hook 这些类的构造函数或普通函数的时候，遇到了很多重载，下面简单理出这些重载的调用关系。

Cipher 类

// getInstance 函数
// 2.overload('java.lang.String', 'java.lang.String') -> 3
// 1.overload('java.lang.String') |
// 3.overload('java.lang.String', 'java.security.Provider') |


// init 函数
// 1.overload('int', 'java.security.Key') -> 4
// 2.overload('int', 'java.security.cert.Certificate') -> 6
// 3.overload('int', 'java.security.Key', 'java.security.AlgorithmParameters') -> 7
// 5.overload('int', 'java.security.Key', 'java.security.spec.AlgorithmParameterSpec') ->8
// 6.overload('int', 'java.security.cert.Certificate', 'java.security.SecureRandom') |
// 4.overload('int', 'java.security.Key', 'java.security.SecureRandom') |
// 7.overload('int', 'java.security.Key', 'java.security.AlgorithmParameters', 'java.security.SecureRandom') |
// 8.overload('int', 'java.security.Key', 'java.security.spec.AlgorithmParameterSpec', 'java.security.SecureRandom') |

// doFinal 函数
// 1.overload() |
// 2.overload('[B') | 
// 3.overload('java.nio.ByteBuffer', 'java.nio.ByteBuffer') | 
// 4.overload('[B', 'int') |
// 5.overload('[B', 'int', 'int') |
// 6.overload('[B', 'int', 'int', '[B') |
// 7.overload('[B', 'int', 'int', '[B', 'int') |

这里的数字表示重载函数的编号条目， -> 表示调用，| 表示不调用其它重载函数了。通过这种写法，可以清晰的看出重载函数之间的调用关系。

所以为什么需要理清重载关系？因为这样可以知道 hook 哪些函数是必要的。如果我们不知道重载函数之间调用的关系，直接hook 一个函数的所有重载：

var cipher = Java.use("javax.crypto.Cipher");
    // 加密类型
    // 2.overload('java.lang.String', 'java.lang.String') -> 3
    // 1.overload('java.lang.String') |
    // 3.overload('java.lang.String', 'java.security.Provider') |
    for (let index = 0; index < cipher.getInstance.overloads.length; index++) {
        cipher.getInstance.overloads[index].implementation = function () {
            console.log("类型:" + JSON.stringify(arguments[0]));
            console.log(JSON.stringify(this));
            return this.getInstance.apply(this, arguments);
        }
    }

这样，你可能会发现，输出 类型： 两次，因为 1,2,3 函数都被 hook了，app 可能只是调用了 2 ，而 2 本身有调用了 3。所以就会输出两次，所以针对这个 getInstance 函数，只需要 hook 1，3 重载函数就可以实现对所有调用的监听。

5. 深度分析

上述内容，可以实现对调用函数参数的监听，并且减少了不必要函数的 hook。但是还是不能实现输出数据在一整块地方，加密类型输出和明文，密文可能是分散输出的。而要实现我前言中所述的功能，就必须通过 hook 一个函数来实现，在一个函数内获取秘钥，iv 向量，明文，密文，模式，加密or解密，这些信息，然后输出，其实这种肯定是要利用对象本身来传递的，就是查看对象属性上的绑定。

模式：这里所说的模式，指的是 "AES/ECB/PKCS5Padding" 字符串，所以从 getInstance 函数开始分析，当然这里只需要分析肯定会被调用到的函数重载，也就是结尾带|的函数：

写一个frida通杀脚本_sqlite_03

写一个frida通杀脚本_sqlite_04

可以看到，getInstance 这个函数就是返回了一个 cipher 类的实例化对象，并且这个字符串传递过去，所以进一步跟踪分析其构造函数：

写一个frida通杀脚本_sqlite_05

可以看到这几个构造函数，将 paramString 参数都专递给了 this.transformation，那么这个模式就可以通过 this来获取到了

加密or解密：加密或解密，是 init 函数的第一个参数，所以这里重 init 函数开始分析参数的传递状态，同样也只需要分析肯定能被调用到的函数就可以：

写一个frida通杀脚本_java_06

写一个frida通杀脚本_sqlite_07

写一个frida通杀脚本_数据_08

写一个frida通杀脚本_java_09

这4个重载函数都是 paramInt函数都是传递给 this.opmode。

IV向量，这个有点难找，具体过程不多说了，可以通过 this.spi.engineGetIV() 或者 this.getIV() 获得，其实this.getIV() 也是调用 this.spi.engineGetIV()获得的。

密文和明文：因为我要hook 一个函数，所以我想hook的就是最后的 doFinal 函数，这样就可以获取到密文和明文了，然后再通过 this ，获取到上述所说的模式，加密或解密，iv向量。

秘钥：只有这个参数是我没有通过 this 获取到，所以我 hook 了init 函数，其第二个参数就是秘钥。

6. 问题及解决

因为除了秘钥我都可以通过 this 来获取到，所以秘钥获得后我在 JS 用一个全局变量来保存，然后在我hook 的 doFinal 函数中进行输出，但是这里就遇到一个问题，多个线程可能同时进行加密解密，key 可能不是当时对象 doFinal 函数使用的 key，那么这里我需要对实例化对象的唯一ID 与 key 进行一个绑定，然后 doFinal 函数里通过对象唯一ID 来获取key ，进行输出。

这里的解决方案是我制作了一个字典（python 叫字典，js叫啥我忘了），其中键为对象的唯一ID，值为秘钥。这就能保证其对应关系的准确性了。

7. python 调用及数据保存

hookCalc.js

var allKeys = {};

Java.perform(function () {
    var cipher = Java.use("javax.crypto.Cipher");

    for (let index = 0; index < cipher.init.overloads.length; index++) {
        cipher.init.overloads[index].implementation = function () {
            allKeys[this.toString()] = arguments[1].getEncoded();
            this.init.apply(this, arguments);
        }
    }

    for (let index = 0; index < cipher.doFinal.overloads.length; index++) {
        cipher.doFinal.overloads[index].implementation = function () {
            var dict = {};
            dict["EorD"] = this.opmode.value; //模式 加密解密
            dict["method"] = this.transformation.value; //加密类型
            var iv =  this.spi.value.engineGetIV();
            if (iv){
                dict["iv"] = iv;
            }else{
                dict["iv"] = "";
            }
            if (allKeys[this.toString()]){
                dict["password"] = allKeys[this.toString()]
            }else{
                dict["password"] = "";
            }
            var retVal = this.doFinal.apply(this, arguments);
            dict["receData"] = "";
            dict["resData"] = "";
            if (arguments.length >= 1 && arguments[0].$className != "java.nio.ByteBuffer") {
                dict['receData'] = arguments[0];
                dict["resData"] = retVal;
            }
            send(dict);
            return retVal;
        }
    }
})

main.py

import frida
import sys
import sqlite3 
import hashlib

 
index = 0
db = "me.db"

def md5(data):
    hl = hashlib.md5()
    hl.update(data)
    return hl.hexdigest()

def createDB():
    sql = '''
    CREATE TABLE IF NOT EXISTS "record" (
        "id"    TEXT NOT NULL,
        "method"    INTEGER,
        "EorD"  TEXT,
        "password"  BLOB,
        "iv"    BLOB,
        "receData"  BLOB,
        "resData"   BLOB,
        PRIMARY KEY("id")
    );
    '''
    conn = sqlite3.connect(db)
    cursor = conn.cursor()
    cursor.execute(sql)
    conn.commit()
    conn.close()

def message(message,arg2):
    try:
        global index
        conn = sqlite3.connect(db)
        cursor = conn.cursor()

        if message['type'] == "send":
            data = message['payload']
            method = data["method"]
            EorD = data["EorD"]
            password = bytes([i if i>=0 else 256+i for i in  data["password"]])
            iv =  bytes([i if i>=0 else 256+i for i in   data["iv"]])
            receData =  bytes([i if i>=0 else 256+i for i in  data["receData"]])
            resData =  bytes([i if i>=0 else 256+i for i in  data["resData"]])
            id_md5 = md5((method+str(EorD)).encode()+password+iv+receData+resData)
            
            sql = "insert into record(id,method,EorD,password,iv,receData,resData) values (?,?,?,?,?,?,?)"
            cursor.execute(sql,(id_md5,method,EorD,sqlite3.Binary(password),sqlite3.Binary(iv),sqlite3.Binary(receData),sqlite3.Binary(resData)))
            conn.commit()
            print(index)
            index += 1
    except Exception as e:
        print(e)
        pass

with open("hookCalc.js",encoding='utf8') as f:
    js = f.read()

process = frida.get_remote_device().attach("APP名字，非包名")
script = process.create_script(js)
script.on("message",message)
script.load()
createDB()
print(process)
sys.stdin.read()