各种加密逻辑

在我们进行js逆向的时候. 总会遇见一些我们人类无法直接能理解的东西出现. 此时你看到的大多数是被加密过的密文.

一. 一切从MD5开始 (Message-Digest Algorithm )

MD5信息摘要算法(英语:MD5 Message-Digest Algorithm)

MD5是一个非常常见的加密逻辑. 其特点就是小巧. 速度快. 极难被破解(王小云女士). 所以, md5依然是国内非常多的互联网公司选择的密码加密算法.

md5的python实现:

from hashlib import md5

obj = md5()
obj.update("alex".encode("utf-8"))
# obj.update("wusir".encode('utf-8'))  # 可以添加多个被加密的内容

bs = obj.hexdigest()
print(bs)

我们把密文丢到网页里. 发现有些网站可以直接解密. 但其实不然. 这里并不是直接解密MD5. 而是"撞库".

就是它网站里存储了大量的MD5的值. 就像这样:

而需要进行查询的时候. 只需要一条select语句就可以查询到了. 这就是传说中的撞库.

如何避免撞库: md5在进行计算的时候可以加盐. 加盐之后. 就很难撞库了.

from hashlib import md5


salt = "我是盐.把我加进去就没人能破解了"
obj = md5(salt.encode("utf-8"))  # 加盐
obj.update("alex".encode("utf-8"))

bs = obj.hexdigest()
print(bs)

扩展; sha256

sha = sha256(b'salt')
sha.update(b'alex')
print(sha.hexdigest())

不论是sha1, sha256, md5都属于摘要算法. 都是在计算hash值. 只是散列的程度不同而已. 这种算法有一个特性. 他们是散列. 不是加密. 而且, 由于hash算法是不可逆的, 所以不存在解密的逻辑.

二. URLEncode和Base64

在我们访问一个url的时候总能看到这样的一种url

https://www.sogou.com/web?query=%E5%90%83%E9%A5%AD%E7%9D%A1%E8%A7%89%E6%89%93%E8%B1%86%E8%B1%86&_asf=www.sogou.com&_ast=&w=01019900&p=40040100&ie=utf8&from=index-nologin&s_from=index&sut=3119&sst0=1630994614300&lkt=0%2C0%2C0&sugsuv=1606978591882752&sugtime=1630994614300

此时会发现, 在浏览器上明明是能看到中文的. 但是一旦复制出来. 或者在抓包工具里看到的. 都是这种%. 那么这个%是什么鬼? 也是加密么?

非也, 其实我们在访问一个url的时候. 浏览器会自动的进行urlencode操作. 会对我们请求的url进行编码. 这种编码规则被称为百分号编码. 是专门为url(统一资源定位符)准备的一套编码规则.

一个url的完整组成:

scheme://host:port/dir/file?p1=v1&p2=v2#anchor

http  ://www.baidu.com/tieba/index.html?name=alex&age=18
    参数: key=value,通过=区分
    服务器可以通过key拿value

此时. 如果参数中出现一些特殊符号. 比如'=' 我想给服务器传递a=b=c这样的参数. 必然会让整个URL产生歧义.

所以, 把url中的参数部分转化成字节. 每字节的再转化成2个16进制的数字. 前面补%.

看着很复杂. 在python里. 直接一步到位

from urllib.parse import urlencode, unquote, quote

# 单独编码字符串
wq = "米饭怎么吃"
print(quote(wq))  # %E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83
print(quote(wq, encoding="gbk")) # %C3%D7%B7%B9%D4%F5%C3%B4%B3%D4

# 多个数据统一进行编码
dic = {
    "wq": "米饭怎么吃",
    "new_wq": "想怎么吃就怎么吃"
}

print(urlencode(dic))  # 只能传字典wq=%E7%B1%B3%E9%A5%AD%E6%80%8E%E4%B9%88%E5%90%83&new_wq=%E6%83%B3%E6%80%8E%E4%B9%88%E5%90%83%E5%B0%B1%E6%80%8E%E4%B9%88%E5%90%83
print(urlencode(dic, encoding="utf-8"))  # 也可以指定字符集

# 一个完整的url编码过程
base_url = "http://www.baidu.com/s?"
params = {
    "wd": "大王"
}

url = base_url + urlencode(params)
print(url)  # http://www.baidu.com/s?wd=%E5%A4%A7%E7%8E%8B

解码

s = "http://www.baidu.com/s?wd=%E5%A4%A7%E7%8E%8B"
print(unquote(s))  # http://www.baidu.com/s?wd=大王

base64其实很容易理解. 通常被加密后的内容是字节. 而我们的密文是用来传输的(不传输谁加密啊). 但是, 在http协议里想要传输字节是很麻烦的一个事儿. 相对应的. 如果传递的是字符串就好控制的多. 此时base64就应运而生了. 26个大写字母+26个小写字母+10个数字+2个特殊符号(+和/)组成了一组类似64进制的计算逻辑. 这就是base64了.
alphabet = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789+/"

import base64

bs = "我要吃饭".encode("utf-8")
# 把字节转化成b64字符串
print(base64.b64encode(bs).decode())

# 把b64字符串转化成字节
s = "5oiR6KaB5ZCD6aWt"
print(base64.b64decode(s).decode("utf-8"))

注意, b64处理后的字符串长度. 一定是4的倍数. 如果在网页上看到有些密文的b64长度不是4的倍数. 会报错

例如,

import base64

s = "ztKwrsTj0b0"
bb = base64.b64decode(s)
print(bb)


此时运行出现以下问题
Traceback (most recent call last):
  File "D:/PycharmProjects/rrrr.py", line 33, in <module>
    bb = base64.b64decode(s)
  File "D:\Python38\lib\base64.py", line 87, in b64decode
    return binascii.a2b_base64(s)
binascii.Error: Incorrect padding

解决思路. base64长度要求. 字符串长度必须是4的倍数. 填充一下即可

import base64

s = "ztKwrsTj0b0"
s += ("=" * (4 - len(s) % 4))
print("填充后", s)
bb = base64.b64decode(s).decode("gbk")
print(bb)

三. 对称加密

所谓对称加密就是加密和解密用的是同一个秘钥. 就好比. 我要给你邮寄一个箱子. 上面怼上锁. 提前我把钥匙给了你一把, 我一把. 那么我在邮寄之前就可以把箱子锁上. 然后快递到你那里. 你用相同的钥匙就可以打开这个箱子.

条件: 加密和解密用的是同一个秘钥. 那么两边就必须同时拥有钥匙才可以.

常见的对称加密: AES, DES, 3DES. 我们这里讨论AES和DES

旧:
 pip install Crypto
最后需要把site-packages中crypto文件夹改成Crypto

新:
 pip install pycryptodome

3.1 AES (Advanced Encryption Standard)

AES 高级加密标准: (Advanced Encryption Standard)

python 中 aes加密,对key的长度有要求吗?

在Python中,AES加密的密钥(key)长度有一定的要求。具体来说,密钥必须是16位字节、24位字节或者32位字节。如果使用16位长度的密钥,被加密的明文长度也必须是16的整数倍。为了处理这种情况,通常会对明文进行填充,如填充\0,然后在解密时将右侧的\0全部去掉。

默认填充模式下,需要填充n个字符,他就填充\x0n,对应ascci码表看。
还会碰到 补0的 zeropadding + \x30
补空白的  nopadding \x00


此外,AES加密算法也支持使用长度为128、192和256位的密钥来处理不同长度的数据块。

总体而言,在选择AES加密的密钥长度时,需要根据实际需求和安全考虑来进行选择。同时,也需要注意不同语言和库对密钥长度的支持可能有所不同。
# AES加密
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad
import base64
"""

key长度
    16: *AES-128*
    24: *AES-192*
    32: *AES-256*
IV长度必须是16为字节 

MODE 加密模式. 
    常见的ECB, CBC
    以下内容来自互联网~~
    ECB:是一种基础的加密方式,密文被分割成分组长度相等的块(不足补齐),然后单独一个个加密,一个个输出组成密文。
    CBC:是一种循环模式,前一个分组的密文和当前分组的明文异或或操作后再加密,这样做的目的是增强破解难度。
    CFB/OFB:实际上是一种反馈模式,目的也是增强破解的难度。
    FCB和CBC的加密结果是不一样的,两者的模式不同,而且CBC会在第一个密码块运算时加入一个初始化向量。
"""
"""
ECB:没有IV
CBC:有IV
"""

aes = AES.new(b"alexissbalexissb", mode=AES.MODE_CBC, IV=b"0102030405060708") # 当你发现网页上的密钥很长很长的时候,尝试截取16/24/32位
data = "我吃饭了"
data_bs = data.encode("utf-8")
# 需要加密的数据必须是16的倍数
# 填充规则: 缺少数据量的个数 * chr(缺少数据量个数)
pad_len = 16 - len(data_bs) % 16
data_bs += (pad_len * chr(pad_len)).encode("utf-8")

#data_bs = pad(data_bs , 16)  # 常规情况下填充的倍数都是16  填充逻辑. 一般是不管的.

bs = aes.encrypt(data_bs)
print(bs)

# 加密后的东西是无法用肉眼看出来它是什么的. 也不能处理成utf-8
#
# 网页上通常都会把这种字节处理成base64 方便数据的传输
#
# base64: 把杂乱无章的字节. 处理成base64字符串
r= base64.b64encode(bs).decode()
print(r)

AES解密

from Crypto.Cipher import AES
from Crypto.Util.Padding import unpad
import base64

aes = AES.new(b"alexissbalexissb", mode=AES.MODE_CBC, IV=b"0102030405060708")
# 密文
bs = b'\xf6z\x0f;G\xdcB,\xccl\xf9\x17qS\x93\x0e'
result = aes.decrypt(bs)  # 解密
#result= unpad(result, 16) # 如果加密时填充了,要先去掉
print(result.decode("utf-8"))

js逆向中遇到的字节数组转为字符串

import struct

# 字节数组转为字符串
def byte_array_to_string(byte_array):
    byte_string = struct.pack('!{}I'.format(len(byte_array)), *byte_array)
    string = byte_string.decode('utf-8')
    return string

def string_to_byte_array(string):
    byte_array = list(struct.unpack('!{}I'.format(len(string) // 4), string.encode('utf-8')))
    return byte_array

byte_array = [1148467306, 964118391, 624314466, 2019968622]

print(byte_array_to_string(byte_array))  # Dt8j9wGw%6HbxfFn
print(string_to_byte_array('Dt8j9wGw%6HbxfFn'))  # [1148467306, 964118391, 624314466, 2019968622]

# console.log(CryptoJS.enc.Utf8.parse('Dt8j9wGw%6HbxfFn')) //  [1148467306, 964118391, 624314466, 2019968622]

两种常用的AES加密处理:

  • AES加密(utf-8字节处理)
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad, unpad
import base64

def aes_encrypt(data_string):
    key_string = "G$$QawckGfaLB97r"
    key = key_string.encode('utf-8')

    iv_string = "7fQDrQcgkbkxSjaS"
    iv = iv_string.encode('utf-8')

    data = data_string.encode("utf-8")

    aes = AES.new(
        key=key,
        mode=AES.MODE_CBC,
        iv=iv
    )
    raw = pad(data, 16)
    bs = aes.encrypt(raw)
    # 处理成base64字符串
    return base64.b64encode(bs).decode()


def aes_decrypt(data_string):
    data = base64.b64decode(data_string)
    key_string = "G$$QawckGfaLB97r"
    key = key_string.encode('utf-8')

    iv_string = "7fQDrQcgkbkxSjaS"
    iv = iv_string.encode('utf-8')

    aes = AES.new(key, mode=AES.MODE_CBC, IV=iv)
    # 解密 如果加密时填充了,要先去掉
    result = unpad(aes.decrypt(data), 16).decode("utf-8")
    return result

print(aes_encrypt('{"query":"爬虫","pageNum":1,"limit":15}'))
print(aes_decrypt(data_string="ZmRA6ugXgsEyimiECL7BVsOm5g8ADjUDTGptY0dgYzYL/VTP7dYpeiBdS5udcZtY"))
  • AES加密(十六进制字节处理)
import binascii

v1 = "4E2918885FD98109869D14E0231A0BF4"

"""
bs = bytearray() # []
for i in range(0, len(v1), 2):
    item_hex = v1[i:i + 2]
    item_int = int(item_hex, base=16)
    bs.append(item_int)
v3 = bytes(bs)
print(v3) # b'N)\x18\x88_\xd9\x81\t\x86\x9d\x14\xe0#\x1a\x0b\xf4'
"""

v3 = binascii.a2b_hex(v1)
print(v3) # b'N)\x18\x88_\xd9\x81\t\x86\x9d\x14\xe0#\x1a\x0b\xf4'
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad
import binascii

def aes_encrypt(data_string):
    key_string = "4E2918885FD98109869D14E0231A0BF4"
    key = binascii.a2b_hex(key_string)

    iv_string = "16B17E519DDD0CE5B79D7A63A4DD801C"
    iv = binascii.a2b_hex(iv_string)

    aes = AES.new(
        key=key,
        mode=AES.MODE_CBC,
        iv=iv
    )
    raw = pad(data_string.encode('utf-8'), 16)
    aes_bytes = aes.encrypt(raw)
    return binascii.b2a_hex(aes_bytes).decode().upper()


data = "|878975262|d000035rirv|1631615607|mg3c3b04ba|1.3.5|ktjwlm89_to920weqpg|4330701|https://w.yangshipin.cn/|mozilla/5.0 (macintosh; ||Mozilla|Netscape|MacIntel|"

result = aes_encrypt(data)
print(result)

3.2 DES (Data Encryption Standard)

DES Data Encryption Standard,即数据加密标准

# DES加密解密

from Crypto.Cipher import DES

# key/iv: 8个字节
des = DES.new(b"alexissb", mode=DES.MODE_CBC, IV=b"01020304")
data = "我要吃饭".encode("utf-8")
# # 需要加密的数据必须是8的倍数
# # 填充规则: 缺少数据量的个数 * chr(缺少数据量个数)
pad_len = 8 - len(data) % 8
data += (pad_len * chr(pad_len)).encode("utf-8")

bs = des.encrypt(data)
print(bs)
# 解密
des = DES.new(key=b'alexissb', mode=DES.MODE_CBC, IV=b"01020304")
data = b'6HX\xfa\xb2R\xa8\r\xa3\xed\xbd\x00\xdb}\xb0\xb9'
result = des.decrypt(data)
print(result.decode("utf-8"))

四.非对称加密

非对称加密. 加密和解密的秘钥不是同一个秘钥. 这里需要两把钥匙. 一个公钥, 一个私钥. 公钥发送给客户端. 发送端用公钥对数据进行加密. 再发送给接收端, 接收端使用私钥来对数据解密. 由于私钥只存放在接受端这边. 所以即使数据被截获了. 也是无法进行解密的.

常见的非对称加密算法: RSA, DSA等等, 我们就介绍一个. RSA加密, 也是最常见的一种加密方案

4.1 RSA加密解密

4.1.1 创建公钥和私钥

from Crypto.PublicKey import RSA
from Crypto.Cipher import PKCS1_v1_5
from Crypto import Random
import base64

# 随机
gen_random = Random.new

# 生成秘钥
rsakey = RSA.generate(1024)
# 公钥
with open("rsa.public.pem", mode="wb") as f:
    f.write(rsakey.publickey().exportKey())
# 秘钥
with open("rsa.private.pem", mode="wb") as f:
    f.write(rsakey.exportKey())

4.1.2 加密

# 加密
data = "我要吃饭了"
with open("rsa.public.pem", mode="r") as f:
    pk = f.read()
    rsa_pk = RSA.importKey(pk)
    rsa = PKCS1_v1_5.new(rsa_pk)

    result = rsa.encrypt(data.encode("utf-8"))
    # 处理成b64方便传输
    b64_result = base64.b64encode(result).decode("utf-8")
    print(b64_result)

4.1.3 解密

data = "e/spTGg3roda+iqLK4e2bckNMSgXSNosOVLtWN+ArgaIDgYONPIU9i0rIeTj0ywwXnTIPU734EIoKRFQsLmPpJK4Htte+QlcgRFbuj/hCW1uWiB3mCbyU3ZHKo/Y9UjYMuMfk+H6m8OWHtr+tWjiinMNURQpxbsTiT/1cfifWo4="
# 解密
with open("rsa.private.pem", mode="r") as f:
    prikey = f.read()
    rsa_pk = RSA.importKey(prikey)
    rsa = PKCS1_v1_5.new(rsa_pk)
    result = rsa.decrypt(base64.b64decode(data), gen_random)
    print(result.decode("utf-8"))

长的数据是分段加密的

from Crypto.PublicKey import RSA   # 生成秘钥对(公钥+私钥)
from Crypto.Cipher import PKCS1_v1_5
import base64
from Crypto import Random
rsa_key = RSA.generate(1024)     # 10001 或 65537就是rsa算法的一个特征
prikey = rsa_key.exportKey()      # 默认拿到的是私钥,公钥可以根据私钥计算得出,都是字节
pubkey = rsa_key.publickey().exportKey()  # 公钥
# 加密
name = ("杨振中"*200).encode('utf-8')
rsa_encrypt = PKCS1_v1_5.new(RSA.importKey(pubkey))
cipher_text = b''
for i in range(0,len(name),117):   # generate是1024  这里就是117
    cipher_text += rsa_encrypt.encrypt(name[i:i+117])
cipher = base64.b64encode(cipher_text)

# 解密
cipher_text_decrypt = base64.b64decode(cipher)
rsa_decrypt = PKCS1_v1_5.new(RSA.importKey(prikey))
names = b''
for i in range(0,len(cipher_text_decrypt),128):  # 上面是117  这里就是128
    names += rsa_decrypt.decrypt(cipher_text_decrypt[i:i+128],Random.new().read)
print(names.decode('utf-8'))

# 1024bit:分段加密字节数为117,分段解密字节数为128。
# 2048bit:分段加密字节数为245,分段解密字节数为256。

五. 肝个案例看看

我们以https://www.endata.com.cn/BoxOffice/BO/Year/index.html为案例. 来完成该网站数据解密

分析:

很明显, 该网站的数据是经过加密的. 接下来. 我们到Initiator里看看.

接下来就是逆向的过程了... 各位..还是看视频吧. 视频里有详细的分析过程.

给出完整破解代码

import binascii  # 二进制和ascii之间转换
from Crypto.Cipher import DES

def func(a, b, c):
    if b == 0:
        return a[c:]
    d = a[:b] + a[b+c:]
    return d


def process(data):
    e = int(data[len(data)-1], base=16) + 9
    f = int(data[e], base=16)
    data = func(data, e, 1)
    e = data[f:f+8]
    data = func(data, f, 8)
    jiemi(data, str(e), str(e))


def jiemi(data, key, iv):

    des = DES.new(key.encode("utf-8"), mode=DES.MODE_ECB)
    # de_text = base64.standard_b64decode(data)
    #              十六进制表示的二进制数据 -> 十六进制 -> 二进制
    print(binascii.a2b_hex(data))
    ee = des.decrypt(binascii.a2b_hex(data))
    print(ee.decode("utf-8"))


if __name__ == '__main__':
    data = """"""
    process(data)

六. 中大网校登录案例

接下来开始逆向试试吧. 我们从登录位置开始. 第一个事儿要搞定的. 是那个烦人的验证码....

但是这个请求是需要cookie的, 想想也应该如此. 因为服务器要知道这张图片给哪个客户端使用了. 就必须借助cookie来判别不同的客户端.

所以. 整个流程应该是:

  1. 进入登录页, 加载到cookie
  2. 访问验证码url, 获取到验证码. 并完成破解
  3. 访问getTime api. 虽然不知道它用来做什么. 但是在后续的密码加密时是需要这个api返回的data的
  4. 准备好用户名和密码. 对密码进行加密
  5. 发送登录请求.
  6. 得到的结果处理(加入到cookie中. )

代码:

import requests
import json
from Crypto.Cipher import PKCS1_v1_5
from Crypto.PublicKey import RSA
import base64


def base64_api(img, uname='q6035945', pwd='q6035945', typeid=1003):
    data = {"username": uname, "password": pwd, "typeid": typeid, "image": img}
    result = json.loads(requests.post("http://api.ttshitu.com/predict", json=data).text)
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]


headers = {
    "Content-Type": "application/json;charset=UTF-8",
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15; rv:91.0) Gecko/20100101 Firefox/91.0"
}

# 1. 加载cookie
login_url = "https://user.wangxiao.cn/login"
sess = requests.session()

resp = sess.get(login_url)
# print(resp.text)
# print(resp.cookies)

# 2. 获取验证码图片
img_url = "https://user.wangxiao.cn/apis//common/getImageCaptcha"


resp = sess.post(img_url, headers=headers)
tu = resp.json()['data'].split(",")[1]

code = base64_api(tu)
# print(code)


# 准备用户名. 密码
username = "18100001111"
password = "123456"

# 先请求getTime
get_time_url = "https://user.wangxiao.cn/apis//common/getTime"
time_resp = sess.post(get_time_url, headers=headers)


# 密码加密
# 秘钥
key_str = "MIGfMA0GCSqGSIb3DQEBAQUAA4GNADCBiQKBgQDA5Zq6ZdH/RMSvC8WKhp5gj6Ue4Lqjo0Q2PnyGbSkTlYku0HtVzbh3S9F9oHbxeO55E8tEEQ5wj/+52VMLavcuwkDypG66N6c1z0Fo2HgxV3e0tqt1wyNtmbwg7ruIYmFM+dErIpTiLRDvOy+0vgPcBVDfSUHwUSgUtIkyC47UNQIDAQAB"
key = RSA.importKey(base64.b64decode(key_str.encode("utf-8")))
rsa = PKCS1_v1_5.new(key)

mi = rsa.encrypt((password + str(time_resp.json()['data'])).encode("utf-8"))
password = base64.b64encode(mi).decode("utf-8")


# 登录
password_login_url = "https://user.wangxiao.cn/apis//login/passwordLogin"
login_resp = sess.post(url = password_login_url, data=json.dumps({
    "userName": username,
    "password": password,
    "imageCaptchaCode": code
}), headers=headers)

print(login_resp.text)