国密SM4的Python实现也有其他人写了,本程序的优点在于考虑了明文输入不足128bits(二进制下)的情况(采用ECB工作模式),并给出了大量注释即调试用代码(已注释),方便大家进行调试、优化。希望大家通过本程序一起学习呀QwQ
话不多说,直接上代码=v=:
import math
import binascii
sbox = [[0xd6, 0x90, 0xe9, 0xfe, 0xcc, 0xe1, 0x3d, 0xb7, 0x16, 0xb6, 0x14, 0xc2, 0x28, 0xfb, 0x2c, 0x05,],
[0x2b, 0x67, 0x9a, 0x76, 0x2a, 0xbe, 0x04, 0xc3, 0xaa, 0x44, 0x13, 0x26, 0x49, 0x86, 0x06, 0x99,],
[0x9c, 0x42, 0x50, 0xf4, 0x91, 0xef, 0x98, 0x7a, 0x33, 0x54, 0x0b, 0x43, 0xed, 0xcf, 0xac, 0x62,],
[0xe4, 0xb3, 0x1c, 0xa9, 0xc9, 0x08, 0xe8, 0x95, 0x80, 0xdf, 0x94, 0xfa, 0x75, 0x8f, 0x3f, 0xa6,],
[0x47, 0x07, 0xa7, 0xfc, 0xf3, 0x73, 0x17, 0xba, 0x83, 0x59, 0x3c, 0x19, 0xe6, 0x85, 0x4f, 0xa8,],
[0x68, 0x6b, 0x81, 0xb2, 0x71, 0x64, 0xda, 0x8b, 0xf8, 0xeb, 0x0f, 0x4b, 0x70, 0x56, 0x9d, 0x35,],
[0x1e, 0x24, 0x0e, 0x5e, 0x63, 0x58, 0xd1, 0xa2, 0x25, 0x22, 0x7c, 0x3b, 0x01, 0x21, 0x78, 0x87,],
[0xd4, 0x00, 0x46, 0x57, 0x9f, 0xd3, 0x27, 0x52, 0x4c, 0x36, 0x02, 0xe7, 0xa0, 0xc4, 0xc8, 0x9e,],
[0xea, 0xbf, 0x8a, 0xd2, 0x40, 0xc7, 0x38, 0xb5, 0xa3, 0xf7, 0xf2, 0xce, 0xf9, 0x61, 0x15, 0xa1,],
[0xe0, 0xae, 0x5d, 0xa4, 0x9b, 0x34, 0x1a, 0x55, 0xad, 0x93, 0x32, 0x30, 0xf5, 0x8c, 0xb1, 0xe3,],
[0x1d, 0xf6, 0xe2, 0x2e, 0x82, 0x66, 0xca, 0x60, 0xc0, 0x29, 0x23, 0xab, 0x0d, 0x53, 0x4e, 0x6f,],
[0xd5, 0xdb, 0x37, 0x45, 0xde, 0xfd, 0x8e, 0x2f, 0x03, 0xff, 0x6a, 0x72, 0x6d, 0x6c, 0x5b, 0x51,],
[0x8d, 0x1b, 0xaf, 0x92, 0xbb, 0xdd, 0xbc, 0x7f, 0x11, 0xd9, 0x5c, 0x41, 0x1f, 0x10, 0x5a, 0xd8,],
[0x0a, 0xc1, 0x31, 0x88, 0xa5, 0xcd, 0x7b, 0xbd, 0x2d, 0x74, 0xd0, 0x12, 0xb8, 0xe5, 0xb4, 0xb0,],
[0x89, 0x69, 0x97, 0x4a, 0x0c, 0x96, 0x77, 0x7e, 0x65, 0xb9, 0xf1, 0x09, 0xc5, 0x6e, 0xc6, 0x84,],
[0x18, 0xf0, 0x7d, 0xec, 0x3a, 0xdc, 0x4d, 0x20, 0x79, 0xee, 0x5f, 0x3e, 0xd7, 0xcb, 0x39, 0x48]]
FK0=0XA3B1BAC6
FK1=0X56AA3350
FK2=0X677D9197
FK3=0XB27022DC
CK = [0x00070e15, 0x1c232a31, 0x383f464d, 0x545b6269, 0x70777e85, 0x8c939aa1, 0xa8afb6bd, 0xc4cbd2d9,
0xe0e7eef5, 0xfc030a11, 0x181f262d, 0x343b4249, 0x50575e65, 0x6c737a81, 0x888f969d, 0xa4abb2b9,
0xc0c7ced5, 0xdce3eaf1, 0xf8ff060d, 0x141b2229, 0x30373e45, 0x4c535a61, 0x686f767d, 0x848b9299,
0xa0a7aeb5, 0xbcc3cad1, 0xd8dfe6ed, 0xf4fb0209, 0x10171e25, 0x2c333a41, 0x484f565d, 0x646b7279]
rk = [0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0]
#初始轮密钥全部置零
def S(x): #s盒8位输入,查表字节代换8位输出
row = (x>>4) & 0xf #前4位行索引
col = x & 0xf #后4位列索引
return sbox[row][col]
def t(x): #非线性变换t(S盒代换),32位输入,32位输出
a0 = (x >> 24) & 0xff #取32位输入从左往右的第一个字节(8位),%0x100取低四位,与 &0xff 作用相同
a1 = (x >> 16) & 0xff #取第二个字节
a2 = (x >> 8) & 0xff #取第三个字节
a3 = (x >> 0) & 0xff #取第四个字节
return ((S(a0) << 24) | (S(a1) << 16) | (S(a2) << 8)| S(a3))
#四个字节拼接成一个字
def L(B): #线性变换L,32输入32输出
return (B^((B << 2)&0xffffffff)^((B << 10) & 0xffffffff)^((B << 18) & 0xffffffff)^((B << 24) & 0xffffffff))
def T(x): #加密轮函数,32输入32输出
B = t(x) #进行S盒字节代换
return L(B) #进行左移位线性变换
def L_(B): #线性变换L_,32输入32输出
return (B^((B << 13) & 0xffffffff)^((B << 23) & 0xffffffff))
def T_(x): #密钥扩展轮函数,32输入32输出
B = t(x) #进行S盒字节代换
return L_(B) #进行左移位线性变换
def K(MK0,MK1,MK2,MK3): #SM4密钥扩展算法
K = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
K[0] = MK0 ^ FK0
K[1] = MK1 ^ FK1
K[2] = MK2 ^ FK2
K[3] = MK3 ^ FK3
for i in range (32):
rk[i] = K[i+4] = K[i]^T_(K[i+1]^K[i+2]^K[i+3]^CK[i])
def SM4(x): #SM4加密算法
X = [0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0]
X[0] = (x >> 96) & 0xffffffff
X[1] = (x >> 64) & 0xffffffff
X[2] = (x >> 32) & 0xffffffff
X[3] = (x >> 0) & 0xffffffff
for i in range(32):
X[i+4] = X[i]^T(X[i+1]^X[i+2]^X[i+3]^rk[i])
Y = (X[35]<<96)^(X[34]<<64)^(X[33]<<32)^X[32]
#注意这里左移的意义与线性变换L函数中的左移意义不同
"""
调试用代码
print("X[35]是:")
D=hex(X[35])[2:]
print(D)
print(len(D))
"""
return Y
def SM4Decode(x): #SM4解密算法,只将密钥序列倒序
X = [0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0]
X[0] = (x >> 96) & 0xffffffff
X[1] = (x >> 64) & 0xffffffff
X[2] = (x >> 32) & 0xffffffff
X[3] = (x >> 0) & 0xffffffff
for i in range(32):
X[i+4] = X[i]^T(X[i+1]^X[i+2]^X[i+3]^rk[31-i])
"""
调试用代码
print("X[0]是:")
D=hex(X[0])[2:]
print(D)
print(len(D))
"""
return (X[35]<<96)^(X[34]<<64)^(X[33]<<32)^X[32]
#PKCS7填充方法
def BitsFill(P):
#将用户输入字符串填充到16的整数倍位(即16进制32位,二进制128位整数倍)
"""
若字符串位数正好是16的倍数,则填充16个0x10对应的字符
否则,不足位用【16-最后一段字符数】对应的字符填充
填充用的字符命名为fillByte
"""
if len(P)%16==0:
fillByte = chr(0x10)
#右边补16个0x10对应的字符
dataFill = "{0:{1}<{2}}".format(P, fillByte, len(P)+16)
else:
n = math.ceil(len(P)/16)
fillByte = chr(16*n-len(P))
#16*n位左对齐,右边不足位用【16-最后一段字符数】对应的字符填充
dataFill = "{0:{1}<{2}}".format(P, fillByte, 16*n)
#转换为十六进制字符串
strHex = dataFill.encode().hex()
print(f"PKCS7填充后为(16进制):\n{strHex}")
print(f"长度为:{len(strHex)}")
#转换为十六进制数
dataHex = int(strHex,16)
#得到输入字符串填充完毕后对应的二进制数的长度,正确情况下应当为128的倍数
bits = len(strHex)*4
return dataHex, bits, fillByte
#将填充字符也返回的主要目的是:还原明文时抛弃填充的无意义字符
if __name__ == '__main__':
MK = input("请输入初始密钥: (请输入小于(不等于)16位的任意字符串)")
#不能等于16位的原因是,初始密钥这里也用了一次PKCS7填充,
#而根据PKCS7填充方法,16位也要在原字符串后补16个0x10对应的字符,显然不符合
MK, bits1, fill1 = BitsFill(MK)
if bits1 != 128:
print("输入错误。")
exit()
MK0 = (MK>>96) & 0Xffffffff
MK1 = (MK>>64) & 0Xffffffff
MK2 = (MK>>32) & 0Xffffffff
MK3 = (MK>>0) & 0Xffffffff
K(MK0, MK1, MK2, MK3)
P = input("\n请输入明文: ")
P, bits2, fill2 = BitsFill(P) #P为填充后的明文字符串对应的整型形式
temp = bits2
C = ""
print("\n密文为(16进制):")
while(bits2 != 0):
bits2 = bits2 - 128
#Pk从左往右依次取128位
Pk = (P>>bits2) & 0Xffffffffffffffffffffffffffffffff #128/4=32个f
C = C + hex(SM4(Pk))[2:]
print(C)
print(f"长度为:{len(C)}")
bits2 = temp
C = int(C, 16)
"""
调试用代码
print(f"C是:\n{hex(C)}")
print(f"C的前32位是:\n{hex((C>>96) & 0xffffffff)}")
"""
P = ""
print("\n明文还原为(16进制):")
while(bits2 != 0):
bits2 = bits2 - 128
#Pk从左往右依次取128位
Ck = (C>>bits2) & 0Xffffffffffffffffffffffffffffffff #128/4=32个f
P = P + hex(SM4Decode(Ck))[2:]
print(P)
print(f"长度为:{len(P)}")
P = binascii.a2b_hex(P).decode()
fill2 = ord(fill2)
print(f"明文:{P[:(len(P)-fill2)]}")
"""
调试用初始密钥、明文
abcdefghijklmn
This is a text used to test my SM4 encryption algorithm.
"""
运行结果如下:
查看扩散性:先输入明文aaaaaaaaaa,再输入明文baaaaaaaab对比查看两次输出的密文差别:
可以看到两次输入差两个字符,且a是0x61,b是0x62,即仅有0001与0010的差别,密文中变化的位数远超2*2=4位。
第二次输出的密文只有31位是因为第一位恰好是0x0了所以没显示,正常情况下都是32位输入(二进制128位输入)32位输出(二进制128位输出)。当然这也是可以优化的地方。
本程序中采用的是最简单的ECB工作模式下的PKCS7填充法对输入的明文进行填充,将明文按照二进制下128bits分组,依次进行加密。PKCSK7填充法的内容见下图。
值得注意的是,本程序的思路是在字符阶段直接进行填充,因为PKCS7是要求用16进制下的两位数(如0x05)填充,通过format格式化语句我只会用一个字符对字符串进行填充,所以在字符阶段填充该两位数(如0x05)对应的字符,也能达到同样效果。
但这样导致的一个问题是:英文下一个字符(包括'['、'{'、'|'等)是8bits,也就是我们C语言中学过的一个字节8bits,一个int四字节就是32bits,一个char一字节就是8bits;然而一个中文字符(包括‘,’、‘。’等)占24bits,也就是说1个中文抵3个英文。这就导致如果明文中有中文,本程序在字符填充阶段会多填入很多bits(原因看一下代码很容易就知道了),使输入SM4加密机的数的位数不是128bits(二进制下)或128bits整数倍,使程序运行错误。
(注意:这里总结一下:SM4将明文按二进制下128bits进行分组,在16进制下就是按32位进行分组,在字符阶段(一个字符8bits)就是按照16位(128 / 8 = 16)进行分组。)
一个解决的思路是不在字符阶段对明文进行填充,而是在16进制表示下对明文填充,这样就没有问题了(检查是不是32位及32位整数倍(16进制32位=2进制128位)即可),但这样就涉及到用两个字符(05,0d等)进行填充,我不会,所以本程序不能输入中文字符。如果大家会的话可以自己试试,或者不用我的思路改进,使程序可以输入中文进行加密。