近来做作业(老男孩那个9.9元的训练营)我想写一个装逼点的密文输入密码,类似于:
这个东西我先前实现过,忘了获取一个字节的方法是什么,于是去网上找,发现网上的实现方式大部分都有问题。
一、网上(百度)的三种实现方式
网上的实现方式不外乎三种:
- 直接明文输入(这是扯淡)
- 使用getpass模块 覆盖输入,无法看到位数,没有退格。(不好用)
- 通过msvcrt模块的getch和putch实现(有问题)
我们重点研究第三种。
二、第三种实现方式的问题何在?
先看代码:
1 def inputPassword():# 密码输入
2 try:
3 li = []
4 while True:
5 ch = msvcrt.getch()
6 if ch == b'\r': #回车键,确认输入
7 return ''.join(li) # 返回密码字符串
8 elif ch == b'\x08': #退格键,删除最后一个输出
9 del li[-1] #删除密码列表最后一位
10 msvcrt.putch(b'\b')
11 msvcrt.putch(b' ')
12 msvcrt.putch(b'\b')# 这相当于刷新
13 elif ch == b'\x1a': # ctrl+z 退出键,抛出异常
14 raise EOFError
15 else: #否则,就是密码
16 li.append(ch.decode()) # 加入列表
17 msvcrt.putch(b'*') # 遮盖符
18 except EOFError:
19 pass
看似没有问题,然而当实际运行的时候,获取到的密码会变成
"1 2 3 1 2 3"之类
而且可以发现,按下一个键后会出现两个*
这是为什么呢?
原来,当按下一个键时,实际上捕获到两个ch,一个是实际按下的键,另一个是b'\x00',这个东西造成了密码输入的不正确
怎么改?
只需要加入一个判断 处理b'\x00'就行了
正常的代码:
1 def inputPassword():# 密码输入
2 try:
3 li = []
4 while True:
5 ch = msvcrt.getch()
6 if ch == b'\r': #回车键,确认输入
7 return ''.join(li) # 返回密码字符串
8 elif ch == b'\x08': #退格键,删除最后一个输出
9 del li[-1] #删除密码列表最后一位
10 msvcrt.putch(b'\b')
11 msvcrt.putch(b' ')
12 msvcrt.putch(b'\b')# 这相当于刷新
13 elif ch == b'\x00': #去除空字符
14 pass
15 elif ch == b'\x1a': # ctrl+z 退出键,抛出异常
16 raise EOFError
17 else: #否则,就是密码
18 li.append(ch.decode()) # 加入列表
19 msvcrt.putch(b'*') # 遮盖符
20 except EOFError:
21 pass
你只需要注意13行就可以。
事情并没用这么简单
在Python2中,不处理b'\x00'也是可以的,这是为何?
为此,我下载了python2和python3的源码,仔细研究
在..\Python-2.7.14\PC文件夹中(或者python3,也是这个文件夹),有一个名为msvcrtmodule.c的文件,这个就是msvcrt模块的源码
1 static PyObject *
2 msvcrt_getch(PyObject *self, PyObject *args)
3 {
4 int ch;
5 char s[1];
6
7 if (!PyArg_ParseTuple(args, ":getch"))
8 return NULL;
9
10 Py_BEGIN_ALLOW_THREADS
11 ch = _getch();
12 Py_END_ALLOW_THREADS
13 s[0] = ch;
14 return PyString_FromStringAndSize(s, 1);
15 }
python2
static int
msvcrt_getch_impl(PyObject *module)
/*[clinic end generated code: output=a4e51f0565064a7d input=37a40cf0ed0d1153]*/
{
int ch;
Py_BEGIN_ALLOW_THREADS
ch = _getch();
Py_END_ALLOW_THREADS
return ch;
}
python3
比较这两个getch的代码,_getch方法我没有找到,可能在某个头文件中,这个方法的作用应该是获取输入的内容,python2和python3中,应该没有改变
然而在python2中,getch函数返回的是一个PyString_FromStringAndSize(s, 1)的返回值,而python3直接返回了_getch得到的东西。
但是由于笔者C语言拙劣,没用有找到PyString_FromStringAndSize的函数定义,只能推测,在这个函数中,处理掉了b'\x00',导致python2中压根没有获取到b'\x00',也就不用处理了
至于网上的文章,我怀疑msvcrt是最近更新的,python3的前几个版本中,应该还沿用了python2的这个函数。
为此我下载了python3.3的源码,发现getch函数和python2的完全一样。
因此网上没有处理b‘\x00’的方式,应该至少是3.3以前的版本(至于3.4、3.5我没有用过,也没有下载源码核实)
在python标准库网站中,我也没有看到什么解释。。
2019/6/8 更新
最近读C++的书籍,发现C的字符串(或者叫 char )类型,本质是一个数组。最后一个元素通常是以一个 “结束符” 结尾的。但是C++的字符串(C-style string)是一个对象。
或许python2 python3 之间处理数据的差距就在这里吧……
完