近来做作业(老男孩那个9.9元的训练营)我想写一个装逼点的密文输入密码,类似于:

Python输入密码显示星号 python请输入密码_Python输入密码显示星号

这个东西我先前实现过,忘了获取一个字节的方法是什么,于是去网上找,发现网上的实现方式大部分都有问题。

一、网上(百度)的三种实现方式

网上的实现方式不外乎三种:

  1. 直接明文输入(这是扯淡)
  2. 使用getpass模块 覆盖输入,无法看到位数,没有退格。(不好用)
  3. 通过msvcrt模块的getch和putch实现(有问题)

我们重点研究第三种。

二、第三种实现方式的问题何在?

先看代码:



1 def inputPassword():# 密码输入
 2     try:
 3         li = []
 4         while True:
 5             ch = msvcrt.getch()
 6             if ch == b'\r': #回车键,确认输入
 7                 return ''.join(li) # 返回密码字符串
 8             elif ch == b'\x08': #退格键,删除最后一个输出
 9                 del li[-1] #删除密码列表最后一位
10                 msvcrt.putch(b'\b')
11                 msvcrt.putch(b' ')
12                 msvcrt.putch(b'\b')# 这相当于刷新
13             elif ch == b'\x1a': # ctrl+z 退出键,抛出异常
14                 raise EOFError
15             else: #否则,就是密码
16                 li.append(ch.decode()) # 加入列表
17                 msvcrt.putch(b'*') # 遮盖符
18     except EOFError:
19         pass



看似没有问题,然而当实际运行的时候,获取到的密码会变成

"1 2 3 1 2 3"之类

而且可以发现,按下一个键后会出现两个*

这是为什么呢?

原来,当按下一个键时,实际上捕获到两个ch,一个是实际按下的键,另一个是b'\x00',这个东西造成了密码输入的不正确

怎么改?

只需要加入一个判断 处理b'\x00'就行了

正常的代码:



1 def inputPassword():# 密码输入
 2     try:
 3         li = []
 4         while True:
 5             ch = msvcrt.getch()
 6             if ch == b'\r': #回车键,确认输入
 7                 return ''.join(li) # 返回密码字符串
 8             elif ch == b'\x08': #退格键,删除最后一个输出
 9                 del li[-1] #删除密码列表最后一位
10                 msvcrt.putch(b'\b')
11                 msvcrt.putch(b' ')
12                 msvcrt.putch(b'\b')# 这相当于刷新
13             elif ch == b'\x00': #去除空字符
14                 pass
15             elif ch == b'\x1a': # ctrl+z 退出键,抛出异常
16                 raise EOFError
17             else: #否则,就是密码
18                 li.append(ch.decode()) # 加入列表
19                 msvcrt.putch(b'*') # 遮盖符
20     except EOFError:
21         pass



你只需要注意13行就可以。

事情并没用这么简单

在Python2中,不处理b'\x00'也是可以的,这是为何?

为此,我下载了python2和python3的源码,仔细研究

在..\Python-2.7.14\PC文件夹中(或者python3,也是这个文件夹),有一个名为msvcrtmodule.c的文件,这个就是msvcrt模块的源码



1 static PyObject *
 2 msvcrt_getch(PyObject *self, PyObject *args)
 3 {
 4     int ch;
 5     char s[1];
 6 
 7     if (!PyArg_ParseTuple(args, ":getch"))
 8         return NULL;
 9 
10     Py_BEGIN_ALLOW_THREADS
11     ch = _getch();
12     Py_END_ALLOW_THREADS
13     s[0] = ch;
14     return PyString_FromStringAndSize(s, 1);
15 }


python2


static int
msvcrt_getch_impl(PyObject *module)
/*[clinic end generated code: output=a4e51f0565064a7d input=37a40cf0ed0d1153]*/
{
    int ch;

    Py_BEGIN_ALLOW_THREADS
    ch = _getch();
    Py_END_ALLOW_THREADS
    return ch;
}


python3


比较这两个getch的代码,_getch方法我没有找到,可能在某个头文件中,这个方法的作用应该是获取输入的内容,python2和python3中,应该没有改变

然而在python2中,getch函数返回的是一个PyString_FromStringAndSize(s, 1)的返回值,而python3直接返回了_getch得到的东西。

但是由于笔者C语言拙劣,没用有找到PyString_FromStringAndSize的函数定义,只能推测,在这个函数中,处理掉了b'\x00',导致python2中压根没有获取到b'\x00',也就不用处理了

 

至于网上的文章,我怀疑msvcrt是最近更新的,python3的前几个版本中,应该还沿用了python2的这个函数。

为此我下载了python3.3的源码,发现getch函数和python2的完全一样。

因此网上没有处理b‘\x00’的方式,应该至少是3.3以前的版本(至于3.4、3.5我没有用过,也没有下载源码核实)

在python标准库网站中,我也没有看到什么解释。。

 

 

 2019/6/8 更新

 

最近读C++的书籍,发现C的字符串(或者叫 char )类型,本质是一个数组。最后一个元素通常是以一个 “结束符” 结尾的。但是C++的字符串(C-style string)是一个对象。

或许python2 python3 之间处理数据的差距就在这里吧……