最近公司通过网络查询到我们部门有人工作时间逛b站次数太多,这事惊动了上层领导,搅得人心惶惶。突然星期某信服的一套监控员工电脑的系统,不经一颤。想着自己也尝试玩玩电脑屏幕文字识别-----抓取关键字,然后将图片保存下来。

这里将使用python,通过百度API识别电脑屏幕文字,并将含有关键字的截图保存下来。

一、百度API获取

1.进入百度云官网,先注册/登录,在首页顶端搜索文字识别,然后进入:

百度云官网

用python识别屏幕内容 python屏幕抓取文字_百度云


用python识别屏幕内容 python屏幕抓取文字_python_02


2.先领取免费的体验票,然后再创建应用(务必先“免费尝鲜”,再“创建应用”)

用python识别屏幕内容 python屏幕抓取文字_python_03


3.按要求填写“应用名称”和“应用描述”等信息。

4.记住三个参数AppID、API Key、Secret Key,后面代码中需要用到。

用python识别屏幕内容 python屏幕抓取文字_文字识别_04

二、python代码实现

在晚上应用的创建后,接下来就可以编写代码了,在编写代码之前,需要安装几个Module:

pip3 install chardet
pip3 install pyautogui
pip3 install baidu-aip

接着就可以编写代码了,这里直接贴出:

import pyautogui
from datetime import datetime
import time
import os
from aip import AipOcr


APP_ID = '28704805'
API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)


def pic_text_recognition(picname):
    with open(picname, 'rb') as fp:
        image = fp.read()
    dic_result = client.basicAccurate(image)
    print(dic_result)
    res = dic_result['words_result']
    result = ''
    for m in res:
        result += str(m['words'])
    return result

while True:
    # 截取电脑全屏
    img = pyautogui.screenshot()

    # 获取实时时间
    screen_time = datetime.now().strftime('%Y%m%d%H%M%S')

    png_name = screen_time + '.jpg'
    # 标记截屏时间
    img.save(png_name)

    try:
        string = pic_text_recognition(png_name)
        print(string)
        if string.index("离职"):
            print(png_name + "have key")
        else:
            print(png_name + " have no string2!")
            os.remove(png_name)
    except:
        print(png_name + " have no string1!")
        os.remove(png_name)

        # 截屏间隔时间(秒)
    time.sleep(10)

代码中,

APP_ID = '28704805'
API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'

为在百度云创建应用时给出的三个参数。

三、测试结果

运行代码,每过10s会获取当前屏幕截图,然后获取屏幕文字,检测这些文字中是否有“离职”的关键字,有的话,则保存接入,如果没有,则舍弃截图。

如下:

用python识别屏幕内容 python屏幕抓取文字_百度云_05


用python识别屏幕内容 python屏幕抓取文字_百度云_06

四、总结

1.如果你也用的是pycharm,而电脑里有很多个版本的python,且python不同版本安装时都是自定义安装目录,那么你有概率代码编译会报错没有某些Module,注意当前工程的编译环境配置,比如我电脑安装有两个版本的python,这里我使用的是python3.8。有关python不同版本的切换,请查看自己电脑的“环境变量”配置。

用python识别屏幕内容 python屏幕抓取文字_文字识别_07


用python识别屏幕内容 python屏幕抓取文字_百度云_08


2.工作需要注意隐私!