我感觉百度是BAT三家里面AI能力最强的了,在图像和语音的处理上面是很强的,很全面。百度AI里面功能齐全,提供的语言也是很多。唯一不太好的是目前对python3不是很支持,还是支持python2。但也不表示python3做不了。

一下是代码

import urllib3,base64
from urllib.parse import urlencode
import json
import cv2
import time
t1=time.time()
access_token='yous access_token'
http=urllib3.PoolManager()
url='https://aip.baidubce.com/rest/2.0/face/v2/detect?access_token='+access_token
#2张图片
filepath='yiqi.jpg'
f1 = open(filepath,'rb')
frame=cv2.imread(filepath)
#参数images:图像base64编码 分别base64编码后的2张图片数据,需urlencode,半角逗号分隔,单次请求最大不超过20M
img1 = base64.b64encode(f1.read())

#这一步和官方示例代码不一样。具体为什么就不知道了。里面有json bytes str 类型关系
#这里直接拼接提示byte相关。然后就直接转str拼接了
params = {"images":str(img1,'utf-8'),"max_face_num":10}
#对base64数据进行urlencode处理
params=urlencode(params)
request=http.request('POST',
                      url,
                      body=params,
                      headers={'Content-Type':'application/x-www-form-urlencoded'})
#对返回的byte字节进行处理。Python3输出位串,而不是可读的字符串,需要进行转换

print(json.loads(request.data))  # request.data 返回有关的信息但是是json类型  然后使用json.loads 进行转换转成python支持的dict
result = json.loads(request.data)['result']  #分析返回的数据 找到有用的信息拿出来 我们这里是要拿出来人脸坐标
print(result)
face_num=json.loads(request.data)['result_num']  #获取到图片中人脸的个数

for i in range(face_num):  #使用遍历把所有的人脸都标出框

    location=result[i]['location']  #获取到人脸的坐标
    print(location)   #输出人脸坐标 left location是左上角坐标  width 宽度height高度
    cv2.rectangle(frame, (location['left'], location['top']), (location['width']+location['left'], location['height']+location['top']), (0, 0, 255), 2) #opencv的标框函数

cv2.imshow('tuxiang',frame)
cv2.waitKey(1)  #刷新界面 不然只会呈现灰色
print('运行时间是{}'.format(time.time()-t1))
time.sleep(5)  #暂停五秒  展示图片

运行结果

python中airtest模块 python ai模块_百度AI

运行时间  1.7899997234344482 (受网速影响)

 

里面的access_token我没有每次都申请,嫌麻烦,如果有需要可以再加上那个函数。我觉得是不怎么需要。官方给的api文档和实例代码一直运行出错,json和str 以及bytes三种格式 报错。

跟python版本有关系,百度ai目前还不支持python3,给的实例代码也是python2的,但是python3是大势所趋很多人都在用,所以还是使用python3来跑。

主要是发送链接主体那格式 图片的格式需要转换下,其他地方看官方api文档就行。

把人脸检测跑通,人脸识别就不远了,改下url,看api文档上传两张照片再分析返回的数据就可以了。