文章目录

  • OpenCV的安装
  • 数据的读取——图片
  • 数据的读取——视频
  • 截取部分图像数据
  • 颜色通道提取
  • 边界填充
  • 数值计算
  • 图像融合


OpenCV的安装

  • 我们主要运用的python语言,进行OpenCV的学习,这里我们可以需要安装python环境,最好能安装anaconda大礼包,我们主要的实验环境是在jupyter notebook上面实现的。具体安装教程可以参考官方网站
  • 安装OpenCV只需要输入以下命令:
#不指定版本默认是最新版的
 pip install opencv-python
  • 安装好之后我们可以通过以下命令来查看安装的版本:
import cv2
cv2.__version__
'4.5.3'

数据的读取——图片

  • cv2.IMREAD_COLOR:彩色图像
  • cv2.IMREAD_GRAYSCALE:灰度图像
##相关代码
import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 
%matplotlib inline 

#读取图像
#img是一个array格式的三维数组(x ,y, 颜色通道)
#dtype值为uint8取值只能取0-255
img=cv2.imread('cat.jpg')

#图像展示
cv2.imshow('image',img) 
# 等待时间,毫秒级,0表示任意键终止,如果设置时间,过了时间会自动关闭(毫秒级)
cv2.waitKey(0) 
cv2.destroyAllWindows()
  • 在编程时我们可以定义一个函数模块化
def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()
  • 灰度图
#彩色图的shape:
img.shape
(414, 500, 3)
#灰度图
img=cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)
img.shape
(414, 500)
  • 保存图片
#保存
cv2.imwrite('mycat.png',img)
True

数据的读取——视频

  • cv2.VideoCapture可以捕获摄像头,用数字来控制不同的设备,例如0,1。
  • 如果是视频文件,直接指定好路径即可。
  • 相关代码
vc = cv2.VideoCapture('test.mp4')
# 检查是否打开正确
if vc.isOpened(): 
    oepn, frame = vc.read()
else:
    open = False
 
while open:
   ret, frame = vc.read()
   if frame is None:
       break
   if ret == True:
       gray = cv2.cvtColor(frame,  cv2.COLOR_BGR2GRAY)
       cv2.imshow('result', gray)
       if cv2.waitKey(100) & 0xFF == 27:
           break
vc.release()
cv2.destroyAllWindows()

截取部分图像数据

img=cv2.imread('cat.jpg')
cat=img[0:50,0:200] 
cv_show('cat',cat)

图片比较

cpython 导入pyd opencv python导入_计算机视觉


cpython 导入pyd opencv python导入_cpython 导入pyd_02

颜色通道提取

  • b,g,r三个颜色通道可以分开,也可以合并
#分裂
b,g,r=cv2.split(img)
r.shape
(414, 500)
#合并
img=cv2.merge((b,g,r))
img.shape
(414, 500, 3)
# 只保留R(图片会变红)
#需要先拷贝
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('R',cur_img)

# 只保留G(图片会变绿)
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('G',cur_img)

# 只保留B
cur_img = img.copy()
cur_img[:,:,1] = 0
cur_img[:,:,2] = 0
cv_show('B',cur_img)

#顺序为0,1,2为B,G,R

cpython 导入pyd opencv python导入_python_03


cpython 导入pyd opencv python导入_python_04


cpython 导入pyd opencv python导入_cpython 导入pyd_05

边界填充

  • BORDER_REPLICATE:复制法,也就是复制最边缘像素。
  • BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
  • BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
  • BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
  • BORDER_CONSTANT:常量法,常数值填充。
top_size,bottom_size,left_size,right_size = (50,50,50,50)

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)

#多图同时展示可以使用pythonMatplotlib工具包
import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

cpython 导入pyd opencv python导入_数据_06

数值计算

  • 我们可以对图像中的数值实现计算
#相关代码
img_cat=cv2.imread('cat.jpg')
img_dog=cv2.imread('dog.jpg')

img_cat2= img_cat +10 
#截取一段
img_cat[:5,:,0]
array([[142, 146, 151, ..., 156, 155, 154],
       [108, 112, 118, ..., 155, 154, 153],
       [108, 110, 118, ..., 156, 155, 154],
       [139, 141, 148, ..., 156, 155, 154],
       [153, 156, 163, ..., 160, 159, 158]], dtype=uint8)
#每个数值都增加了10
img_cat2[:5,:,0]
array([[152, 156, 161, ..., 166, 165, 164],
       [118, 122, 128, ..., 165, 164, 163],
       [118, 120, 128, ..., 166, 165, 164],
       [149, 151, 158, ..., 166, 165, 164],
       [163, 166, 173, ..., 170, 169, 168]], dtype=uint8)
#两个图数据相加之后的数据,相当于相加之后% 256
(img_cat + img_cat2)[:5,:,0]
array([[ 38,  46,  56, ...,  66,  64,  62],
       [226, 234, 246, ...,  64,  62,  60],
       [226, 230, 246, ...,  66,  64,  62],
       [ 32,  36,  50, ...,  66,  64,  62],
       [ 60,  66,  80, ...,  74,  72,  70]], dtype=uint8) 

#没越界取自身,越界取255
cv2.add(img_cat,img_cat2)[:5,:,0]
array([[255, 255, 255, ..., 255, 255, 255],
       [226, 234, 246, ..., 255, 255, 255],
       [226, 230, 246, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)

图像融合

  • 如果两张图的大小不同的话,是无法进行融合的会显示报错:
    ValueError: operands could not be broadcast together with shapes
  • 可以通过resize重新指定图片大小:
img_cat.shape
(414, 500, 3)
img_dog = cv2.resize(img_dog, (500, 414))
img_dog.shape
(414, 500, 3)
  • 图片融合,可以通过调整图片融合比例来实现,数字越高,融合越突出:
res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)
plt.imshow(res)

cpython 导入pyd opencv python导入_cpython 导入pyd_07

  • resize的其他用法
res = cv2.resize(img, (0, 0), fx=4, fy=4)
plt.imshow(res)
res.shape
(1656, 2000, 3)

cpython 导入pyd opencv python导入_opencv_08

res = cv2.resize(img, (0, 0), fx=1, fy=3)
plt.imshow(res)
res.shape
(1242, 500, 3)

cpython 导入pyd opencv python导入_cpython 导入pyd_09