关于图片:python图像的读写

59次阅读

共计 3324 个字符，预计需要花费 9 分钟才能阅读完成。

在做计算机视觉的我的项目过程中，图像的读写是最根底的工作。上面的内容就是对罕用的几个图像处理库的总结：

1、imageio

imageio 是 python 的一个库，提供了简洁的图像读写接口，可能读写大部分格局的图像数据。

import imageio
im = imageio.imread('imageio:chelsea.png')  # read a standard image
imageio.imwrite('~/chelsea-gray.jpg', im[:, :, 0])

还能够读写视频

import imageio
reader = imageio.get_reader('imageio:cockatoo.mp4')
for i, im in enumerate(reader):
    print('Mean of frame %i is %1.1f' % (i, im.mean()))

2、OpenCV opencv- 基础知识 – 参考链接

图像读取和显示

import cv2 #导入 opencv 库
#读取一张图片，地址不能带中文

#第二个参数，取值可为：#cv2.IMREAD_COLOR：默认参数，读入一副彩色图片，疏忽 alpha 通道
#cv2.IMREAD_GRAYSCALE：读入灰度图片
#cv2.IMREAD_UNCHANGED：读入残缺图片，包含 alpha 通道 (png 有，jpg 无）img=cv2.imread("test.jpg",cv2.IMREAD_COLOR)
#img=cv2.imread("test.jpg")
img_gray = cv2.imread("test.jpg", 0)

#显示图片，参数：（窗口标识字符串，imread 读入的图像）cv2.imshow("题目",img)
#窗口期待任意键盘按键输出,0 为始终期待, 其余数字为毫秒数
cv2.waitKey(0)
#销毁窗口，退出程序
cv2.destroyAllWindows()

#一个像素有三个通道，BGR
print(img.shape)# 输入：(1080, 1920, 3) 高像素，宽像素，通道数
print(img.size)# 120000  总通道数 = 高 * 宽 * 通道数
print(img.dtype)# uint8  3 个通道每个通道占的位数（8 位，一个字节）

色调转换

# 将图片由 BGR 转换为灰度
areax=cv2.cvtColor(areax,cv2.COLOR_BGR2GRAY)

图像保留

# 将图片保留，写入到文件
cv2.imwrite("2.jpg",imgviewx)

扭转图像尺寸

cv2.resize() #放大和放大图像
    #参数：#  src: 输出图像对象
     #  dsize：输入矩阵 / 图像的大小，为 0 时计算形式如下：dsize = Size(round(fx*src.cols),round(fy*src.rows))
     #  fx: 程度轴的缩放因子，为 0 时计算形式：(double)dsize.width/src.cols
     #  fy: 垂直轴的缩放因子，为 0 时计算形式：(double)dsize.heigh/src.rows
     #  interpolation：插值算法
     #       cv2.INTER_NEAREST : 最近邻插值法
     #       cv2.INTER_LINEAR   默认值，双线性插值法
     #       cv2.INTER_AREA        基于部分像素的重采样（resampling using pixel area relation）。#       cv2.INTER_CUBIC        基于 4x4 像素邻域的 3 次插值法
     #       cv2.INTER_LANCZOS4     基于 8x8 像素邻域的 Lanczos 插值
 
import cv2
import numpy as np
img = cv2.imread('messi5.jpg')
res = cv2.resize(img,None,fx=2, fy=2, interpolation = cv2.INTER_CUBIC)
#OR
height, width = img.shape[:2]
res = cv2.resize(img,(2*width, 2*height), interpolation = cv2.INTER_CUBIC)
#图像放大两倍

图像处理

# 均值含糊, 次要用于去除图片噪点
#读取图片并实现图片的含糊成果，参数：（读取图片，（X 轴方向含糊，Y 轴方向含糊））imgviewx=cv2.blur(imgviewx,(5,5))

#中值含糊，次要用于去除椒盐（烧烤配料）噪点
#参数：（图片信息，含糊值）imgviewx=cv2.medianBlur(imgviewx,9)

#一般高斯含糊
#参数：（图片信息，参数 1，参数 2）参数 1 和参数 2 只能设置一个
imgviewx=cv2.GaussianBlur(imgviewx,(0,0),1)

#保留边缘（像素差），高斯含糊
#参数（图片信息，0，要用怎么的形式（越大则越细），空间复杂度（越大越简单））imgviewx=cv2.bilateralFilter(imgviewx,0,50,6)

3、PIL

PIL 罕用到的类有：Image、ImageFilter 和 ImageEnhance
图像的读写

from PIL import Image
im = Image.open("1.png")
im.show()

# 打印图片属性
print(im.format, im.size, im.mode)

# format 属性定义了图像的格局，如果图像不是从文件关上的，那么该属性值为 None；# size 属性是一个 tuple，示意图像的宽和高（单位为像素）；# mode 属性为示意图像的模式，罕用的模式为：L 为灰度图，RGB 为真彩色，CMYK 为 pre-press 图像。im.save("c:"，"jpeg")
# 能够用来转换图像格式

图像色调控件转换

#convert() 是图像实例对象的一个办法，承受一个 mode 参数，用以指定一种色调模式，mode 的取值能够是如下几种：#· 1     (1-bit pixels, black and white,) 
#· L     (8-bit pixels, black and white) 
#· P     (8-bit pixels, mapped to any other mode using a colour palette) 
#· RGB   (3x8-bit pixels, true colour)  
#· CMYK  (4x8-bit pixels, colour separation) 
#· F     (32-bit floating point pixels)

im = Image.open('1.png').convert('L')

图像 size

#im.resize(size, filter) ⇒ image
#变量 size 是所要求的尺寸，是一个二元组：（width, height）。#变量 filter 为 NEAREST、BILINEAR、BICUBIC 或者 ANTIALIAS 之一。如果疏忽，或者图像模式为“1”或者“P”，该变量设置为 #NEAREST。在以后的版本中 bilinear 和 bicubic 滤波器不能很好地适应大比例的下采样（例如生成缩略图）。用户须要应用#ANTIALIAS，除非速度比品质更重要。from PIL import Image
im = Image.open("3d.jpg")
region = im.resize((400, 400))     ## 从新设定大小
region.show()

图像处理

from PIL import Image, ImageFilter 
im = Image.open(‘1.png’) # 高斯含糊 
im.filter(ImageFilter.GaussianBlur) # 一般含糊 
im.filter(ImageFilter.BLUR) # 边缘增强 
im.filter(ImageFilter.EDGE_ENHANCE) # 找到边缘 
im.filter(ImageFilter.FIND_EDGES) # 浮雕 
im.filter(ImageFilter.EMBOSS) # 轮廓 
im.filter(ImageFilter.CONTOUR) # 锐化 
im.filter(ImageFilter.SHARPEN) # 平滑 
im.filter(ImageFilter.SMOOTH) # 细节 
im.filter(ImageFilter.DETAIL)

正文完