关于图片:python图像的读写

12次阅读

共计 3324 个字符,预计需要花费 9 分钟才能阅读完成。

在做计算机视觉的我的项目过程中,图像的读写是最根底的工作。上面的内容就是对罕用的几个图像处理库的总结:

1、imageio

imageio 是 python 的一个库,提供了简洁的图像读写接口,可能读写大部分格局的图像数据。

import imageio
im = imageio.imread('imageio:chelsea.png')  # read a standard image
imageio.imwrite('~/chelsea-gray.jpg', im[:, :, 0])

还能够读写视频

import imageio
reader = imageio.get_reader('imageio:cockatoo.mp4')
for i, im in enumerate(reader):
    print('Mean of frame %i is %1.1f' % (i, im.mean()))
2、OpenCV opencv- 基础知识 – 参考链接

图像读取和显示

import cv2 #导入 opencv 库
#读取一张图片,地址不能带中文

#第二个参数,取值可为:#cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,疏忽 alpha 通道
#cv2.IMREAD_GRAYSCALE:读入灰度图片
#cv2.IMREAD_UNCHANGED:读入残缺图片,包含 alpha 通道 (png 有,jpg 无)img=cv2.imread("test.jpg",cv2.IMREAD_COLOR)
#img=cv2.imread("test.jpg")
img_gray = cv2.imread("test.jpg", 0)

#显示图片,参数:(窗口标识字符串,imread 读入的图像)cv2.imshow("题目",img)
#窗口期待任意键盘按键输出,0 为始终期待, 其余数字为毫秒数
cv2.waitKey(0)
#销毁窗口,退出程序
cv2.destroyAllWindows()

#一个像素有三个通道,BGR
print(img.shape)# 输入:(1080, 1920, 3) 高像素,宽像素,通道数
print(img.size)# 120000  总通道数 = 高 * 宽 * 通道数
print(img.dtype)# uint8  3 个通道每个通道占的位数(8 位,一个字节)

色调转换

# 将图片由 BGR 转换为灰度
areax=cv2.cvtColor(areax,cv2.COLOR_BGR2GRAY)

图像保留

# 将图片保留,写入到文件
cv2.imwrite("2.jpg",imgviewx)

扭转图像尺寸

cv2.resize() #放大和放大图像
    #参数:#  src: 输出图像对象
     #  dsize:输入矩阵 / 图像的大小,为 0 时计算形式如下:dsize = Size(round(fx*src.cols),round(fy*src.rows))
     #  fx: 程度轴的缩放因子,为 0 时计算形式:(double)dsize.width/src.cols
     #  fy: 垂直轴的缩放因子,为 0 时计算形式:(double)dsize.heigh/src.rows
     #  interpolation:插值算法
     #       cv2.INTER_NEAREST : 最近邻插值法
     #       cv2.INTER_LINEAR   默认值,双线性插值法
     #       cv2.INTER_AREA        基于部分像素的重采样(resampling using pixel area relation)。#       cv2.INTER_CUBIC        基于 4x4 像素邻域的 3 次插值法
     #       cv2.INTER_LANCZOS4     基于 8x8 像素邻域的 Lanczos 插值
 
import cv2
import numpy as np
img = cv2.imread('messi5.jpg')
res = cv2.resize(img,None,fx=2, fy=2, interpolation = cv2.INTER_CUBIC)
#OR
height, width = img.shape[:2]
res = cv2.resize(img,(2*width, 2*height), interpolation = cv2.INTER_CUBIC)
#图像放大两倍

图像处理

# 均值含糊, 次要用于去除图片噪点
#读取图片并实现图片的含糊成果,参数:(读取图片,(X 轴方向含糊,Y 轴方向含糊))imgviewx=cv2.blur(imgviewx,(5,5))

#中值含糊,次要用于去除椒盐(烧烤配料)噪点
#参数:(图片信息,含糊值)imgviewx=cv2.medianBlur(imgviewx,9)

#一般高斯含糊
#参数:(图片信息,参数 1,参数 2)参数 1 和参数 2 只能设置一个
imgviewx=cv2.GaussianBlur(imgviewx,(0,0),1)

#保留边缘(像素差),高斯含糊
#参数(图片信息,0,要用怎么的形式(越大则越细),空间复杂度(越大越简单))imgviewx=cv2.bilateralFilter(imgviewx,0,50,6)
3、PIL

PIL 罕用到的类有:Image、ImageFilter 和 ImageEnhance
图像的读写

from PIL import Image
im = Image.open("1.png")
im.show()

# 打印图片属性
print(im.format, im.size, im.mode)

# format 属性定义了图像的格局,如果图像不是从文件关上的,那么该属性值为 None;# size 属性是一个 tuple,示意图像的宽和高(单位为像素);# mode 属性为示意图像的模式,罕用的模式为:L 为灰度图,RGB 为真彩色,CMYK 为 pre-press 图像。im.save("c:","jpeg")
# 能够用来转换图像格式 

图像色调控件转换

#convert() 是图像实例对象的一个办法,承受一个 mode 参数,用以指定一种色调模式,mode 的取值能够是如下几种:#· 1     (1-bit pixels, black and white,) 
#· L     (8-bit pixels, black and white) 
#· P     (8-bit pixels, mapped to any other mode using a colour palette) 
#· RGB   (3x8-bit pixels, true colour)  
#· CMYK  (4x8-bit pixels, colour separation) 
#· F     (32-bit floating point pixels)

im = Image.open('1.png').convert('L')

图像 size

#im.resize(size, filter) ⇒ image
#变量 size 是所要求的尺寸,是一个二元组:(width, height)。#变量 filter 为 NEAREST、BILINEAR、BICUBIC 或者 ANTIALIAS 之一。如果疏忽,或者图像模式为“1”或者“P”,该变量设置为 #NEAREST。在以后的版本中 bilinear 和 bicubic 滤波器不能很好地适应大比例的下采样(例如生成缩略图)。用户须要应用#ANTIALIAS,除非速度比品质更重要。from PIL import Image
im = Image.open("3d.jpg")
region = im.resize((400, 400))     ## 从新设定大小
region.show()

图像处理

from PIL import Image, ImageFilter 
im = Image.open(‘1.png’) # 高斯含糊 
im.filter(ImageFilter.GaussianBlur) # 一般含糊 
im.filter(ImageFilter.BLUR) # 边缘增强 
im.filter(ImageFilter.EDGE_ENHANCE) # 找到边缘 
im.filter(ImageFilter.FIND_EDGES) # 浮雕 
im.filter(ImageFilter.EMBOSS) # 轮廓 
im.filter(ImageFilter.CONTOUR) # 锐化 
im.filter(ImageFilter.SHARPEN) # 平滑 
im.filter(ImageFilter.SMOOTH) # 细节 
im.filter(ImageFilter.DETAIL)
正文完
 0