关于python:Python小技巧教你用Python在Excel里画画

4次阅读

共计 4065 个字符,预计需要花费 11 分钟才能阅读完成。

之前看到过很多头条,说哪国某人保持了多少年自学应用 excel 画画,成果非常惊艳。
对于他们的急躁我非常钦佩。
然而作为一个程序员,天然也得挑战一下本人。
这种需要,咱们十分钟就能够实现!

image.png

基本思路

实现这个需要的基本思路是读取这张图片每一个像素的色调值,而后给 excel 里的每一个单元格填充上色彩。所以次要用到的是 PIL、openpyxl 这两个库。

PIL 应用

PIL 是 Python 外面做图像处理的时候非常罕用的一个库,性能也是非常的弱小,这里只须要用到 PIL 里一小部分的性能。

from PIL import Image
img = Image.open(img_path) # 读取图片
width, height = img.size # 获取图片大小
r, g, b = img.getpixel((w - 1, h - 1)) # 获取像素色调值

Image.open() 是 PIL 外面关上一张图片的函数,反对多种图片类型
img\_path 是图片门路,能够是相对路径,也能够是绝对路径
img.size 是获取图片的 size 属性,蕴含图片的宽和高
img.getpixel() 是获取图片色调值的函数,需传入一个 tuple 或 list,值为像素坐标 xy

openpyxl 应用

openpyxl 简直是 Python 里性能最全的操作 excel 文件的库了,这里也只须要用到它的一小部分性能。

import openpyxl
from openpyxl.styles import fills

workbook = openpyxl.Workbook()
worksheet = workbook.active
cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)
workbook.save(out_file)

openpyxl.Workbook() 新建一个 excel 文件
workbook.active 激活一个工作表
cell.fill = fills.PatternFill(fill\_type=”solid”, fgColor=hex\_rgb) 填充一个单元格,fill\_type=”solid” 是填充类型,fgColor=hex\_rgb 是填充的色彩
workbook.save() 保留文件,需传入要保留的文件名

写一段代码

写这一个画图的需要须要用到的外围就是下面介绍的 PIL 跟 openpyxl 的几种用法。然而在理论写的时候,还会有一些其余问题,比方:

1.getpixel() 获取的色彩值是 rgb 十进制的,但 fills.PatternFill 里的 fgColor\` 参数接管到的色彩值是十六进制的值

这个问题其实就是十进制转十六进制,很容易解决

def int_to_16(num):
    num1 = hex(num).replace('0x', '')
    num2 = num1 if len(num1) > 1 else '0' + num1 # 位数只有一位的时候在后面补零
    return num2

2.excel 的单元格默认是长方形,批改为正方形才不会使图片变形

if h == 1:
  _w = cell.column
  _h = cell.col_idx
  # 调整列宽
  worksheet.column_dimensions[_w].width = 1

# 调整行高
worksheet.row_dimensions[h].height = 6
 这里用到了双重 for 循环,外层是 `width`,里层是 `height`,是一列一列的填充色彩,因而判断 `if h == 1`,防止屡次调整列宽。

3.excel 反对的款式数量无限

这个问题比较严重。如果间接对高清大图进行操作,最初输入的 excel 文件在关上的时候,可能会提醒咱们文件有问题,须要主动修复。

然而等它修复实现之后,会发现填充的所有色彩都隐没了!

报错信息

一开始认为是应用的行列数过多了起因。

查问材料后发现,13 版 excel 反对的大行数是 1048576,最大列数是 16384,咱们应用的单元格数量还远没达到限度。

在通过更换图片、更换 excel 版本,批改代码等不充沛各种测试,才找到问题的起因所在。

原来是因为,excel 的原形是由多个 xml 文件,填充的色彩都存储在一个 style.xml 文件外面,当这个文件过大就会导致关上的时候报错。

所以为了解决这个问题,有两个解决方案,第一是放大图片,第二是缩小图片色彩。放大图片的时候自带缩小图片色彩的性能,缩小图片色彩的办法能够采纳灰度化、二值化等办法。

总体上来讲,就是须要管制色彩数量 * 单元格数 < 阈值(3300w 左右 )。

MAX_WIDTH = 300
MAX_HEIGHT = 300
def resize(img):
    w, h = img.size
    if w > MAX_WIDTH:
        h = MAX_WIDTH / w * h
        w = MAX_WIDTH

    if h > MAX_HEIGHT:
        w = MAX_HEIGHT / h * w
        h = MAX_HEIGHT
    return img.resize((int(w), int(h)), Image.ANTIALIAS)

最终成果

苍天不负有心人,关上最初输入的 excel 曾经能够看到成果了!

所以说,所有能用 Python 解决的问题,最终都会用 Python 来解决。

全副代码

# draw_excel.py

from PIL import Image
import openpyxl
from openpyxl.styles import fills
import os

MAX_WIDTH = 300
MAX_HEIGHT = 300

def resize(img):
    w, h = img.size
    if w > MAX_WIDTH:
        h = MAX_WIDTH / w * h
        w = MAX_WIDTH

    if h > MAX_HEIGHT:
        w = MAX_HEIGHT / h * w
        h = MAX_HEIGHT
    return img.resize((int(w), int(h)), Image.ANTIALIAS)


def int_to_16(num):
    num1 = hex(num).replace('0x', '')
    num2 = num1 if len(num1) > 1 else '0' + num1
    return num2


def draw_jpg(img_path):

    img_pic = resize(Image.open(img_path))
    img_name = os.path.basename(img_path)
    out_file = './result/' + img_name.split('.')[0] + '.xlsx'
    if os.path.exists(out_file):
        os.remove(out_file)

    workbook = openpyxl.Workbook()
    worksheet = workbook.active

    width, height = img_pic.size

    for w in range(1, width + 1):

        for h in range(1, height + 1):
            if img_pic.mode == 'RGB':
                r, g, b = img_pic.getpixel((w - 1, h - 1))
            elif img_pic.mode == 'RGBA':
                r, g, b, a = img_pic.getpixel((w - 1, h - 1))

            hex_rgb = int_to_16(r) + int_to_16(g) + int_to_16(b)

            cell = worksheet.cell(column=w, row=h)

            if h == 1:
                _w = cell.column
                _h = cell.col_idx
                # 调整列宽
                worksheet.column_dimensions[_w].width = 1
            # 调整行高
            worksheet.row_dimensions[h].height = 6

            cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)

        print('write in:', w, '|  all:', width + 1)
    print('saving...')
    workbook.save(out_file)
    print('success!')

if __name__ == '__main__':
    draw_jpg('mona-lisa.jpg')


=

下面说到 色彩数量 * 单元格数 < 阈值(2564 左右 ) 的时候,可能有人会有纳闷,这个 2564 是怎么来的。

这个当然是我测试脱口而出得来的。

既然是有色彩数量跟单元格数这两个变量,那么天然要有两个测试方法以上。一个察看色彩数量,一个察看单元格数。

但我在这里只做了色彩数量的一个测试。(最大的起因就是生成上万行 * 上万列的 excel 切实是太久了 … 懒 …)

    count = 0
    MAX_WIDTH = 255
    for w in range(1, MAX_WIDTH + 1):
        for h in range(1, MAX_WIDTH + 1):
            cell = worksheet.cell(column=w, row=h)
            if h == 1:
                _w = cell.column
                _h = cell.col_idx
                # 调整列宽
                worksheet.column_dimensions[_w].width = 1
            # 调整行高
            worksheet.row_dimensions[h].height = 6

            if count < 255 ** 3:
                back = int_to_16(num=count)
                back = '0' * (6 - len(back)) + back
            else:
                back = ''.join([int_to_16(random.randint(0, 255)) for _ in range(3)])
            cell.fill = fills.PatternFill(fill_type="solid", fgColor=back)
            count += 1

count 是记录色彩的变量,确保每一个色彩都不反复,但目前计算机 RGB 示意的色彩最多只有 256^3 种
通过调整 MAX\_WIDTH 的值来测试 excel 的阈值

最初生成的测试 excel 如下:

… 还有点难看。!??

最初

因为精力有限,~ 懒~,能力也无限 ~ 菜~,所以没有测试繁多色彩的,也可能有其余的办法能没有这个阈值的限度。

正文完
 0