关于python:实用的-Python-自动化办公技巧

本文就给大家介绍几个我用到的办公室自动化技巧：
1、Word 文档 doc 转 docx
去年想参赛一个数据较量, 外面的数据都是 doc 格局, 想用 python-docx 读取 word 文件中的数据, 然而 python-docx 只反对 docx 格局, 所以钻研了这两种格局的转换。
1.1 导入工具包

import os

from win32com import client as wc
1.2 获取文件夹上面所有 doc 文件明细

path=”C:/Users/yyz/Desktop/python 办公技巧 /data/doc 转 docx/” # 依据本人电脑文件批改

files = []

for file in os.listdir(path):

if file.endswith(".doc"):

    files.append(path+file)

files

1.3 转换文件

word = wc.Dispatch(“Word.Application”)

i = 0

for file in files:

try:

    doc = word.Documents.Open(file)    #关上 word 文件

    doc.SaveAs("{}x".format(file), 12)   #另存为后缀为 ".docx" 的文件，其中参数 12 指 docx 文件

    doc.Close()  #敞开原来 word 文件

    print(file +': 转换胜利')

    i +=1

except:

    print(file +': 转换[不胜利]')   

    files.append(file)  # 若读取文件报错, 则将文件名称增加到 files 列表中从新读取

    pass

print(‘ 转换文件 %i 个 ’%i)

word.Quit()

2、文字地址批量转经纬度
工作中地址转经纬度会用在做地图可视化或者计算间隔方面。
2.1 导入工具包

import pandas as pd

import json

from urllib.request import urlopen, quote

import requests
2.2 定义转换函数

def getlnglat(address):

url = 'http://api.map.baidu.com/geocoding/v3/'

output = 'json'

ak = "本人申请的 api"   # 百度地图 API, 须要本人申请

address = quote(address) # 因为本文地址变量为中文，为避免乱码，先用 quote 进行编码

uri = url + '?' + 'address=' + address  + '&output=' + output + '&ak=' + ak  +'&callback=showLocation%20'+'//GET%E8%AF%B7%E6%B1%82'

res=requests.get(uri).text

temp = json.loads(res) # 将字符串转化为 json

lat = temp['result']['location']['lat']

lng = temp['result']['location']['lng']

return lng, lat   # 经度 longitude, 纬度 latitude,

2.3 地址转换
2.3.1 单个地址转换

getlnglat(‘ 北京市朝阳区高碑店地区办事处高井村委会 ’)

(116.52784003604923, 39.91806508560947)
2.3.2 批量地址转换

data = pd.read_excel(‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 地址信息.xlsx’)

data

data[‘ 经度 ’] = ”

data[‘ 纬度 ’] = ”

for i in range(data.shape[0]):

try:

    data.iloc[i,2] = getlnglat(data.iloc[i,1])[0] # 经度 将第 i 行, 第 2 列的地址 (列索引为 1) 转换为经纬度, 并将经度赋值给第 i 行, 第 3 列(列索引为 2)

    data.iloc[i,3] = getlnglat(data.iloc[i,1])[1] # 纬度

except:

    pass

#print(i)

data

3、经纬度计算间隔
装置工具包
pip install geopy
3.1 导入工具包
from geopy.distance import geodesic
3.2 读取数据

data = pd.read_excel(‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 经纬度计算间隔.xlsx’)

data

3.3 计算间隔

wd1 = data[‘ 纬度 1 ’].tolist()

jd1 = data[‘ 经度 1 ’].tolist()

wd2 = data[‘ 纬度 2 ’].tolist()

jd2 = data[‘ 经度 2 ’].tolist()

lis1 = []

for i in range(len(data)):

j= geodesic((wd1[i],jd1[i]), (wd2[i],jd2[i])).km   # 纬度 经度  纬度 经度

lis1.append(j)

#print(i)

data[‘ 间隔 ’] = lis1

data

4、百度经纬度转高德经纬度
公司有 2 个零碎, 用的坐标系不一样, 有时候须要转换一下
4.1 工具包

import math

import pandas as pd
4.2 定义函数

def bdToGaoDe(lon,lat):

PI = 3.14159265358979324 * 3000.0 / 180.0

x = lon - 0.0065

y = lat - 0.006

z = math.sqrt(x * x + y * y) - 0.00002 * math.sin(y * PI)

theta = math.atan2(y, x) - 0.000003 * math.cos(x * PI)

lon = z * math.cos(theta)

lat = z * math.sin(theta)

return lon,lat

4.3 单个转换

bdToGaoDe(116.512885, 39.847469)

(116.50647396357492, 39.84120409781157)
4.4 批量转换

data = pd.read_excel(‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 百度经纬度转高德.xlsx’)

data.head()

wd = data[‘ 纬度 ’].tolist()

jd = data[‘ 经度 ’].tolist()

li1 = []

for i in range(len(data)):

j  = bdToGaoDe(jd[i],wd[i])

li1.append(j)

li1

data[‘ 经度_re’] = [i[0] for i in li1]

data[‘ 纬度_re’] = [i[1] for i in li1]

data.head()

5、Excel 文件批量合并
5.1 工具包

import pandas as pd

import os
5.2 获取文件列表

path = ‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 数据合并 /’

files = []

for file in os.listdir(path):

if file.endswith(".xlsx"):

    files.append(path+file)

files
5.3 转换存储数据

data = pd.DataFrame()

for file in files:

datai = pd.read_excel(file)

datai_len = len(datai)

data = data.append(datai)   # 增加到总的数据中

print('读取 %i 行数据, 合并后文件 %i 列, 名称：%s'%(datai_len,len(data.columns),file.split('/')[-1]))     

# 查看是否全副读取，格局是否出错

data.reset_index(drop=True,inplace=True)

6、Word 文件批量转 pdf
只能转 docx 文件, 转 doc 文件会报错, 工具包装置
pip install docx2pdf
6.1 导入工具包

from docx2pdf import convert

import os
6.2 单个转换

convert(“c:/users/yyz/desktop/ 魔方公式.docx”, “c:/users/yyz/desktop/excel 笔记.pdf”)
6.3 批量转换

path = ‘C:/Users/yyz/Desktop/python 办公技巧 /data/word 转 pdf/’

files = []

for file in os.listdir(path):

if file.endswith(".docx"):

    files.append(path+file)

files

for file in files:

convert(file,file.split(‘.’)[0]+’.pdf’)

print(file+’ 转换胜利 ’)

7、批量读取 word 中表格数据
工具包装置
pip install python-docx

doc = docx.Document(‘C:/Users/yyz/Desktop/python 办公技巧 /data/word 信息.docx’)

biaoges = doc.tables

7.2 不标准的表格

cells = biaoges[1]._cells

cells_lis = [[cell.text for cell in cells]]

import pandas as pd

import numpy as np

datai = pd.DataFrame(cells_lis)

datai = datai[[1,3,7,9,14,16,19,21]]

datai.columns = [‘ 姓名 ’,’ 年龄 ’,’ 籍贯 ’,’ 住址 ’,’ 工作单位 ’,’ 电话 ’,’ 是否党员 ’,’ 出生日期 ’]

datai

7.3 标准数据

rowi = len(biaoges[0].rows)

rowi

lis1 = []

for i in range(1,rowi): # 从第 2 行开始循环

lis1.append([biaoges[0].cell(i,0).text,

             biaoges[0].cell(i,1).text,

             biaoges[0].cell(i,2).text,

             biaoges[0].cell(i,3).text,

             biaoges[0].cell(i,4).text])

data1 = pd.DataFrame(lis1,columns=[‘ 日期 ’,’ 品类 ’,’ 数量 ’,’ 价格 ’,’ 金额 ’])

data1

7.4 批量读取

import pandas as pd

import os

os.chdir(‘C:/Users/yyz/Desktop/python 办公技巧 /data/word 信息 /’)

lis1=[]

for file in os.listdir(‘.’):

if file.endswith('.docx'):

    doc = docx.Document('./'+file)

    biaoges = doc.tables

    rowi = len(biaoges[0].rows)

    for i in range(1,rowi):

        lis1.append([biaoges[0].cell(i,0).text,

                 biaoges[0].cell(i,1).text,

                 biaoges[0].cell(i,2).text,

                 biaoges[0].cell(i,3).text,

                 biaoges[0].cell(i,4).text])

data1 = pd.DataFrame(lis1,columns=[‘ 日期 ’,’ 品类 ’,’ 数量 ’,’ 价格 ’,’ 金额 ’])

data1

8 用 outlook 批量发邮件
8.1 导入工具包

import win32com.client as win32

import pandas as pd
8.2 读取数据

data1 = pd.read_excel(‘C:/Users/yyz/Desktop/python 批量发送邮件.xlsx’,sheet_name=’ 发送邮件 ’)

data1.fillna(”,inplace=True)
8.3 发送邮件

outlook = win32.Dispatch(“outlook.Application”)

for i in range(data1.shape[0]):

mail = outlook.CreateItem(0)   # 创立一个邮件对象  win32.constants.olMailItem

mail.To = data1.iloc[i,0]      #收件人

mail.CC = data1.iloc[i,1]      #抄送人

mail.Subject = data1.iloc[i,2]    #邮件主题

mail.HTMLBody = data1.iloc[i,3]           # 邮件注释 html 格局

# mail.Body = data1.iloc[i,3] # 邮件注释

mail.Attachments.Add(data1.iloc[i,4])     # 附件

mail.Send() #发送

i +=1

print(‘ 发送邮件 %i 份 ’%i)
python 办公自动化的技巧还有很多, python 好把握，能帮忙咱们晋升工作效率，这也是很多非编程人员学习 python 的起因之一。本文就给大家介绍几个我用到的办公室自动化技巧：
1、Word 文档 doc 转 docx
去年想参赛一个数据较量, 外面的数据都是 doc 格局, 想用 python-docx 读取 word 文件中的数据, 然而 python-docx 只反对 docx 格局, 所以钻研了这两种格局的转换。
1.1 导入工具包
import os
from win32com import client as wc
1.2 获取文件夹上面所有 doc 文件明细

path=”C:/Users/yyz/Desktop/python 办公技巧 /data/doc 转 docx/” # 依据本人电脑文件批改

files = []
for file in os.listdir(path):

if file.endswith(".doc"):
    files.append(path+file)

files

1.3 转换文件

word = wc.Dispatch(“Word.Application”)

i = 0
for file in files:

try:
    doc = word.Documents.Open(file)    #关上 word 文件
    doc.SaveAs("{}x".format(file), 12)   #另存为后缀为 ".docx" 的文件，其中参数 12 指 docx 文件
    doc.Close()  #敞开原来 word 文件
    print(file +': 转换胜利')
    i +=1
except:
    print(file +': 转换[不胜利]')   
    files.append(file)  # 若读取文件报错, 则将文件名称增加到 files 列表中从新读取
    pass

print(‘ 转换文件 %i 个 ’%i)

word.Quit()

2、文字地址批量转经纬度
工作中地址转经纬度会用在做地图可视化或者计算间隔方面。
2.1 导入工具包

import pandas as pd
import json
from urllib.request import urlopen, quote
import requests
2.2 定义转换函数

def getlnglat(address):

url = 'http://api.map.baidu.com/geocoding/v3/'
output = 'json'
ak = "本人申请的 api"   # 百度地图 API, 须要本人申请
address = quote(address) # 因为本文地址变量为中文，为避免乱码，先用 quote 进行编码
uri = url + '?' + 'address=' + address  + '&output=' + output + '&ak=' + ak  +'&callback=showLocation%20'+'//GET%E8%AF%B7%E6%B1%82'
res=requests.get(uri).text
temp = json.loads(res) # 将字符串转化为 json
lat = temp['result']['location']['lat']
lng = temp['result']['location']['lng']
return lng, lat   # 经度 longitude, 纬度 latitude,

2.3 地址转换
2.3.1 单个地址转换

getlnglat(‘ 北京市朝阳区高碑店地区办事处高井村委会 ’)
(116.52784003604923, 39.91806508560947)
2.3.2 批量地址转换

data = pd.read_excel(‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 地址信息.xlsx’)
data
data[‘ 经度 ’] = ”
data[‘ 纬度 ’] = ”
for i in range(data.shape[0]):

try:
    data.iloc[i,2] = getlnglat(data.iloc[i,1])[0] # 经度 将第 i 行, 第 2 列的地址 (列索引为 1) 转换为经纬度, 并将经度赋值给第 i 行, 第 3 列(列索引为 2)
    data.iloc[i,3] = getlnglat(data.iloc[i,1])[1] # 纬度
except:
    pass
#print(i)

data
3、经纬度计算间隔
装置工具包
pip install geopy

3.1 导入工具包
from geopy.distance import geodesic

3.2 读取数据

data = pd.read_excel(‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 经纬度计算间隔.xlsx’)
data

3.3 计算间隔

wd1 = data[‘ 纬度 1 ’].tolist()
jd1 = data[‘ 经度 1 ’].tolist()
wd2 = data[‘ 纬度 2 ’].tolist()
jd2 = data[‘ 经度 2 ’].tolist()

lis1 = []
for i in range(len(data)):

j= geodesic((wd1[i],jd1[i]), (wd2[i],jd2[i])).km   # 纬度 经度  纬度 经度
lis1.append(j)
#print(i)

data[‘ 间隔 ’] = lis1
data

4、百度经纬度转高德经纬度
公司有 2 个零碎, 用的坐标系不一样, 有时候须要转换一下
4.1 工具包

import math
import pandas as pd
4.2 定义函数

def bdToGaoDe(lon,lat):

PI = 3.14159265358979324 * 3000.0 / 180.0
x = lon - 0.0065
y = lat - 0.006
z = math.sqrt(x * x + y * y) - 0.00002 * math.sin(y * PI)
theta = math.atan2(y, x) - 0.000003 * math.cos(x * PI)
lon = z * math.cos(theta)
lat = z * math.sin(theta)
return lon,lat

4.3 单个转换

bdToGaoDe(116.512885, 39.847469)
(116.50647396357492, 39.84120409781157)
4.4 批量转换

data = pd.read_excel(‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 百度经纬度转高德.xlsx’)
data.head()
wd = data[‘ 纬度 ’].tolist()
jd = data[‘ 经度 ’].tolist()

li1 = []
for i in range(len(data)):

j  = bdToGaoDe(jd[i],wd[i])
li1.append(j)

li1
data[‘ 经度_re’] = [i[0] for i in li1]
data[‘ 纬度_re’] = [i[1] for i in li1]
data.head()
5、Excel 文件批量合并
5.1 工具包

import pandas as pd
import os
5.2 获取文件列表

path = ‘C:/Users/yyz/Desktop/python 办公技巧 /data/ 数据合并 /’

files = []
for file in os.listdir(path):

if file.endswith(".xlsx"):
    files.append(path+file)

files
5.3 转换存储数据

data = pd.DataFrame()

for file in files:

datai = pd.read_excel(file)
datai_len = len(datai)
data = data.append(datai)   # 增加到总的数据中
print('读取 %i 行数据, 合并后文件 %i 列, 名称：%s'%(datai_len,len(data.columns),file.split('/')[-1]))     
# 查看是否全副读取，格局是否出错

data.reset_index(drop=True,inplace=True)

6、Word 文件批量转 pdf
只能转 docx 文件, 转 doc 文件会报错, 工具包装置
pip install docx2pdf

6.1 导入工具包

from docx2pdf import convert
import os
6.2 单个转换

convert(“c:/users/yyz/desktop/ 魔方公式.docx”, “c:/users/yyz/desktop/excel 笔记.pdf”)
6.3 批量转换

path = ‘C:/Users/yyz/Desktop/python 办公技巧 /data/word 转 pdf/’

files = []
for file in os.listdir(path):

if file.endswith(".docx"):
    files.append(path+file)

files
for file in files:
convert(file,file.split(‘.’)[0]+’.pdf’)
print(file+’ 转换胜利 ’)

7、批量读取 word 中表格数据
工具包装置
pip install python-docx

doc = docx.Document(‘C:/Users/yyz/Desktop/python 办公技巧 /data/word 信息.docx’)

biaoges = doc.tables
7.2 不标准的表格
cells = biaoges[1]._cells
cells_lis = [[cell.text for cell in cells]]
import pandas as pd
import numpy as np
datai = pd.DataFrame(cells_lis)
datai = datai[[1,3,7,9,14,16,19,21]]
datai.columns = [‘ 姓名 ’,’ 年龄 ’,’ 籍贯 ’,’ 住址 ’,’ 工作单位 ’,’ 电话 ’,’ 是否党员 ’,’ 出生日期 ’]
datai

7.3 标准数据

rowi = len(biaoges[0].rows)
rowi

lis1 = []

for i in range(1,rowi): # 从第 2 行开始循环

lis1.append([biaoges[0].cell(i,0).text,
             biaoges[0].cell(i,1).text,
             biaoges[0].cell(i,2).text,
             biaoges[0].cell(i,3).text,
             biaoges[0].cell(i,4).text])

data1 = pd.DataFrame(lis1,columns=[‘ 日期 ’,’ 品类 ’,’ 数量 ’,’ 价格 ’,’ 金额 ’])
data1

7.4 批量读取
import pandas as pd
import os
os.chdir(‘C:/Users/yyz/Desktop/python 办公技巧 /data/word 信息 /’)
lis1=[]
for file in os.listdir(‘.’):

if file.endswith('.docx'):
    doc = docx.Document('./'+file)
    biaoges = doc.tables
    rowi = len(biaoges[0].rows)
    for i in range(1,rowi):
        lis1.append([biaoges[0].cell(i,0).text,
                 biaoges[0].cell(i,1).text,
                 biaoges[0].cell(i,2).text,
                 biaoges[0].cell(i,3).text,
                 biaoges[0].cell(i,4).text])

data1 = pd.DataFrame(lis1,columns=[‘ 日期 ’,’ 品类 ’,’ 数量 ’,’ 价格 ’,’ 金额 ’])
data1
8 用 outlook 批量发邮件
8.1 导入工具包
import win32com.client as win32
import pandas as pd
8.2 读取数据

data1 = pd.read_excel(‘C:/Users/yyz/Desktop/python 批量发送邮件.xlsx’,sheet_name=’ 发送邮件 ’)
data1.fillna(”,inplace=True)
8.3 发送邮件

outlook = win32.Dispatch(“outlook.Application”)

for i in range(data1.shape[0]):

mail = outlook.CreateItem(0)   # 创立一个邮件对象  win32.constants.olMailItem
mail.To = data1.iloc[i,0]      #收件人
mail.CC = data1.iloc[i,1]      #抄送人
mail.Subject = data1.iloc[i,2]    #邮件主题
mail.HTMLBody = data1.iloc[i,3]           # 邮件注释 html 格局

# mail.Body = data1.iloc[i,3] # 邮件注释

mail.Attachments.Add(data1.iloc[i,4])     # 附件
mail.Send() #发送
i +=1

print(‘ 发送邮件 %i 份 ’%i)
python 办公自动化的技巧还有很多, python 好把握，能帮忙咱们晋升工作效率，这也是很多非编程人员学习 python 的起因之一。

门路

定义空 list, 寄存文件绝对路径

运行 word 程序

for 循环

退出 word

导入工具包

定义函数

单个地址转换

读取数据

读取数据

将经纬度赋值给变量, 简化

导入工具包

定义转换函数

单个转换

读取数据

定义一个空列表

导入工具包

设置文件门路

空列表, 用于寄存文件门路

查看列表

定义一个空的 dataframe

遍历所有文件

重置索引

装置工具包:

导入工具包

单个转换

文件地位

定义空 list, 寄存文件列表

读取 word 文件

获取文档中所有表格对象的列表

获取第 1 个表格行丨

定义空列表

for 循环获取第一个表的数据

创立一个 dataframe

创立 dataframe

读取数据

运行 outlook

for 循环发送文件

门路

定义空 list, 寄存文件绝对路径

运行 word 程序

for 循环

退出 word

导入工具包

定义函数

单个地址转换

读取数据

读取数据

将经纬度赋值给变量, 简化

导入工具包

定义转换函数

单个转换

读取数据

定义一个空列表

导入工具包

设置文件门路

空列表, 用于寄存文件门路

查看列表

定义一个空的 dataframe

遍历所有文件

重置索引

装置工具包:

导入工具包

单个转换

文件地位

定义空 list, 寄存文件列表

读取 word 文件

获取文档中所有表格对象的列表

获取第 1 个表格行丨

定义空列表

for 循环获取第一个表的数据

创立一个 dataframe

创立 dataframe

读取数据

运行 outlook

for 循环发送文件