前言
大家好,我是查理。
想必各位小伙伴都经验过,当你想要把 PDF 转为 WORD 时,几个大字赫然甩在你眼前:
不充钱就想白嫖??想得美~
然而,查理是这么轻易像资本抬头的吗?毕竟迎难而上才是咱们的传统美德。于是,明天的主题进去了:用 python 写一个 PDF 转 WORD 的小工具(基于某网站接口)。
一、思路剖析
网上一搜,你能够发现很多 PDF 转换的工具,其中不乏在线转换的网站,比方这样的:
然而呢,这样的在线网站个别不是广告特多,就是效率低,有的甚至都打不开。
我马上想到,既然有 Python 在手,何不如间接间接写一个呢?
那么,通过网站提供的测试接口,咱们便能够通过爬虫模仿的形式实现转换。
没有错了~ 思路就是如此的简单明了,明天的配角便是:
https://app.xunjiepdf.com
通过抓包剖析,晓得这是一个 POST 申请,接下来用 requests 库模仿即可。 须要留神的是,这个接口仅用于测试,所以可供转换的页面等都有所限度,如需更残缺的性能还请反对原版。
二、我的代码
正所谓一万个 coders,就有一万种 codes,以下为我的代码,仅供参考。
导入相干库:
import time
定义 PDF2Word 类:
class PDF2Word():
执行主函数:
if __name__=='__main__':
留神:convertPDF 函数有两个参数,第一个为须要转换的 PDF,第二个参数为转换后的目录。
run 一下,一键入魂,”.docx” 文件曾经躺在了我的目录中,难受了~
写在最初
无论如何,最初非常感谢大家点击观看我的文章,如过对你有帮忙烦请抬抬小手给小编点点赞。有任何问题或者须要文章内的材料能够后盾私信我,欢送“骚扰”。