共计 5970 个字符,预计需要花费 15 分钟才能阅读完成。
每天你都可能会执行许多反复的工作,例如浏览新闻、发邮件、查看天气、关上书签、清理文件夹等等,应用自动化脚本,就无需手动一次又一次地实现这些工作,十分不便。而在某种程度上,Python 就是自动化的代名词。
明天分享 6 个十分有用的 Python 自动化脚本。喜爱记得珍藏、关注、点赞。
注:文末提供技术交换群
1、自动化浏览网页新闻
这个脚本可能实现从网页中抓取文本,而后自动化语音朗诵,当你想听新闻的时候,这是个不错的抉择。
代码分为两大部分,第一通过爬虫抓取网页文本呢,第二通过浏览工具来朗诵文本。
须要的第三方库:
Beautiful Soup – 经典的 HTML/XML 文本解析器,用来提取爬下来的网页信息
requests – 好用到逆天的 HTTP 工具,用来向网页发送申请获取数据
Pyttsx3 – 将文本转换为语音,并管制速率、频率和语音
————————————————
import pyttsx3
import requests
from bs4 import BeautifulSoup
engine = pyttsx3.init('sapi5')
voices = engine.getProperty('voices')
newVoiceRate = 130 ## Reduce The Speech Rate
engine.setProperty('rate',newVoiceRate)
engine.setProperty('voice', voices[1].id)
def speak(audio):
engine.say(audio)
engine.runAndWait()
text = str(input("Paste article\n"))
res = requests.get(text)
soup = BeautifulSoup(res.text,'html.parser')
articles = []
for i in range(len(soup.select('.p'))):
article = soup.select('.p')[i].getText().strip()
articles.append(article)
text = " ".join(articles)
speak(text)
# engine.save_to_file(text, 'test.mp3') ## If you want to save the speech as a audio file
engine.runAndWait()
2、自动化数据摸索
数据摸索是数据迷信我的项目的第一步,你须要理解数据的根本信息能力进一步剖析更深的价值。
个别咱们会用 pandas、matplotlib 等工具来摸索数据,但须要本人编写大量代码,如果想提高效率,Dtale 是个不错的抉择。
Dtale 特点是用一行代码生成自动化剖析报告,它联合了 Flask 后端和 React 前端,为咱们提供了一种查看和剖析 Pandas 数据结构的简便办法。
咱们能够在 Jupyter 上实用 Dtale。
须要的第三方库:
Dtale – 主动生成剖析报告
————————————————
### Importing Seaborn Library For Some Datasets
import seaborn as sns
### Printing Inbuilt Datasets of Seaborn Library
print(sns.get_dataset_names())
### Loading Titanic Dataset
df=sns.load_dataset('titanic')
### Importing The Library
import dtale
#### Generating Quick Summary
dtale.show(df)
3、主动发送多封邮件
这个脚本能够帮忙咱们批量定时发送邮件,邮件内容、附件也能够自定义调整,十分的实用。
相比拟邮件客户端,Python 脚本的长处在于能够智能、批量、高定制化地部署邮件服务。
须要的第三方库:
Email – 用于治理电子邮件音讯
Smtlib – 向 SMTP 服务器发送电子邮件,它定义了一个 SMTP 客户端会话对象,该对象可将邮件发送到互联网上任何带有 SMTP 或 ESMTP 监听程序的计算机
Pandas – 用于数据分析荡涤地工具
————————————————
import smtplib
from email.message import EmailMessage
import pandas as pd
def send_email(remail, rsubject, rcontent):
email = EmailMessage() ## Creating a object for EmailMessage
email['from'] = 'The Pythoneer Here' ## Person who is sending
email['to'] = remail ## Whom we are sending
email['subject'] = rsubject ## Subject of email
email.set_content(rcontent) ## content of email
with smtplib.SMTP(host='smtp.gmail.com',port=587)as smtp:
smtp.ehlo() ## server object
smtp.starttls() ## used to send data between server and client
smtp.login("deltadelta371@gmail.com","delta@371") ## login id and password of gmail
smtp.send_message(email) ## Sending email
print("email send to",remail) ## Printing success message
if __name__ == '__main__':
df = pd.read_excel('list.xlsx')
length = len(df)+1
for index, item in df.iterrows():
email = item[0]
subject = item[1]
content = item[2]
send_email(email,subject,content)
4、将 PDF 转换为音频文件
脚本能够将 pdf 转换为音频文件,原理也很简略,首先用 PyPDF 提取 pdf 中的文本,而后用 Pyttsx3 将文本转语音。
import pyttsx3,PyPDF2
pdfreader = PyPDF2.PdfFileReader(open('story.pdf','rb'))
speaker = pyttsx3.init()
for page_num in range(pdfreader.numPages):
text = pdfreader.getPage(page_num).extractText() ## extracting text from the PDF
cleaned_text = text.strip().replace('\n',' ') ## Removes unnecessary spaces and break lines
print(cleaned_text) ## Print the text from PDF
#speaker.say(cleaned_text) ## Let The Speaker Speak The Text
speaker.save_to_file(cleaned_text,'story.mp3') ## Saving Text In a audio file 'story.mp3'
speaker.runAndWait()
speaker.stop()
5、从列表中播放随机音乐
这个脚本会从歌曲文件夹中随机抉择一首歌进行播放,须要留神的是 os.startfile 仅反对 Windows 零碎。
import random, os
music_dir = 'G:\\new english songs'
songs = os.listdir(music_dir)
song = random.randint(0,len(songs))
print(songs[song]) ## Prints The Song Name
os.startfile(os.path.join(music_dir, songs[0]))
6、智能天气信息
国家气象局网站提供获取天气预报的 API,间接返回 json 格局的天气数据。所以只须要从 json 里取出对应的字段就能够了。
上面是指定城市 (县、区) 天气的网址,间接关上网址,就会返回对应城市的天气数据。比方:
http://www.weather.com.cn/dat… 上海徐汇区对应的天气网址。
具体代码如下:
————————————————
mport requests
import json
import logging as log
def get_weather_wind(url):
r = requests.get(url)
if r.status_code != 200:
log.error("Can't get weather data!")
info = json.loads(r.content.decode())
# get wind data
data = info['weatherinfo']
WD = data['WD']
WS = data['WS']
return "{}({})".format(WD, WS)
def get_weather_city(url):
# open url and get return data
r = requests.get(url)
if r.status_code != 200:
log.error("Can't get weather data!")
# convert string to json
info = json.loads(r.content.decode())
# get useful data
data = info['weatherinfo']
city = data['city']
temp1 = data['temp1']
temp2 = data['temp2']
weather = data['weather']
return "{} {} {}~{}".format(city, weather, temp1, temp2)
if __name__ == '__main__':
msg = """** 天气揭示 **:
{} {}
{} {}
起源: 国家气象局
""".format(get_weather_city('http://www.weather.com.cn/data/cityinfo/101021200.html'),
get_weather_wind('http://www.weather.com.cn/data/sk/101021200.html'),
get_weather_city('http://www.weather.com.cn/data/cityinfo/101020900.html'),
get_weather_wind('http://www.weather.com.cn/data/sk/101020900.html')
)
print(msg)
运行后果如下所示:
7、长网址变短网址
有时,那些大 URL 变得十分恼火,很难浏览和共享,此脚能够将长网址变为短网址。
import contextlib
from urllib.parse import urlencode
from urllib.request import urlopen
import sys
def make_tiny(url):
request_url = ('http://tinyurl.com/api-create.php?' +
urlencode({'url':url}))
with contextlib.closing(urlopen(request_url)) as response:
return response.read().decode('utf-8')
def main():
for tinyurl in map(make_tiny, sys.argv[1:]):
print(tinyurl)
if __name__ == '__main__':
main()
这个脚本十分实用,比如说有内容平台是屏蔽公众号文章的,那么就能够把公众号文章的链接变为短链接,而后插入其中,就能够实现绕过
8、清理下载文件夹
世界上最凌乱的事件之一是开发人员的下载文件夹,外面寄存了很多横七竖八的文件,此脚本将依据大小限度来清理您的下载文件夹,无限清理比拟旧的文件:
————————————————
import os
import threading
import time
def get_file_list(file_path):
#文件按最初批改工夫排序
dir_list = os.listdir(file_path)
if not dir_list:
return
else:
dir_list = sorted(dir_list, key=lambda x: os.path.getmtime(os.path.join(file_path, x)))
return dir_list
def get_size(file_path):
"""[summary]
Args:
file_path ([type]): [目录]
Returns:
[type]: 返回目录大小,MB
"""
totalsize=0
for filename in os.listdir(file_path):
totalsize=totalsize+os.path.getsize(os.path.join(file_path, filename))
#print(totalsize / 1024 / 1024)
return totalsize / 1024 / 1024
def detect_file_size(file_path, size_Max, size_Del):
"""[summary]
Args:
file_path ([type]): [文件目录]
size_Max ([type]): [文件夹最大大小]
size_Del ([type]): [超过 size_Max 时要删除的大小]
"""
print(get_size(file_path))
if get_size(file_path) > size_Max:
fileList = get_file_list(file_path)
for i in range(len(fileList)):
if get_size(file_path) > (size_Max - size_Del):
print ("del :%d %s" % (i + 1, fileList[i]))
#os.remove(file_path + fileList[i])
技术交换
欢送转载、珍藏、有所播种点赞反对一下!数据、代码能够找我获取