python爬虫-requests与bs4获得所有炉石传说卡背

作者：

在

太简单了就当做个记录，直接贴代码了
import os
import requests
from bs4 import BeautifulSoup
import time
# 发送请求
def send():
r = requests.get(url=base_url)
# 设置编码防止乱码
r.encoding =”GBK”;
content = r.text
parseAndSave(content)
# 解析页面和保存数据
def parseAndSave(html):
soup = BeautifulSoup(html, ‘lxml’)
ulList = soup.find_all(‘ul’, attrs={‘class’: ‘kzlist’})
# print(ulList);
for ul in ulList:
li = ul.find_all(‘li’);
for item in li:
name = item.find(‘img’).next_sibling
obtain_method = item.find(‘a’).find(‘p’).text
rootDir = os.getcwd()
if not os.path.exists(name):
os.mkdir(name);
os.chdir(name);
src = item.find(‘a’).find(‘img’)[‘src’]
pic = requests.get(src)
with open(‘pic.jpg’, ‘wb’) as fw:
fw.write(pic.content)
with open(‘info.txt’, ‘a+’) as fw:
fw.write(name+’\n’)
fw.write(obtain_method)
os.chdir(rootDir);
def main():
start_time = time.time()
send()
end_time = time.time()
print(‘程序用时：’,(end_time – start_time))
if __name__ == ‘__main__’:
base_url = ‘http://news.4399.com/gonglue/lscs/kabei/’
cardList = []
main()

python requests

发表回复取消回复

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理。

python爬虫-requests与bs4获得所有炉石传说卡背

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

python爬虫-requests与bs4获得所有炉石传说卡背

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复