共计 1344 个字符,预计需要花费 4 分钟才能阅读完成。
前提
最近我的的敌人浏览一些网站,看到难看的图片,问我有没有方法不必手动一张一张保留图片!
我说用 Jsoup 丫!
关上开发者模式 (F12),找到对应图片的链接,在互联网中,每一张图片就是一个链接!
一、新建 Maven 我的项目,导入 Jsoup 环境依赖
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.11.2</version>
</dependency>
二、代码编写
public class JsoupTest {public static void main(String[] args) throws IOException {
// 爬虫的网站
String url="https://mp.weixin.qq.com/s/caU6d6ebpsLVJaf-7gMjtg";
// 取得网页的 document 对象
Document document = Jsoup.parse(new URL(url), 10000);
// 爬取含图片的代码局部
Element content = document.getElementById("js_content");
// 获取 img 标签代码 这是个汇合
Elements imgs = content.getElementsByTag("img");
// 命名图片的 id
int id=0;
for (Element img : imgs) {
// 获取具体的图片
String pic = img.attr("data-src");
URL target = new URL(pic);
// 获取连贯对象
URLConnection urlConnection = target.openConnection();
// 获取输出流,用来读取图片信息
InputStream inputStream = urlConnection.getInputStream();
// 获取输入流 输入地址 + 文件名
id++;
FileOutputStream fileOutputStream = new FileOutputStream("E:\\JsoupPic\\" + id + ".png");
int len=0;
// 设置一个缓存区
byte[] buffer = new byte[1024 * 1024];
// 写出图片到 E:\JsoupPic 中, 输出流读数据到缓冲区中,并赋给 len
while ((len=inputStream.read(buffer))>0){
// 参数一:图片数据 参数二:起始长度 参数三:终止长度
fileOutputStream.write(buffer, 0, len);
}
System.out.println(id+".png 下载结束");
// 敞开输入输出流 最初创立先敞开
fileOutputStream.close();
inputStream.close();}
}
}
成绩:
心得:
1、网络上的每一张图片都是一个链接
2、咱们晓得整个网页就是一个文档树,先找到蕴含图片的父 id, 再通过 getElementsByTag() 获取到图片的标签,通过 F12,咱们晓得图片的链接是存在 img 标签外面的 data-src 属性中
3、通过标签的 data-src 属性,就获取到具体图片的链接
4、通过输入输出流,把图片保留在本地中!
正文完