关于python:爬虫系列-3谷歌浏览器的基本使用

54次阅读

共计 767 个字符,预计需要花费 2 分钟才能阅读完成。

你要问程序员最喜爱的浏览器是什么?

根本都会说当然是谷歌浏览器,它齐全恪守了 W3C 的规范,是最最最受程序员欢送的浏览器

其次火狐浏览器,安全性高。能够作为备用浏览器。

Edge 是微软最新公布的浏览器,和谷歌浏览器内核一样。也是十分不错的

那 IE 呢?对不起,打搅了!

在进行爬虫时,不可避免的会用到浏览器的调试性能,须要去查看申请的地址、参数、响应,有时候还须要进行 JS 调试。

上面呢就给大家介绍一下谷歌浏览器的调试技巧。

谷歌浏览器中关上调试工具的快捷键是F12 或者 Ctrl + Shift + i。当然也能够依照下图的步骤去关上

依照上图的标注所示

1、用于抉择页面中的某个元素来审查或查看相干的信息。同样在 Elements 页面下,点击某个 Dom 元素时,箭头按钮会变成抉择状态,页面中也会标识出对应的元素

2、设施按钮,能够进行挪动端和 PC 端的切换。抉择不同的挪动端设施,并且能够抉择不同的尺寸比例。

3、Elements,用于查看批改页面中的元素。包含 DOM 标签,CSS 款式等。批改完之后页面立刻失效

比方我通过 Elements 批改了我的支付宝余额

4、Console,用于打印和输入相干的信息。比方输入谬误日志,除此之外还能够执行一些简略的代码

5、Sources,js 资源页面,能够在页面中找到浏览器中的 js 源文件。不便咱们进行查看和调试

6、NetWork,网络申请的标签页。能够看到所有的资源申请,并且能够进行申请的筛选

从上图能够看到,申请的状态码、类型、工夫、大小等信息

如果点击 XHR 则只显示异步申请资源,点击具体的申请能够看到申请头信息,参数、申请办法等信息

PreviewResponse 中还能够看到具体的响应信息

大部分状况,爬虫的时候只须要通过调试工具去剖析申请的形式(POST/GET/..),申请的 URL,申请的参数,申请头信息以及响应信息即可。

正文完
 0