共计 213 个字符,预计需要花费 1 分钟才能阅读完成。
什么是爬虫?
就是抓取网页数据的程序
爬虫怎么抓取网页数据?
网页三大特征:
网页都有自己唯一的 URL。
网页都是 HTML 来描述页面信息。
网页都使用 http/https 协议来传输 HTML 数据。
爬虫的设计思路:1、获取视频 ID 2、拼接完整 url3、获取视频播放地址 4、下载视频
模块使用 requests
安装“pip install requests”
Requests 库的七个主要方法
找到单个视频播放地址
获取网页源代码
获取播放地址
下载视频
实现效果
正文完