本文介绍如何应用 Python 封装接口来采集淘宝天猫商品详情数据。淘宝平台是目前寰球大型的综合性 B2B 电子商务平台,具备微小的商品资源,因为其商品数量泛滥,手动采集是十分费时费力的。因而,能够应用 Python 封装接口来自动化采集速卖通商品详情数据,提高效率。
1、装置requests
应用 Python 封装接口采集数据,首先须要装置 requests 库,能够应用 pip 命令进行装置。
2、获取接口链接
速卖通的商品详情页面有多种展现形式,但其对应的接口链接是雷同的。咱们能够通过浏览器开发者工具(F12)来查看该链接。以 Chrome 浏览器为例,关上开发者工具,在 Network 标签下找到地址栏右侧的 Preserver log 选项,选中该选项后,在地址栏中输出速卖通商品详情的链接,页面加载实现后,能够在开发者工具中找到申请数据的接口链接。将该链接复制下来,用于后续的代码编写。
3、封装接口函数
应用 requests 库向速卖通商品详情接口发送 get 申请,即可获取该商品的详情数据。将申请参数封装到字典中,并将接口链接和申请参数传给 requests 库的 get() 函数即可。申请胜利后,能够通过 json() 办法将返回的 json 字符串转换为 Python 字典对象。
Taobao.item_get - 取得淘宝商品详情(复制Taobaoapi2014)封装接口代码展现
- 申请形式:HTTP POST GET
2. 申请地址:http://o0b.cn/opandy
3.申请参数:参数阐明:num_iid:淘宝商品ID
4.申请示例:
# coding:utf-8"""Compatible for python2.x and python3.xrequirement: pip install requests"""from __future__ import print_functionimport requests# 申请示例 url 默认申请参数曾经做URL编码url = "https://api-vxx.Taobaoapi2014.cn/taobao/item_get/?key=<您本人的apiKey>&secret=<您本人的apiSecret>&num_iid=652874751412&is_promotion=1"headers = { "Accept-Encoding": "gzip", "Connection": "close"}if __name__ == "__main__": r = requests.get(url, headers=headers) json_obj = r.json() print(json_obj)
5.响应样例(展现局部)