关于前端:使用Python获取国际版淘宝AliExpress的商品信息

AliExpress寰球速卖通，又称国际版淘宝，是一款面向海内的购物网站。
之前有获取过Amazon的信息，偶然间发现了这个网站，所以明天看看这个国际版淘宝下面有没有我想要的货色。

不晓得这下面能不能买到原价的XboxSerisX呢？

网站剖析
为了找到下面有没有原价的Xbox，首先在首页，搜一下PS5 ，再查看一下申请：

嗯，很直白的get申请，所有的参数链接上都写得清清楚楚。上面尝试一下翻页。
点击下一页之后呢，Doc选项卡没有任何变动，那就再XHR选项卡找，果然找到了翻页的申请：

简化下链接，把一堆宜人的数字参数去掉之后，把链接拿进去独自申请：

完满的触发了验证滑块。
那我无妨换个思路，间接申请地址栏的链接，不去申请他的api接口呢？后果是能够的，扭转一下page参数就能够了：

1.url = f'https://www.aliexpress.com/wholesale?trafficChannel=main&d=y&CatId=0&SearchText={word}<ype=wholesale&SortType=default&page={page}'

开始申请
个别的Get申请即可：

1.def get_res(word):  
2.    url = f'https://www.aliexpress.com/wholesale?trafficChannel=main&d=y&CatId=0&SearchText={word}<ype=wholesale&SortType=default&page={page}'  
3.    res = requests.get(url, headers=self.headers,timeout=10)  
4.    if res.status_code == 200:  
5.        content = res.content.decode('utf-8')

查看返回值，他的内容是js加载的：

从下面的content变量里，用re正则表达式获取其中的内容，转化成json字符串：

1.content = res.content.decode('utf-8')  
2.info = re.findall("window.runParams = (\{.*\})",content)[-1]  
3.info = info.replace('false','False').replace('true','True')  
4.datas = eval(info)['mods']['itemList']['content']

如何从那么乌七八糟的货色疾速找到咱们想要的货色呢？json格式化啊！百度json格式化，简单的json也能一层一层剥开他的心（要把单引号替换成双引号哦）：

这样咱们就能疾速找到咱们想要的内容了，我只有title和url就能够了，反正能够自定义，管他呢。

代理设置
方才也看到了，滑块验证不晓得什么时候就呈现了。如果想顺利的获取想要的数据，高效稳固的代理必定是少不了的。
我这里呢应用的是ipidea的代理，新用户能够白嫖流量，成果好不好无妨能够试试
地址：http://www.ipidea.net/
自己亲测高并发下成功率可不低的哦。
本次应用的是ipidea的账密代理形式;

设置好帐号信息，将账密的链接当成代理信息传进去就能够了：

1.entry = '账密链接'  
2.proxy = {  
3.    'http': entry,  
4.    'https': entry,  
5.}  
6.url = f'https://www.aliexpress.com/wholesale?trafficChannel=main&d=y&CatId=0&SearchText={word}<ype=wholesale&SortType=default&page={page}'  
7.res = requests.get(url,headers=headers, proxies=proxy)  
8.if res.status_code == 200:  
9.    content = res.content.decode('utf-8')

残缺代码

关于前端:使用Python获取国际版淘宝AliExpress的商品信息

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于前端:使用Python获取国际版淘宝AliExpress的商品信息

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复