关于爬虫:猿人学十三题

抓包-剖析接口-加密参数为yuanrenxue_cookie

能够发现有一个链接有屡次申请-查看发现第一次申请返回内容为yuanrenxue_cookie参数

创立一个Session放弃会话,并将第一个申请返回的参数增加到cookie

下边附上代码参考

import requests
import re

s = requests.Session()
cookie_ ={
    'sessionid':'',
}
s.cookies.update(cookie_)
url = 'https://match.yuanrenxue.com/match/13?'
rsp = s.get(url,verify=False)
cookies = re.findall("'([a-zA-Z0-9=_|])'", rsp.text)
yuanrenxue_cookie = ''.join(cookies)
key, value = yuanrenxue_cookie.split('=')
s.cookies.update({key:value})
header_={
    'User-Agent': 'yuanrenxue.project',
}
s.headers = header_

if __name__ == '__main__':
    num_list = []
    for i in range(1,6):
        url = "https://match.yuanrenxue.com/api/match/13?page={}".format(i)
        r = s.get(url,verify=False).json()
        data = r["data"]
        print(data)
        [num_list.append(i["value"]) for i in data]
    print(sum(num_list))

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理