关于爬虫:猿人学十三题

2次阅读

共计 729 个字符,预计需要花费 2 分钟才能阅读完成。

抓包 - 剖析接口 - 加密参数为 yuanrenxue_cookie

能够发现有一个链接有屡次申请 - 查看发现第一次申请返回内容为 yuanrenxue_cookie 参数

创立一个 Session 放弃会话,并将第一个申请返回的参数增加到 cookie

下边附上代码参考

import requests
import re

s = requests.Session()
cookie_ ={'sessionid':'',}
s.cookies.update(cookie_)
url = 'https://match.yuanrenxue.com/match/13?'
rsp = s.get(url,verify=False)
cookies = re.findall("'([a-zA-Z0-9=_|])'", rsp.text)
yuanrenxue_cookie = ''.join(cookies)
key, value = yuanrenxue_cookie.split('=')
s.cookies.update({key:value})
header_={'User-Agent': 'yuanrenxue.project',}
s.headers = header_

if __name__ == '__main__':
    num_list = []
    for i in range(1,6):
        url = "https://match.yuanrenxue.com/api/match/13?page={}".format(i)
        r = s.get(url,verify=False).json()
        data = r["data"]
        print(data)
        [num_list.append(i["value"]) for i in data]
    print(sum(num_list))
正文完
 0