关于python:JS-逆向百例某公共资源交易网公告-URL-参数逆向分析

29次阅读

共计 5773 个字符,预计需要花费 15 分钟才能阅读完成。

申明

本文章中所有内容仅供学习交换,抓包内容、敏感网址、数据接口均已做脱敏解决,严禁用于商业用途和非法用处,否则由此产生的所有结果均与作者无关,若有侵权,请分割我立刻删除!

逆向指标

  • 指标:某地公共资源交易网
  • 主页:aHR0cDovL2dnenkuamNzLmdvdi5jbi93ZWJzaXRlL3RyYW5zYWN0aW9uL2luZGV4
  • 接口:aHR0cDovL2dnenkuamNzLmdvdi5jbi9wcm8tYXBpLWNvbnN0cnVjdGlvbi9jb25zdHJ1Y3Rpb24vYmlkZGVyL2JpZFNlY3Rpb24vbGlzdA==
  • 逆向参数:URL 链接中的 projectId、projectInfo 参数

逆向过程

抓包剖析

通过链接进入到网站,会发现先转会圈才进入到网页,这里可能就有个渲染加载的过程,关上开发者人员工具,刷新网页,往下滑会看到抓包到了数据返回的接口:aHR0cDovL2dnenkuamNzLmdvdi5jbi9wcm8tYXBpLWNvbnN0cnVjdGlvbi9jb25zdHJ1Y3Rpb24vYmlkZGVyL2JpZFNlY3Rpb24vbGlzdA==,GET 申请,从 preview 响应预览中能够看到以后页面所有布告的信息:

Query String Parameters 中有些参数信息,各类型什么含意后文会具体解说:

  • pageNum: 以后为第几页
  • pageSize: 页面大小
  • informationType: 布告类型
  • projectType: 我的项目类型
  • informationName: 信息类型

接下来轻易点击一条布告,跳转到一个新页面,会发现网页链接变成了这种格局:XXX/index?projectId=XXX&projectInfo=XXX,生成了 projectId 和 projectInfo 两个加密参数,并且通过测试,同一个布告页面这两个加密参数的值是固定的,接下来咱们须要尝试找到这两个参数的加密地位。

调试剖析定位

从主页地位 CTRL + SHIFT + F 全局搜寻 projectId 参数,顺次比照能够发现,projectId 和 projectInfo 两个加密参数在 chunk-63628500.eb5f8d30.js 中定义,这里是个三目运算,若我的项目类型雷同则执行其后的办法,若不同则往后执行:

上文代码行判断中呈现的 ZFCG、GTGC 是什么意思呢,CTRL + SHIFT + F 全局搜寻 ZBGG 参数,在 chunk-043c03b8.34f6abab.js 文件中咱们能够找到相应的定义,以下即各自的含意:

在第 267 行,return t.stop() 处打下断点进行调试剖析,轻易点击一条布告,会发现断点断住,即胜利定位,鼠标悬停在 projectId 和 projectInfo 对应的值上,能够晓得以下信息:

  • projectId:项目编号
  • projectInfo:信息类型

晓得了两个加密参数的具体含意,接下来咱们就须要找到其加密地位了,projectId 和 projectInfo 参数由 a.parameterTool.encryptJumpPage 办法执行,encryptJumpPage 跳转页面加密?这不几乎就是明示:

咱们将鼠标悬停在 a.parameterTool.encryptJumpPage 上,跟进到办法生成的 js 文件 app.3275fd87.js 中去瞅瞅:

以上咱们能够清晰地晓得上面两个参数的具体含意:

  • query:加密数据(projectId 和 projectInfo)
  • nextPath:路由跳转地位

在第 2389 行打断点进行调试剖析,从下图能够晓得,projectId 和 projectInfo 参数在 a 中被加密了:

进一步跟踪 a 的地位,往上滑能够看到第 2335 行到 2356 行是很显著的 DES 加密:

但具体是哪个函数局部对 query 中的 projectId 和 projectInfo 参数进行了加密还不得而知,咱们持续打断点调试剖析,在 2341 行打断点时发现,projectId 参数对应的值 424,projectInfo 参数对应的值 ZBGG,都在 function c(t) 中进行了解决,证实此处就是要害的加密地位:

function c(t) {
    return i.a.DES.encrypt(t, o.keyHex, {
        iv: o.ivHex,
        mode: i.a.mode.CBC,
        padding: i.a.pad.Pkcs7
    }).ciphertext.toString()}

剖析这段要害的加密代码:

  • iv:ivHex 十六进制初始向量
  • mode:采纳 CBC 加密模式,其是一种循环模式,前一个分组的密文和以后分组的明文异或操作后再加密
  • padding:采纳 Pkcs7 填充形式,在填充时首先获取须要填充的字节长度 = 块长度 –(数据长度 % 块长度), 在填充字节序列中所有字节填充为须要填充的字节长度值
  • ciphertext.toString():将加密后的密文,以十六进制字符串模式返回

模仿执行

这里间接援用 JS,应用 nodejs 外面的加密模块 crypto-js 来进行 DES 加密,调试过程中提醒哪个函数未定义,就将其定义局部增加进来即可,改写后的残缺 JS 代码如下:

var CryptoJS = require('crypto-js');

o = {
    keyHex: CryptoJS.enc.Utf8.parse(Object({
        NODE_ENV: "production",
        VUE_APP_BASE_API: "/pro-api",
        VUE_APP_CONSTRUCTION_API: "/pro-api-construction",
        VUE_APP_DEV_FILE_PREVIEW: "/lyjcdFileView/onlinePreview",
        VUE_APP_FILE_ALL_PATH: "http://www.lyjcd.cn:8089",
        VUE_APP_FILE_PREFIX: "/mygroup",
        VUE_APP_LAND_API: "/pro-api-land",
        VUE_APP_PREVIEW_PREFIX: "/lyjcdFileView",
        VUE_APP_PROCUREMENT_API: "/pro-api-procurement",
        VUE_APP_WINDOW_TITLE: "XXXXXX",
        BASE_URL: "/"
    }).VUE_APP_CUSTOM_KEY || "54367819"),
    ivHex: CryptoJS.enc.Utf8.parse(Object({
        NODE_ENV: "production",
        VUE_APP_BASE_API: "/pro-api",
        VUE_APP_CONSTRUCTION_API: "/pro-api-construction",
        VUE_APP_DEV_FILE_PREVIEW: "/lyjcdFileView/onlinePreview",
        VUE_APP_FILE_ALL_PATH: "http://www.lyjcd.cn:8089",
        VUE_APP_FILE_PREFIX: "/mygroup",
        VUE_APP_LAND_API: "/pro-api-land",
        VUE_APP_PREVIEW_PREFIX: "/lyjcdFileView",
        VUE_APP_PROCUREMENT_API: "/pro-api-procurement",
        VUE_APP_WINDOW_TITLE: "XXXXXX",
        BASE_URL: "/"
    }).VUE_APP_CUSTOM_IV || "54367819")
};

function c(t) {
    return CryptoJS.DES.encrypt(t, o.keyHex, {
        iv: o.ivHex,
        mode: CryptoJS.mode.CBC,
        padding: CryptoJS.pad.Pkcs7
    }).ciphertext.toString()}

// 测试
// console.log(c('ZBGG'))
// ff15d186c4d5fa7a

VUE_APP_WINDOW_TITLE 对应值内容通过脱敏解决,经测试,不影响后果输入

残缺代码

GitHub 关注 K 哥爬虫,继续分享爬虫相干代码!欢送 star!https://github.com/kgepachong/

以下只演示局部要害代码,不能间接运行!残缺代码仓库地址:https://github.com/kgepachong…

本案例代码:https://github.com/kgepachong…

# =======================
# --*-- coding: utf-8 --*--
# @Author  : 微信公众号:K 哥爬虫
# @FileName: ggzy.py
# @Software: PyCharm
# =======================


import urllib.parse
import execjs
import requests


url = '脱敏解决,残缺代码关注 https://github.com/kgepachong/crawler/'


def encrypted_project_id(id_enc):
    with open('ggzy_js.js', 'r', encoding='utf-8') as f:
        public_js = f.read()
        project_id = execjs.compile(public_js).call('Public', id_enc)
    return project_id


def encrypted_project_info(info_enc):
    with open('ggzy_js.js', 'r', encoding='utf-8') as f:
        public_js = f.read()
        project_info = execjs.compile(public_js).call('Public', info_enc)
    return project_info


def get_project_info(info_name, info_type):
    index_url = '脱敏解决,残缺代码关注 https://github.com/kgepachong/crawler/'
    urlparse = urllib.parse.urlparse(index_url)
    project_info = urllib.parse.parse_qs(urlparse.query)['informationName'][0]
    return project_info


def get_content(page, info_name, info_type):
    headers = {
        "Connection": "keep-alive",
        "Pragma": "no-cache",
        "Cache-Control": "no-cache",
        "Accept": "application/json, text/plain, */*",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
        "Referer": "脱敏解决,残缺代码关注 https://github.com/kgepachong/crawler/",
        "Accept-Language": "zh-CN,zh;q=0.9"
    }
    url_param = "脱敏解决,残缺代码关注 https://github.com/kgepachong/crawler/"
    params = {
        "pageNum": page,
        "pageSize": "20",
        "releaseTime": "","search":"",
        "informationType": info_type,
        "departmentId": "","projectType":"SZFJ","informationName": info_name,"onlyCanBidSectionFlag":"NO"
    }
    response = requests.get(url=url_param, headers=headers, params=params)

    return response


def main():
    print("脱敏解决,残缺代码关注 https://github.com/kgepachong/crawler/")
    info_name = input("请输出信息类型:")
    info_type = input("请输出布告类型:")
    page = input("您想要获取数据的页数:")
    get_content(page, info_name, info_type)
    response = get_content(page, info_name.upper(), info_type.upper())
    num = int(page) * 20
    print("总共获取了 %d 个我的项目" % num)
    for i in range(20):
        title = response.json()['rows'][i]['content']
        query_id = response.json()['rows'][i]['projectId']
        query_info = get_project_info(info_name.upper(), info_type.upper())
        project_id_enc = encrypted_project_id(str(query_id))
        project_info_enc = encrypted_project_info(query_info)
        project_url = '%s?projectId=%s&projectInfo=%s' % (url, project_id_enc, project_info_enc)
        print("第 %d 个我的项目:" % (i+1) + "\n" + "项目名称:%s  项目编号:%d" % (title, query_id) + "\n" + "我的项目链接:%s" % project_url)


if __name__ == '__main__':
    main()

代码实现成果:

正文完
 0