阐明
不晓得从何时起,GitHub限度了搜寻代码的后果,只能获取默认的前100条代码,且不反对排序筛选。
具体表现如下:
搜寻aaa
,共有22.5M
条数据,我每页展现20条数据,当查看到第5页时,无奈持续点击下一页,当通过批改参数查问第6页时,揭示我没有搜寻后果。
后翻了一下官网的文档,可见是官网限度了搜寻展现后果数量。
尝试绕过
以后阶段还是想尽可能多的获取到代码后果,毕竟从GitHub信息收集也次要依赖代码搜寻;但间接绕过GitHub搜寻策略是不事实的(能绕过我就提hackerone了),所以只能从测面想一些方法尽可能多的获取到后果,一个人的思路比拟局限,有其余徒弟有思路能够互相交换。
演示以搜寻163的SMTP账号密码为例,GitHub间接搜smtp.163.com password
进去前100个后果没有1个能用的。
通过搜索引擎如Google
site:github.com intext:"smtp.163.com" intext:password
可见能搜寻一些可用的SMTP账号和明码。
通过欠缺搜寻的语法
GitHub搜寻语法更新,能够应用正则表达式、布尔等高级搜寻语法进行条件限度。
163默认邮箱生成的客户端密钥是16位,如JLLM**********GL
,因而能够采纳减少搜寻规定的形式来放大搜寻范畴,如应用正则表达式
smtp.163.com AND /password = "[\w+]{16}"/
因为局部用户可能改过密钥,所以也能够用如下语法:
smtp.163.com AND /password = "\w+"/ NOT /password = "(password|xxx|your_email_password|123456|X+|明码|authCode)"/
通过GitHub API
在GitHub API文档中,发现可通过page来管制查问的页数,如果咱们每页1条数据,那么第101页就是第101条数据,也就绕过了web的100条数据限度。具体演示如下:
# 认证gh auth login# 查问gh api -H "Accept: application/vnd.github+json" -H "X-GitHub-Api-Version: 2022-11-28" '/search/code?q=smtp.163.com+password&per_page=1&page=101'
可见能胜利获取到对应的仓库信息。
一行获取对应文件的内容
curl $(gh api -H "Accept: application/vnd.github+json" -H "X-GitHub-Api-Version: 2022-11-28" '/search/code?q=smtp.163.com+password&per_page=1&page=205' | jq -r .items[0].git_url) | jq -r .content | base64 -d
问题点:
Github API查问的后果数量和GitHub网页中查问的后果数量不统一,会少很多很多。