共计 757 个字符,预计需要花费 2 分钟才能阅读完成。
微博热搜的历史查看和趋势剖析,吃瓜利器
最近微博前阵子的瓜有点多,忽然有个想法,想写一个热搜的趋势变动查看,还有历史热搜的查看。次要是想看一下热搜数据是否不失常,比方某些明星的不良影响热搜间接被买下热搜等,还有我想剖析一下这些热搜数据,比方某位明星上热搜的次数啥的。
先看下当初实现的进度和成果:
图源是 github 有可能加载不进去,间接拜访 hot-search 能够预览。
我的次要思路就是先收集数据,有了原始数据就能够进行后续的数据展现。所以我写的几个货色如下:
- 微博热搜爬虫,用 go 语言编写,应用了 colly 这个爬虫框架。15 分钟爬取一次,存入 influxdb。go-crawler
- 微博热搜 API, 这个 API 是我查找本人爬取的热搜数据,也是 go 语言编写,gin 框架实现。weibo-hot-search
- 热搜展现,前端界面是用 React 编写的,为了让界面看起来没那么丑,用了 Ant Design 的 UI 库。weibo-hot-search-react
- 热搜界面快照,用 wkhtmltopdf 进行网页转图片,我想着这热搜上了得有个证据吧,就搞了这个,保留了图片和 PDF。(嵌入到爬虫)
实际上整体大略就这些,当初实现了个小 demo,当初实现了以后热搜的查看,历史热搜的查看和热搜的热度和排名趋势变动。
当初 demo 能够在线预览了,感兴趣的敌人能够看下 hot-search , 预览下成果,有什么意见也能够分享一下啊。
这几个模块的源码 github 上都有,大家感兴趣的能够点个 start。一起相互 followe 啊,我的 github 链接放在这 akazwz
做的这个 demo 都是些根底的货色组合到一起,也是我这段时间自学 go 和 react 的一个实际,尽管是个简略的小东西然而也遇到了不少问题,后续我会挨个分享一下遇到的问题和解决的思路。感激大家浏览。
正文完