共计 896 个字符,预计需要花费 3 分钟才能阅读完成。
最近 王菲状态
话题上了微博热搜 https://weibo.com/1266269835/… https://weibo.com/6598655984/…
还和马云独唱了 如果云晓得
https://weibo.com/1956700750/…
5 年不更新的微博下评论开始求开演唱会 https://weibo.com/1629810574/…
于是用 Python 抓取了下这条微博下的评论(前几十页评论),微博有 4 个域名:网页版 weibo.com,手机端 m.weibo.com,挪动端 weibo.cn,h5 端 m.weibo.cn,这里用网页版为例,关上控制台能够抓取到评论接口
https://weibo.com/aj/v6/comme…
同样的挪动端 https://weibo.cn/search/?tf=5… 搜王菲能够找到这条微博 https://weibo.cn/comment/C8Fq…,评论也在一块。
还有 h5 端 https://m.weibo.cn/detail/382… 抓取到接口 https://m.weibo.cn/comments/h…
有了接口地址,数据就很好抓取了,这里写入文件。
而后用 wordcloud 对微博评论生成词云图,次要关键词是好听,菲姐,演唱会,真的很期待王菲再开演唱会。
也能够通过网站 http://cloud.niucodata.com/ 生成,上传文字即可。
另外我用 Chrome 扩大备份了王菲 1500 多条微博,详情见之前文章用 Chrome 扩大一键备份微博
如果须要备份文件在公众号后盾回复 微博
获取
天后曾经很久不出专辑了,自从去年发了一首单曲《我和我的祖国》快过来一年了,不过即便 20 年前的歌明天仍然在传唱 王菲 51 岁:爱她,不只是因为她的歌,比方《红豆》
https://music.163.com/#/song?…,惋惜目前在网易云音乐须要 VIP 能力听,如果不想花钱看看之前文章一键解锁网易云音乐变灰歌曲
这里抓取前 200 页的评论生成词云图,我也很喜爱这首歌。评论接口地址 http://music.163.com/api/v1/r…