微博热搜的历史查看和趋势剖析,吃瓜利器

最近微博前阵子的瓜有点多,忽然有个想法,想写一个热搜的趋势变动查看,还有历史热搜的查看。次要是想看一下热搜数据是否不失常,比方某些明星的不良影响热搜间接被买下热搜等,还有我想剖析一下这些热搜数据,比方某位明星上热搜的次数啥的。

先看下当初实现的进度和成果:


图源是github有可能加载不进去,间接拜访hot-search能够预览。
我的次要思路就是先收集数据,有了原始数据就能够进行后续的数据展现。所以我写的几个货色如下:

  1. 微博热搜爬虫,用go 语言编写,应用了colly这个爬虫框架。15分钟爬取一次,存入influxdb。 go-crawler
  2. 微博热搜API, 这个API是我查找本人爬取的热搜数据,也是go 语言编写,gin框架实现。weibo-hot-search
  3. 热搜展现,前端界面是用React编写的,为了让界面看起来没那么丑,用了 Ant Design 的UI库。weibo-hot-search-react
  4. 热搜界面快照,用wkhtmltopdf 进行网页转图片,我想着这热搜上了得有个证据吧,就搞了这个,保留了图片和PDF。(嵌入到爬虫)

实际上整体大略就这些,当初实现了个小demo,当初实现了以后热搜的查看,历史热搜的查看和热搜的热度和排名趋势变动。

当初demo能够在线预览了,感兴趣的敌人能够看下 hot-search ,预览下成果,有什么意见也能够分享一下啊。

这几个模块的源码github上都有,大家感兴趣的能够点个start。一起相互 followe 啊, 我的github链接放在这 akazwz

做的这个demo都是些根底的货色组合到一起,也是我这段时间自学go 和react 的一个实际,尽管是个简略的小东西然而也遇到了不少问题,后续我会挨个分享一下遇到的问题和解决的思路。感激大家浏览。