我的项目地址: https://github.com/zhangsheng...

已实现项

  1. 应用爬虫爬取股民对于股票的评论。(目前是爬取雪球网上人们对于小米公司的评论)
  2. 对人们的评论做情感剖析,失去评论的情感得分。(应用工厂模式获取情感分析模型,目前应用的是snownlp)
  3. 将爬取到的数据,以及情感得分,存入数据库。(应用工厂模式,目前对接的是monogodb)

未实现项

  1. 爬取每日股票的涨跌幅等,作为lable的数据。
  2. 将每个发言人id作为key,当天发言的均匀情感得分作为value;按天为粒度,将所有id的得分打成一行存入数据库。
  3. 将前3天的数据拼成一行作为一条x,将历史数据放入工夫序列预测模型(也可能采纳传统机器学习,树模型xgboost之类的),预测第二天股票的涨跌幅。
  4. 对接微信公众号等(或微信机器人),反对用户订阅股票,每日收盘前主动推送预测后果。