关于r语言:r语言对twitter推特数据进行挖掘

36次阅读

共计 739 个字符,预计需要花费 2 分钟才能阅读完成。

原文链接:http://tecdat.cn/ r 语言对 twitter 数据进行开掘 /

Twitter is a popular social network, where a lot of data waiting for our analysis. Twitter R package is a good tool for text mining of twitter data. This article is about how to use Twitter R package to get twitter data and import it into R, and then make some interesting data analysis.

第一步是注册一个你的应用程序。

为了可能拜访 Twitter 数据编程,咱们须要创立一个与 Twitter 的 API 交互的应用程序。

注册后你将收到一个密钥和明码:

获取密钥和明码后便能够在 R 外面受权咱们的应用程序以代表咱们拜访 Twitter:

依据不同的搜索词,咱们能够在几分钟之内收集到成千上万的 tweet。这里咱们测试一个关键词 littlecaesars 的 twitter 后果:

抓取最新的 1000 条相干 twitter

因为默认的抓取后果是 json 格局,因而应用 twlisttodf 函数将其转换成数据框

而后咱们做一些简略的文本清理

从失去的数据里,咱们能够看到有 twitter 发表工夫,内容,经纬度等信息

在清理数据之后,咱们对 twitter 内容进行分词,以便进行数据可视化

分词之后能够失去相干 twitter 的高频词汇,而后将其可视化

除此之外,还能够联合数据中的工夫戳数据和天文数据进行可视化剖析

如果你始终在思考对一些文本数据利用情感剖析,你可能会发现应用 R 比你设想的更容易!

原文出处:http://tecdat.cn/category/ 大数据部落 /

正文完
 0