关于数据挖掘:主题挖掘LDA和情感分析图书馆话题知乎用户问答行为数据附代码数据

4次阅读

共计 2009 个字符,预计需要花费 6 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=16890

最近咱们被客户要求撰写对于主题开掘 LDA 和情感剖析的钻研报告,包含一些图形和统计输入。

以后是大数据流行的时代,各种用户信息行为数据分析的后果影响着人们的生存和学习,同时对图书馆的倒退也有着影响

 

本文在图书馆话题下知乎用户问答行为数据 的根底上,剖析了图书馆信息资源建设的新要求,并提出了相干倡议。

 

图书馆热门话题

 

通过主题开掘剖析知乎热门图书馆话题下的问答,理解到目前大多数用户去图书馆不再单纯的以获取资源为目标,除了借还书和查阅文献资料外,更多的读者是抉择来图书馆进行自习、温习、备考,他们认为图书馆更有学习的气氛,同时有很多用户关注图书馆交友的话题。

 

 


图表 1

 


 

咱们从评论数量、被关注度和同意数量来评估用户的参加水平,能够看到图书馆交友话题 (主题 1) 关注人数和同意人数最多(如图书馆怎么意识女生?),其次是考研、温习(主题 3)的相干话题(如图书馆应该为考研学生提供特权吗?),该话题下探讨的人数最多。接下来是学校图书馆对外开放(主题 2)的话题(如公办大学的图书馆 / 自习室该不该对外开放?)和学习环境话题(主题 4)(如本部图书馆外部环境设置怎么样,在同类高校中是属于很古老的还是很现代化的?)。


点击题目查阅往期内容

自然语言解决 NLP:主题 LDA、情感剖析疫情下的新闻文本数据

左右滑动查看更多

01

02

03

04

 

图书馆话题内容表白的情感

 

接下来,通过主题开掘和情感剖析(也称为意见开掘)知乎热门话题下的问答,咱们具体看下热门话题中用户表白了哪些情感。

 

 


图表 2

 


 

从图书馆资源设施和学习环境话题来看,环境优美、设施齐全的图书馆的上座率更高,在期末备考或者迎接大型考试的后期图书馆的上座率又广泛回升,大多用户对占座表白出负面情绪,这阐明在用户看来图书馆是整个学校最能提供足够学习气氛的场合,融休闲与学习为一体的咖啡厅式图书馆更受宽广用户的青睐。图书馆交友话题最为热门,很多用户有“书中自有颜如玉”的想法,预设图书馆是浪漫邂逅的中央。同时,从聊天、吵闹等负面关键词来看大多数用户表白出他们更违心在宁静愜意的图书馆环境里来读书。

 

 

疫情前后的图书馆话题

 

 

新型冠状病毒导致的肺炎疫情给大学图书馆信息资源建设工作带来了极大影响和冲击,通过工夫线的比照,咱们发现疫情前后的图书馆话题数量和情感体现产生显著变动。

 

 


图表 3

 


 

因为疫情起因,图书馆闭馆后,很多用户表白出了开馆少、无奈自习、借书逾期等负面情感。从侧面情感来看,一些用户答复示意图书馆增强了网络在线服务,确保数据库资源失常应用和相干文献资源使用权,还策动了一些列流动以期更加全面地帮忙全校师生在疫情防控期间充分利用网络进行业余资源,助力师生更好地发展学习、生存和科研等工作。同时,图书馆罢黜读者在疫情防控期间所产生的图书逾期费用。面对新冠病毒导致的肺炎疫情带来的深远冲击,抓住机遇,引入新技术、新模式,更好地保障用户的科研、学习需要,是以后图书馆的必然选择。


本文摘选 数据视域下图书馆话题情感剖析 ,点击“ 浏览原文”获取全文残缺材料。


点击题目查阅往期内容

[](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=22475084…)文本开掘 NLP 剖析:LDA 主题模型剖析网购数据
游记数据感知游览目的地形象
数据类岗位需要的数据面 NLP 自然语言解决—主题模型 LDA 案例:开掘人民网留言板文本数据
Python 主题建模 LDA 模型、t-SNE 降维聚类、词云可视化文本开掘新闻组数据集
自然语言解决 NLP:主题 LDA、情感剖析疫情下的新闻文本数据
R 语言对 NASA 元数据进行文本开掘的主题建模剖析
R 语言文本开掘、情感剖析和可视化哈利波特小说文本数据
Python、R 对小说进行文本开掘和档次聚类可视化剖析案例
用于 NLP 的 Python:应用 Keras 进行深度学习文本生成
长短期记忆网络 LSTM 在工夫序列预测和文本分类中的利用
用 Rapidminer 做文本开掘的利用:情感剖析
R 语言文本开掘 tf-idf, 主题建模,情感剖析,n-gram 建模钻研
R 语言对推特 twitter 数据进行文本情感剖析
Python 应用神经网络进行简略文本分类
用于 NLP 的 Python:应用 Keras 的多标签文本 LSTM 神经网络分类
R 语言文本开掘应用 tf-idf 剖析 NASA 元数据的关键字
R 语言 NLP 案例:LDA 主题文本开掘优惠券举荐网站数据
Python 应用神经网络进行简略文本分类
R 语言自然语言解决(NLP):情感剖析新闻文本数据
Python、R 对小说进行文本开掘和档次聚类可视化剖析案例
R 语言对推特 twitter 数据进行文本情感剖析
R 语言中的 LDA 模型:对文本数据进行主题模型 topic modeling 剖析
R 语言文本主题模型之潜在语义剖析(LDA:Latent Dirichlet Allocation)

正文完
 0