关于数据挖掘:数据视角可视化分析豆瓣电影评分爬虫数据

243次阅读

共计 1319 个字符,预计需要花费 4 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=26988

豆瓣曾经成为国内影迷和影评人的聚集地。豆瓣评分曾经成为评估中国电影的重要指标。豆瓣积攒了大量的电影数据,为电影行业剖析提供了重要资源。豆瓣电影被用来掂量国内外电影的倒退。

中国与其余国家比照

汇总年电影总产量。始终在疾速推动的电影产业在 2017 年呈现转折,电影产量开始下滑。与当初相比,相差 1500 部左右。这种趋势始终继续。

中国大陆的评分低于整体评分,而后咱们抉择电影数量排名前三的国家与中国大陆进行比拟。日本电影的品质十分好,评分始终放弃在平均水平以上。中国大陆、美国和日本的电影评分差距很大。美国电影评分更高。

总体而言,近年来电影产量有所降落,但评分有所回升。狐疑两者之间存在分割。

电影 类型 和烂片 剖析

再来看看拍摄偏好和烂片率。当初烂片越来越多。当初让咱们从数据的角度来看。

按烂片率降序排列,不良片定义为:评分低于 3.35 分(5.9-1.5*(7.6-5.9))。每种类型的电影数量须要大于 200。

和咱们所知的一样,日本盛产情色和动画电影 ,和平烂片率最低,其次为 悬疑 。中国的恐怖、惊悚 题材电影,烂片率极高,不举荐观看 而且国产片竟然承包了豆瓣烂片榜前五名 女娲日记 荣获豆瓣 烂片之王 ,评分 倒数第一,接着是怨灵宿舍之白纸女生、女导演连环杀人案、灵异实录。

家喻户晓,日本有丰盛的情色和动画电影,战争片的烂片率最低,其次是悬疑片。中国恐怖惊悚片的烂片率十分高,不倡议观看。而且,国产电影包揽了豆瓣烂片前五名:女娲日记拿下豆瓣烂片之王,得分倒数第 ,接着是怨灵宿舍之白纸女生、女导演连环杀人案、灵异实录

电影数量剖析

统计每个国家的电影数量,选出前十名的察看值:

豆瓣采纳打星的形式,所以最低分是一星,也就是两分。

影片数量超过 500 部,综合评分和数量后,前 4 名的国家或地区:

在豆瓣,收录在电影里。尽管美国、中国大陆、日本都有大量的电影。但均匀评分低于法国、英国、德国和意大利。其中,德国的电影评分均值最高,英国的电影数量最多,这意味着相对而言,德国电影的品质最高。从离散值也能够看出,英国局部数据的离散值非常低,比方:《围攻唐宁街》,豆瓣评分 2.4 分,但还是没有国产神剧 2.0 分低。豆瓣包含电影 500+ 的国家或地区,大部分为发达国家,或中国、印度等人口大国,阐明电影数量可能与一个国家或地区的倒退程度有肯定的关系。

本文章中的所有信息(包含但不限于剖析、预测、倡议、数据、图表等内容)仅供参考,__拓端数据(__tecdat__)__不因文章的全副或局部内容产生的或因本文章而引致的任何损失承当任何责任。


最受欢迎的见解

1.R 语言动态图可视化:如何、创立具备精美动画的图

2.R 语言生存剖析可视化剖析

3.Python 数据可视化 -seaborn Iris 鸢尾花数据

4.r 语言对布丰投针(蒲丰投针)试验进行模仿和动静

5.R 语言生存剖析数据分析可视化案例

6.r 语言数据可视化剖析案例:摸索 brfss 数据数据分析

7.R 语言动静可视化:制作历史寰球平均温度的累积动静折线图动画 gif 视频图

8.R 语言高维数据的主成分 pca、t-SNE 算法降维与可视化剖析案例报告

9.python 主题 LDA 建模和 t -SNE 可视化

正文完
 0