关于数据分析:Python数据分析-数据分析工具库Pandas介绍

作者:韩信子@ShowMeAI
教程地址:http://www.showmeai.tech/tutorials/33
本文地址:http://www.showmeai.tech/article-detail/145
申明:版权所有,转载请分割平台与作者并注明出处

一、Pandas介绍

  • 官网:http://pandas.pydata.org/
  • 文档:http://pandas.pydata.org/pandas-docs/stable/

Pandas最后由AQR Capital Management于2008年4月开发,并于2009年底开源进去,目前由专一于Python数据包开发的PyData开发团队持续开发和保护,属于PyData我的项目的一部分。Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。

Pandas是Python中最罕用到的数据操作和剖析工具包,它构建在Numpy之上,具备简洁的应用接口和高效的解决效率。数据迷信、机器学习AI利用过程,波及数据荡涤和剖析的操作也频繁应用到Pandas。

Pandas有着与Numpy相似的代码格调,但Pandas次要基于其Dataframe对象解决表格型或异质型数据,而之前介绍到的Numpy更适宜解决同质的数值类型数据。

当咱们提到python数据分析的时候,大部分状况下都会应用Pandas进行操作。本篇为pandas系列的导语,对pandas进行简略介绍,整个系列笼罩以下内容:

  • 图解Pandas外围操作函数大全
  • 图解Pandas数据变换高级函数
  • Pandas数据分组与操作

二、Pandas特点

  • 不便地解决浮点与非浮点数据里的缺失数据,示意为 NaN;
  • 大小可变:插入或删除 DataFrame 等多维对象的列;
  • 主动、显式数据对齐:显式地将对象与一组标签对齐,也能够疏忽标签,在 Series、DataFrame 计算时主动与数据对齐;
  • 弱小、灵便的分组(group by)性能:拆分-利用-组合数据集,聚合、转换数据;
  • 把 Python 和 NumPy 数据结构里不规则、不同索引的数据轻松地转换为 DataFrame 对象;
  • 基于智能标签,对大型数据集进行切片、花式索引、子集合成等操作;
  • 直观地合并(merge)、连贯(join)数据集;
  • 灵便地重塑(reshape)、透视(pivot)数据集;
  • 轴反对结构化标签:一个刻度反对多个标签;
  • 成熟的 IO 工具:读取文本文件(CSV 等反对分隔符的文件)、Excel 文件、数据库等起源的数据,利用超快的 HDF5 格局保留 / 加载数据;
  • 工夫序列:反对日期范畴生成、频率转换、挪动窗口统计、挪动窗口线性回归、日期位移等工夫序列性能。

三、Pandas装置

能够在命令行基于以下命令装置pandas(如果应用anaconda集成环境,内置环境自带pandas,无需装置):

pip install pandas
conda install pandas
python3 -m pip install --upgrade pandas

对于Linux,比方Ubuntu,能够应用上面的办法装置,但可能呈现各种依赖缺失或者装置谬误:

sudo apt-get install python-numpy python-scipy python-matplotlib ipython python-pandas python-sympy python-nose

装置完Pandas后,咱们就能够在python环境中导入它了:

import pandas as pd

有时候,咱们会独自导入pandas蕴含的两个重要数据结构:

from pandas import Series, DataFrame

能够如下查看以后Pandas的版本信息:

pd.__version__

材料与代码下载

本教程系列的代码能够在ShowMeAI对应的github中下载,可本地python环境运行,能迷信上网的宝宝也能够间接借助google colab一键运行与交互操作学习哦!

本系列教程波及的速查表能够在以下地址下载获取:

  • Pandas速查表
  • NumPy速查表
  • Matplotlib速查表
  • Seaborn速查表

拓展参考资料

  • Pandas官网教程
  • Pandas中文教程

ShowMeAI相干文章举荐

  • 数据分析介绍
  • 数据分析思维
  • 数据分析的数学根底
  • 业务认知与数据初探
  • 数据荡涤与预处理
  • 业务剖析与数据挖掘
  • 数据分析工具地图
  • 统计与数据科学计算工具库Numpy介绍
  • Numpy与1维数组操作
  • Numpy与2维数组操作
  • Numpy与高维数组操作
  • 数据分析工具库Pandas介绍
  • 图解Pandas外围操作函数大全
  • 图解Pandas数据变换高级函数
  • Pandas数据分组与操作
  • 数据可视化准则与办法
  • 基于Pandas的数据可视化
  • seaborn工具与数据可视化

ShowMeAI系列教程举荐

  • 图解Python编程:从入门到精通系列教程
  • 图解数据分析:从入门到精通系列教程
  • 图解AI数学根底:从入门到精通系列教程
  • 图解大数据技术:从入门到精通系列教程

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理