关于云计算:什么让pythonpandas与excel彻底拉开了距离

6次阅读

共计 1927 个字符,预计需要花费 5 分钟才能阅读完成。

古代办公室里简直任何一项工作都会用到 Excel,每关上一个 job deion,咱们都会看到一句“要求把握 Excel”。对于程序员来说最好用的数据分析肯定是 Python 中最罕用的数据分析包 Pandas 了。

初识 Pandas

Pandas 是一个 Python 的外围数据分析反对库,它提供了弱小的 一维数组和二维数组 解决能力,其十分善于与解决二维表构造,带行列标签的矩阵数据,工夫序列数据。

Pandas 提供的两个次要数据结构一维数组(Series)和二维数组(DataFrame)强力的撑持着当今金融、统计、社会科学、工程等诸多畛域的数据分析工作。

通过 Pandas 咱们能够不便的操作数据的增、查、改、删、合并、重塑、分组、统计分析,此外 Pandas 还提供了十分成熟的 I/O 工具,用于读取文本文件,excel 文件,数据库等不同起源数据,利用超快的 HDF5 格局保留 / 加载数据。

还有十分重要的一点,pandas 是 完全免费的开源软件 ,而且还 不受操作系统的限度——在 Windows 和 MacOS 上都能跑的溜溜的。

Pandas 到底强在哪里?

1、Pandas 很快,Pandas 是基于 numpy 开发的,此外 Pandas 的很多底层算法都通过 Cython 优化。

2、弱小的包容性,利用 Pandas 能够将 Python 或 Numpy 里不规则的数据结构,轻松转换为 DataFrame。

3、灵便、直观的数据处理能力,通过分组、合并、重塑等操作,灵便、直观、便捷的进行数据预处理。

4、业余的统计分析能力,Pandas 提供了很多便捷的诸如相关性剖析、时序剖析、描述性统计等数据分析 API。

当初的待业局势是:无论你是不是应聘数据相干的岗位,把握 pandas 无疑都能够减少你的职场竞争力。

心动吗?想学吗?小编这就为大家奉上一节收费 Python 系列直播课程《轻松应用 Pandas 玩转 Excel》。在本节公开课中咱们将学到 Excell 的替换、比照、合并,以及 QT 封装脚本。

设想一下,用 Excel 加载一个大型数据表格就须要 2 分钟,一个 Vlookup 或者求和公式的操作又要用去 5 分钟,当表格发生变化时,可能还要从新进行计算,而一个简略的 Python+pandas 脚本就可能把你一个小时的工作量缩短到 20 秒之内实现。

举例比照

例子一:应用行索引,查看每一个 Name 的 Quality,price 汇总数据

1、pandas 实现

pd.pivot_table(df, index=['Name'])

运行成果如下:

当咱们只指定 index 时,就是指定了行标签,pivot_table 函数会默认依照平均值,汇总所有的数值字段。因为 Account 字段被 pandas“了解”成了数值类型的(能够通过 df.dtypes 查看),所以后果中呈现了 Account 列。下面的后果示意每个 Name 的 Account,Price,Quantity 的平均值。

2、Excel 实现选中数据区域,插入,数据透视表,将 Name 字段拉倒“行”区域,Account,Price,Quantity 拉入“值”区域,并将三者的字段汇总形式设置为平均值。

整个步骤的流程及运行后果如下图所示:

能够看到 Excel 默认会有一个汇总行。以 Quantity 为例,它的“总计”值是所有的 Quantity 求和之后,除以 Name 的个数。

如果想用 Pandas 实现这种成果,能够退出 margins=True 参数,成果如下,呈现了 All 行,因为 Account 和 Price 是整数,所以 all 行也是整数,Quantity 是小数,相应的 All 行也是小数。Excel 的总计行也能够在“设计”选项卡,“总计”,“对行和列禁用去掉”。

例子二:应用多个行索引,查看每个 Manager 的每个 Rep 对应的 Account,Price,Quantity 汇总值

1、pandas 实现

pd.pivot_table(df, index=['Manager', 'Rep'], margins=True)

运行成果如下:

2.Excel 实现在后面根底上,将 Manager,Rep 拉到“行”的地位即可。成果如下图,能够看到,在要害的数值上,两个后果是统一的,只是在模式上有所不同。

为了在模式上更靠近 pandas 的后果,能够设置透视表的布局。抉择“设计”选项卡,报表布局,抉择“纲要模式显示”即可,成果如上图所示。

仔细观察,发现 excel 里对每一个 Manager 都做了汇总。这个能够通过“设计”选项卡,“分类汇总”,“不显示分类汇总”去掉。

** 长按辨认
**

获取直播链接 / 课件 / 回放

福利:豆花同学为大家精心整顿了一份对于 linux 和 python 的学习材料大合集!有须要的小伙伴们,关注豆花集体公众号:python 头条!回复关键词“材料合集”即可收费支付!

正文完
 0