乐趣区

关于python:又一个Jupyter神器操作Excel自动生成Python代码

不得不说,Jupyter对于表的解决真的是越来越不便了,很多库能够间接实现可视化操作,无需写代码。然而这还不够,最近看到一个神器叫 Mito,它真的是做到了 无需写一行代码,而且手动的操作能够主动转换为代码,供后续批量化操作,这几乎不要太爽。

一、Mito 是什么?

MitoJupyter notebook 的一个插件,作用是编辑电子表格,并在编辑表格(带格局转换性能)时,能够生成绝对应的 Python 代码。上面是具体的操作演示,感受一下它的弱小!

应用 Mito 和应用 Excel 表格没什么太大区别,只须要把握一些 Mito 的自定义函数即可,而后它会主动生成 pandas 处理表的代码。

二、Mito 装置

Mito的装置要求比较简单,有两个:

  • Python 3.6 或更高版本
  • 须要装置了 Node

关上终端,间接 pip 装置:

pip install mitosheet

而后,装置 JupyterLab 扩大管理器。这个命令可能须要运行个几分钟:

jupyter labextension install @jupyter-widgets/jupyterlab-manager@2

最初,启动 JupyterLab 就完事了。

jupyter lab

也能够用 conda 装置到一个虚拟环境里。

三、Mito 操作方法

创立一个表

import mitosheet
mitosheet.sheet()

导入数据

能够应用 pandas 读入数据生成 dataframemitosheet。如果不想写代码,也能够手动点导入按钮导入数据,导入数据代码会主动生成。

# import Python packages
import mitosheet
import pandas as pd

# Create a simple dataframe to display
car_data = pd.DataFrame({'car': ['Toyota', 'Nissan', 'Honda', 'Mini Cooper', 'Saturn'], 'mph': [60, 50, 60, 75, 90], 'length': [10, 12, 13, 8, 9]})

# render the Mitosheet with car_data
mitosheet.sheet(car_data)

操作方法

Excel 一样,个别的两种办法。

1. 公式法:  

如果对公式纯熟,间接敲入函数即可,比方 sumsumif 这种等等。公式法其实就是个孰能生巧的事。我看了下,Mito中的函数不简单,应用很容易上手。

2. 剖析工具:  

如果不纯熟函数,Mito也提供了剖析工具,比方合并、透视表、筛选、排序、保留剖析等局部性能,都是点点点的操作。对于剖析工具,给大家演示几种常见的数据处理操作,找找感觉。

合并数据集 Mito 的合并性能可用于将数据集程度组合在一起。通过查找两个表要害列的匹配项,而后将这些匹配项数据组合到一行中。首先,抉择要合并在一起的两个 Mito 工作表。其次,抉择合并的键。最初,抉择保留哪些列。

数据透视表

首先,抉择一个关键字对数据分组。而后,如果想进一步将组分层为单个单元格,持续抉择列。最初,抉择聚合的列和办法。

筛选

Mito 通过组合过滤器和过滤器组来提供弱小的过滤性能。

  • 过滤器是单个条件,对于该列中的每个单元格,其评估后果为 true 或 false。
  • 过滤器组是联合了布尔运算符的过滤器聚合。

排序

保留剖析

能够像保留宏一样保留剖析。通过保留剖析,能够保留利用于数据的转换,以便当前能够将其从新利用于新的数据集。

四、后话

对于 Mito 的背地原理,这里不过多介绍,Aaron Diamond-Reivich、Jake Diamond-Reivich 和 Nate Rush,他们是在搞数据分析的时候,萌发了想要制作 Mito 的想法。据理解,目前这个软件还没有开源,他们还在思考如何反对保护这个我的项目,并转到开源门路上来。

以上就是本次分享的所有内容,如果你感觉文章还不错,欢送关注公众号:Python 编程学习圈,每日干货分享,发送“J”还可支付大量学习材料,内容笼罩 Python 电子书、教程、数据库编程、Django,爬虫,云计算等等。或是返回编程学习网,理解更多编程技术常识。

退出移动版