关于数据分析:2022了你还不会『低代码』数据科学也能玩转LowCode啦-⛵

31次阅读

共计 3014 个字符,预计需要花费 8 分钟才能阅读完成。

💡 作者:韩信子 @ShowMeAI
📘 数据分析实战系列:https://www.showmeai.tech/tutorials/40
📘 机器学习实战系列:https://www.showmeai.tech/tutorials/41
📘 本文地址:https://www.showmeai.tech/article-detail/286
📢 申明:版权所有,转载请分割平台与作者并注明出处
📢 珍藏 ShowMeAI 查看更多精彩内容

低代码开发,顾名思义,指的是软件开发过程中只须要编写大量代码就够了。与传统开发方式相比,低代码大幅缩小了编写代码的工作量,这使其具备了更快的速度、更短的开发工夫与更低的老本。

无代码 / 低代码机器学习平台(和库)的衰亡,减速了代码开发速度。借助于这些平台和框架,数据科学家们在沉重的摸索钻研和大量的编程工作之间,获得更好的均衡。

在本篇内容中,ShowMeAI 给大家总结了最值得学习 & 应用 Python 低代码机器学习库,笼罩数据迷信最热门的几大方向——数据分析 & 简略开掘 机器学习 深度学习

📌 数据分析 & 简略开掘

💡 D-Tale

D-Tale 是一个易于应用的低代码 Python 库,通过将 Flask 编写的后端与 React 编写的前端相结合,与 Jupyter Notebook 无缝集成,能够查看和剖析 Pandas 状态的数据,包含 DataFrame、Series、MultiIndex、DatetimeIndex 和 RangeIndex。

D-Tale 是 SAS 到 Python 转换的产物,最后是基于 SAS 的 perl 脚本包装器,当初是基于 Pandas 数据结构的轻量级 Web 客户端。

大家能够在 D -Tale 的官网 📘Github 查看它的具体教程和用法,也能够返回 📘在线平台 操作体验。

💡 AutoViz

对于低代码摸索式数据分析工作,AutoViz 是 Python 中另一个不错的抉择。在性能方面,它只需编写一行代码即可应用 AutoViz 实现任何数据集的主动可视化。

AutoViz 可能联合工作确定哪些特色是最重要的,而后通过仅应用那些主动抉择的元素来绘制和出现信息。而且 AutoViz 速度极快,可视化能够在几秒钟内实现。

大家能够查看官网 📘AutoViz 示例 Jupyter Notebook 进行学习。

💡 Lux

Lux 工具库是一个十分主动的数据分析可视化工具。无需做太多的数据预处理,它会主动依据数据生成一系列候选图表,依据理论须要从中做抉择即可。这大大减少了制作图表所需的工夫以及数据预处理工作量。

大家能够通过 Lux 的官网 📘GitHub 页面理解更多用法细节。

💡 Pandas-Profiling

pandas-profiling 库主动针对 pandas DataFrame 格局的数据生成数据分析报告。

最终的后果以交互式 HTML 报告出现,蕴含以下信息:

  • 类型推断:字段列的类型
  • 要点:类型、惟一值、缺失值
  • 分位数统计:包含最小值、Q1、中位数、Q3、最大值、范畴、四分位间距
  • 描述性统计:包含均值、众数、标准差、总和、中值相对差、变异系数、峰度、偏度等
  • 直方图:分类和数字
  • 相关性:Spearman、Pearson 和 Kendall 矩阵
  • 缺失值:矩阵、计数、热图和缺失值的树状图
  • 文本剖析:理解文本数据的类别(大写、空格)、脚本(拉丁文、西里尔文)和块(ASCII)
  • 文件和图像剖析:提取文件大小、创立日期和尺寸,并扫描截断的图像或蕴含 EXIF 信息的图像

大家能够在 pandas-profiling 的我的项目 📘GitHub 页面获取具体应用办法。

📌 机器学习

💡 PyCaret

PyCaret 是 Python 中的一个开源、低代码机器学习库,可主动执行机器学习工作流。它也是一个端到端的机器学习和模型管理工具,能够成倍地放慢试验周期,晋升工作开发效率。

与其余开源机器学习库相比,PyCaret 有着显著的低代码特质,可仅用几行代码实现本来须要数百行代码实现的工作,尤其是对于密集的试验迭代过程能够大大提速。PyCaret 实质上是围绕多个机器学习库和框架封装而成,包含大家相熟的 Scikit-Learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt 和 Ray 等。

大家能够通过 Pycaret 的 📘官网文档,📘官网 GitHub,📘官网教程 理解更多应用细节。

📌 深度学习

💡 PyTorch Lightning

PyTorch Lightning 是一个利用在深度学习 / 神经网络的 Python 低代码库,为 PyTorch 提供高级接口。

它具备高性能和轻量级的架构,以一种将钻研与工程拆散的形式来构建 PyTorch 代码,使深度学习试验更容易了解和反复。借助它能轻松构建分布式硬件上的可扩大深度学习模型。

官网介绍说,PyTorch Lightning 的设计是为了让大家能够将更多的工夫花在钻研上,而不是花在工程上。大家能够通过 PyTorch Lightning 的 📘官方网站 理解更多应用细节。

💡 Hugging Face Transformers

Hugging Face Transformers 是 Hugging Face 的开源深度学习工具库。借助 Transformers,大家能够十分不便疾速地下载最先进的预训练模型,利用在本人的场景中,或者基于本人的数据做再训练。

因为官网提供的大量预训练模型,咱们能够缩小计算费用(因为无需从头训练)。丰盛的模型笼罩多种数据类型和业务源,包含:

  • 文本:对文本进行分类、信息抽取、问答零碎、机器翻译、摘要生成,文本生成(笼罩 100 多种语言)
  • 图像:图像分类、指标检测和图像宰割
  • 音频:语音辨认和音频分类

PyTorch、TensorFlow 和 JAX 是三个最驰名的深度学习库,transformers 的对这三个框架都反对得很好,甚至能够在一个框架中用三行代码训练模型,在另一个框架中加载模型并进行推理。

大家能够通过 Hugging Face Transformers 的 📘官方网站 和 📘GitHub 理解更多应用细节。

参考资料

  • 📘 D-Tale 官网 Github: https://github.com/man-group/dtale
  • 📘 AutoViz 官网示例 Jupyter Notebook: https://github.com/AutoViML/AutoViz/tree/master/Examples
  • 📘 Lux 官网 GitHub: https://github.com/lux-org/lux
  • 📘 pandas-profiling 我的项目 GitHub: https://github.com/ydataai/pandas-profiling
  • 📘 Pycaret 官网文档: https://pycaret.gitbook.io/
  • 📘 Pycaret 官网 GitHub: https://www.github.com/pycaret/pycaret
  • 📘 Pycaret 官网教程: https://pycaret.gitbook.io/docs/get-started/tutorials
  • 📘 PyTorch Lightning 官方网站: https://www.pytorchlightning.ai/
  • 📘 Hugging Face Transformers 官方网站: https://huggingface.co/
  • 📘 Hugging Face Transformers GitHub: https://github.com/huggingface/transformers
正文完
 0