共计 1019 个字符,预计需要花费 3 分钟才能阅读完成。
在数据整顿实现后,接着就要对条件数据进行提取、并且筛选咱们所须要的数据,这就是本篇文章所要讲的数据的提取与筛选,跟本系列其余文章一样咱们采取实例的形式进行阐明。新来的童鞋请先查看本系列文章的后面几篇内容。
公众号:老王说编程 | 作者:老王
1,导入 python 库
# 导入 numpy 库,次要用于数据计算
import numpy as np
# 导入 pandas 库,次要用于读取 excel 数据、DataFrame 数据结构的应用
import pandas as pd
2,按标签提取数据
# 上篇文章(python-excel 数据处理)最初生成 data_inner 数据,它的类型是 DataFrame 构造的数据
# loc() 函数,提取索引列的第 4 行的数据
data_inner.loc[3]
# loc() 函数,提取索引列从第 1 行到第 4 行的数据
data_inner.loc[0:3]
# loc() 函数,提取第 4 行之前的数据行
data_inner.loc[:3]
3,按地位提取数据
# iloc() 函数,按第 3 行、第 2 列之前的区域进行数据提取
data_inner.iloc[:2,:1]
4,按条件提取数据
# 应用 isin() 函数 作为条件筛选出 name 列是 laowang、laow 的数据
# 再配合应用 loc() 筛选出数据
data_inner.loc[data_inner['name'].isin(['laowang','laow'])]
5,数据筛选
应用 DataFrame 数据结构的数据进行筛选,其实相似于 python 中调用数据库的 SQL 语句条件查问,在一个曾经整顿好的数据表中依据条件筛选出所须要的数据的过程。
# 留神:应用的是 & 作为“与”的条件判断
data_inner.loc[(data_inner['name'] == 'laow') & (data_inner['age'] > 25), ['id','name','age']]
# 留神:应用的是 & 作为“或”的条件判断
data_inner.loc[(data_inner['name'] == 'laow') | (data_inner['age'] > 25), ['id','name','age']]
# 留神:应用的是 & 作为“非”的条件判断,并且在筛选实现后依照年龄大小进行了排序
data_inner.loc[(data_inner['name'] != 'laow'), ['id','name','age']].sort(['age'])
更多精彩返回老王说编程 >>>
正文完