这一节,主要深入学习 Pandas 的用法。
一、筛选
先建立一个 6X4 的矩阵数据。
dates = pd.date_range(‘20180830’, periods=6)
df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates, columns=[‘A’,’B’,’C’,’D’])
print(df)
打印:
A B C D
2018-08-30 0 1 2 3
2018-08-31 4 5 6 7
2018-09-01 8 9 10 11
2018-09-02 12 13 14 15
2018-09-03 16 17 18 19
2018-09-04 20 21 22 23
简单的筛选
如果我们想选取 DataFrame 中的数据,下面描述了两种途径, 他们都能达到同一个目的:
print(df[‘A’])
print(df.A)
“””
2018-08-30 0
2018-08-31 4
2018-09-01 8
2018-09-02 12
2018-09-03 16
2018-09-04 20
Freq: D, Name: A, dtype: int64
“””
让选择跨越多行或多列:
print(df[0:3])
“””
A B C D
2018-08-30 0 1 2 3
2018-08-31 4 5 6 7
2018-09-01 8 9 10 11
“””
print(df[‘20180830′:’20180901’])
“””
A B C D
2018-08-30 0 1 2 3
2018-08-31 4 5 6 7
2018-09-01 8 9 10 11
“””
如果 df[3:3] 将会是一个空对象。后者选择 20180830 到 20180901 标签之间的数据,并且包括这两个标签。
还可以通过 loc, iloc, ix 进行选择。