关于pandas:pandas数据分析-pandasDataFrame数据修改索引设置数据组合

1次阅读

共计 1663 个字符,预计需要花费 5 分钟才能阅读完成。

微信公众号:Python 集中营
简略的事件反复做,反复的事件保持做,保持的事件用心做;
你的必定是我保持的能源,如果这篇文章对你有帮忙,点个关注吧!

相干扩大库
1# -*- coding: UTF-8 -*-
2
3import pandas as pd
4
5
6data_dict = {'first_col': [1, 2, 3, 4], 'second_col': [5, 6, 7, 8]}
7
8df = pd.DataFrame(data_dict)
数据批改
 1import numpy as np
 2
 3# 转换某一列的数据类型
 4
 5df['first_col']=pd.DataFrame(df['first_col'],dtype=np.float32)
 6
 7# 从新定义列名
 8
 9df.columns = ['first_col_1','second_col_1']
10
11print(df)
12
13# 批改局部列名
14
15df.rename(columns = {'first_col_1':'first_col_2','second_col_1':'second_col_2'},inplace = True)
16
17print(df)
18
19# 依照某个或多个字段排序,ascending = False 为降序、ascending = True 为升序
20
21df = df.sort_values(by=['first_col_2','second_col_2'],ascending = False)
22
23print(df)
24
25# 依照索引排序,ascending = False 为降序、ascending = True 为升序
26
27df = df.sort_index(axis = 0,ascending = True)
28
29print(df)
30
31# 按数据地位批改数据, 如下将第二行、第二列数据批改为 9
32
33df.iloc[1,1] = 9
34
35print(df)
36
37# 现有列计算生成新的列
38
39df['third_col_2'] = df['first_col_2'] + df['second_col_2']
40
41#    first_col_2  second_col_2  third_col_2
42# 0          1.0             5          6.0
43# 1          2.0             9         11.0
44# 2          3.0             7         10.0
45# 3          4.0             8         12.0
索引设置
 1# 从新设置索引
 2
 3df['index']=range(len(df['first_col']))
 4
 5df.set_index(df['index'])
 6
 7print(df)
 8
 9# 设置日期为索引, 定义日期范畴:start 开始日期、periods 数据行数
10
11date = pd.date_range(start='1/1/2021',periods=len(df['first_col']))
12
13df = df.set_index(date)
14
15print(df)
数据连贯与组合
 1# 定义两个 DataFrame 数据
 2
 3df1 = pd.DataFrame(data_dict)
 4
 5df2 = pd.DataFrame(data_dict)
 6
 7# concat() 函数连贯,axis= 0 示意当两个数据对象连接时存在不同的列不会生成新的列,axis= 1 示意会生成新的列
 8
 9df3=pd.concat([df1,df2],axis=0)
10
11print(df3)
12
13# 扩大函数 append() 向 df1 中增加 df2 中的所有行、最初赋值给 df3
14
15df3 = df1.append(df2.loc[:])
16
17print(df3)
DataFrame 输入
 1# excel 保留
 2
 3df.to_excel('/usr/data.xls')
 4
 5# csv 保留
 6
 7df.to_csv('/usr/data.csv')
 8
 9# 输入字典模式
10
11dict_ = df.to_dict(orient="dict")
12
13print(dict_)

更多精彩返回微信公众号【Python 集中营】,专一于 python 技术栈,材料获取、交换社区、干货分享,期待你的退出~

正文完
 0