关于pandas:pandas数据分析-pandasDataFrame数据修改索引设置数据组合

微信公众号：Python 集中营
简略的事件反复做，反复的事件保持做，保持的事件用心做;
你的必定是我保持的能源，如果这篇文章对你有帮忙，点个关注吧！

相干扩大库

1# -*- coding: UTF-8 -*-23import pandas as pd456data_dict = {'first_col': [1, 2, 3, 4], 'second_col': [5, 6, 7, 8]}78df = pd.DataFrame(data_dict)

数据批改

 1import numpy as np 2 3# 转换某一列的数据类型 4 5df['first_col']=pd.DataFrame(df['first_col'],dtype=np.float32) 6 7# 从新定义列名 8 9df.columns = ['first_col_1','second_col_1']1011print(df)1213# 批改局部列名1415df.rename(columns = {'first_col_1':'first_col_2','second_col_1':'second_col_2'},inplace = True)1617print(df)1819# 依照某个或多个字段排序,ascending = False为降序、ascending = True为升序2021df = df.sort_values(by=['first_col_2','second_col_2'],ascending = False)2223print(df)2425# 依照索引排序,ascending = False为降序、ascending = True为升序2627df = df.sort_index(axis = 0,ascending = True)2829print(df)3031# 按数据地位批改数据,如下将第二行、第二列数据批改为93233df.iloc[1,1] = 93435print(df)3637# 现有列计算生成新的列3839df['third_col_2'] = df['first_col_2'] + df['second_col_2']4041#    first_col_2  second_col_2  third_col_242# 0          1.0             5          6.043# 1          2.0             9         11.044# 2          3.0             7         10.045# 3          4.0             8         12.0

索引设置

 1# 从新设置索引 2 3df['index']=range(len(df['first_col'])) 4 5df.set_index(df['index']) 6 7print(df) 8 9# 设置日期为索引,定义日期范畴:start开始日期、periods数据行数1011date = pd.date_range(start='1/1/2021',periods=len(df['first_col']))1213df = df.set_index(date)1415print(df)

数据连贯与组合

 1# 定义两个DataFrame数据 2 3df1 = pd.DataFrame(data_dict) 4 5df2 = pd.DataFrame(data_dict) 6 7# concat() 函数连贯,axis=0示意当两个数据对象连接时存在不同的列不会生成新的列,axis=1示意会生成新的列 8 9df3=pd.concat([df1,df2],axis=0)1011print(df3)1213# 扩大函数append() 向df1中增加df2中的所有行、最初赋值给df31415df3 = df1.append(df2.loc[:])1617print(df3)

DataFrame输入

 1# excel保留 2 3df.to_excel('/usr/data.xls') 4 5# csv 保留 6 7df.to_csv('/usr/data.csv') 8 9# 输入字典模式1011dict_ = df.to_dict(orient="dict")1213print(dict_)

更多精彩返回微信公众号【Python 集中营】，专一于 python 技术栈，材料获取、交换社区、干货分享，期待你的退出~