pandas 修改 DataFrame 列名

本文参考自:pandas 修改 DataFrame 列名原博客针对每个DataFrame.columns中的元素做相同的修改操作而拙作是对每个元素做不同操作的生搬硬套, 请大家不吝赐教
提出问题
存在一个名为dataset的DataFrame
>>> dataset.columns
Index([‘age’, ‘job’, ‘marital’, ‘education’, ‘default’, ‘housing’, ‘loan’,
‘contact’, ‘month’, ‘day_of_week’, ‘duration’, ‘campaign’, ‘pdays’,
‘previous’, ‘poutcome’, ’emp.var.rate’, ‘cons.price.idx’,
‘cons.conf.idx’, ‘euribor3m’, ‘nr.employed’, ‘y’],
dtype=’object’)
现在, 我要将其columns名字改为:
>>> new_columns
Index([‘age_0’, ‘job_1’, ‘marital_2’, ‘education_3’, ‘default_4’, ‘housing_5’,
‘loan_6’, ‘contact_7’, ‘month_8’, ‘day_of_week_9’, ‘duration_10’,
‘campaign_11’, ‘pdays_12’, ‘previous_13’, ‘poutcome_14′,
’emp.var.rate_15′, ‘cons.price.idx_16’, ‘cons.conf.idx_17’,
‘euribor3m_18’, ‘nr.employed_19’, ‘y_20′],
dtype=’object’)
该如何操作？
解决
一.通过DataFrame.columns类的自身属性修改:
1.无脑赋值直接修改
>>> # 先解决`new_columns`的推导问题
>>> # 列表推导
>>> new_columns_list = [column_str+’_’+str(i) for i ,column_str in enumerate(dataset.columns)]
>>> # 类型转换
>>> new_columns = pd.core.indexes.base.Index(new_columns_list)
>>> dataset.columns = new_columns
2.通过.map(mapper, na_action=None)函数来修改
>>> # 注:mapper 多运用 lambda 表达式
>>> # 但我似乎没有找到在 lambda 表达式中改变两个值的方法
>>> # 所以只能蹩脚地用一个全局变量i, 和映射函数mapper()
>>> # 希望大家能帮我找到方法

>>> i = 0
>>> def mapper(x): # 映射函数即 mapper
global i
x += ‘_’ + str(i)
i += 1
return x
>>> dataset.columns.map(mapper)
3.参考博客用到了DataFrame.columns.str对象
用help(DataFrame.columns.str)翻遍了文档，也没能找到可以被我拿来套用的方法, 想着抽时间把这段文档翻译一下
二.通过DataFrame.rename()函数来修改
1.暴力字典法(好处：可以只修改特定的列)
>>> # 此处先用字典推导法
>>> new_dict = {
key:key+’_’+str(i)
for i, key in enumerate(dataset.columns)
}
>>> dataset.rename(columns=new_dict, inplace=True)
2.映射修改法
>>> # 原博文依然用到了 lambda 表达式
>>> # 我就再生搬硬套一次, 把上面的复制过来
>>> # 蹩脚地用一个全局变量i, 和映射函数mapper()

>>> i = 0
>>> def mapper(x): # 映射函数即 mapper
global i
x += ‘_’ + str(i)
i += 1
return x
dataset.rename(columns=mapper, inplace=True)
写在最后
十分欢迎大家直接修改拙作或提出建议！！！

pandas 修改 DataFrame 列名

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

pandas 修改 DataFrame 列名

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复