Python Pandas读取修改excel操作攻略

13次阅读

共计 2039 个字符,预计需要花费 6 分钟才能阅读完成。

环境:python 3.6.8
以某米赛尔号举个例子吧:

>>> pd.read_excel(‘1.xlsx’, sheet_name=’Sheet2′)
名字 等级 属性 1 属性 2 天赋
0 四九幻曦 100 自然 None 21
1 圣甲狂战 100 战斗 None 0
2 时空界皇 100 光 次元 27
我们在这里使用了 pd.read_excel()函数来读取 excel,来看一下 read_excel()这个方法的 API,这里只截选一部分经常使用的参数:
pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None)

io: 很明显, 是 excel 文件的路径 + 名字字符串
(有中文的话 python2 的老铁需要使用 decode()来解码成 unicode 字符串) 例如:
>>> pd.read_excel(‘ 例子 ’.decode(‘utf-8))

sheet_name: 返回指定的 sheet 如果将 sheet_name 指定为 None,则返回全表如果需要返回多个表, 可以将 sheet_name 指定为一个列表, 例如 [‘sheet1’, ‘sheet2’] 可以根据 sheet 的名字字符串或索引来值指定所要选取的 sheet

>>> # 如:
>>> pd.read_excel(‘1.xlsx’, sheet_name=0)
>>> pd.read_excel(‘1.xlsx’, sheet_name=’Sheet1′)
>>> # 返回的是相同的 DataFrame
header: 指定数据表的表头, 默认值为 0, 即将第一行作为表头
usecols:读取指定的列, 也可以通过名字或索引值
>>> # 如:
>>> pd.read_excel(‘1.xlsx’, sheet_name=1, usecols=[‘ 等级 ’, ‘ 属性 1 ’])
>>> pd.read_excel(‘1.xlsx’, sheet_name=1, usecols=[1,2])
>>> # 返回的是相同的 DataFrame
直到某一天泰格尔升了一级, 可以这样改一下, 当然用.iloc 或.loc 对象都可以
>>> # 读取文件
>>> data = pd.read_excel(“1.xlsx”, sheet_name=”Sheet1″)

>>> # 找到 等级 这一列,再在这一列中进行比较
>>> data[‘ 等级 ’][data[‘ 名字 ’] == ‘ 泰格尔 ’] += 1
>>> print(data)
LOOK!他升级了!!
>>> data
名字 等级 属性 1 属性 2 天赋
0 艾欧里娅 100 自然 冰 29
1 泰格尔 81 电 战斗 16
2 布鲁克克 100 水 None 28
现在我们将它保存
data.to_excel(‘1.xlsx’, sheet_name=’Sheet1′, index=False, header=True)
index: 默认为 True, 是否加行索引, 直接上图吧!左为 False, 右为 True

header: 默认为 True, 是否加列标, 上图吧!左为 False, 右为 True

而 io, sheet_name 参数用法同函数 pd.read_excel()

如果我们多捕捉几只或者多加几种属性怎么办呢?这里给出参考:
新增列数据:data[‘ 列名称 ’] = [值 1, 值 2, ……]
>>> data[‘ 特性 ’] = [‘ 瞬杀 ’, ‘None’, ‘ 炎火 ’]
>>> data
名字 等级 属性 1 属性 2 天赋 特性
0 艾欧里娅 100 自然 冰 29 瞬杀
1 泰格尔 80 电 战斗 16 None
2 布鲁克克 100 水 None 28 炎火
新增行数据,这里行的 num 为 excel 中自动给行加的 id 数值 data.loc[行的 num] = [值 1,值 2,…], (注意与.iloc 的区别)
>>> data.loc[3] = [‘ 小火猴 ’, 1, ‘ 火 ’, ‘None’, 31, ‘None’]
>>> data
名字 等级 属性 1 属性 2 天赋 特性
0 艾欧里娅 100 自然 冰 29 瞬杀
1 泰格尔 80 电 战斗 16 None
2 布鲁克克 100 水 None 28 炎火
3 小火猴 1 火 None 31 None
说完了增加一行或一列,那怎样删除一行或一列呢?可以使用.drop()函数
>>> # 删除列, 需要指定 axis 为 1,当删除行时,axis 为 0
>>> data = data.drop(‘ 属性 1 ’, axis=1) # 删除 ` 属性 1` 列
>>> data
名字 等级 属性 2 天赋 特性
0 艾欧里娅 100 冰 29 瞬杀
1 泰格尔 80 战斗 16 None
2 布鲁克克 100 None 28 炎火
3 小火猴 1 None 31 None

>>> # 删除第 3,4 行,这里下表以 0 开始,并且标题行不算在类, axis 用法同上
>>> data = data.drop([2, 3], axis=0)
>>> data
名字 等级 属性 2 天赋 特性
0 艾欧里娅 100 冰 29 瞬杀
1 泰格尔 80 战斗 16 None

>>> # 保存
>>> data.to_excel(‘2.xlsx’, sheet_name=’Sheet1′, index=False, header=True)
大家具体可以参考官网提供的 API:http://pandas.pydata.org/pand…

正文完
 0