关于python:python数据分析pandas的excel基本数据操作附加篇

54次阅读

共计 1143 个字符,预计需要花费 3 分钟才能阅读完成。

1、下载并导入相干扩大库
1# 下载扩大库
2pip install xlrd
3pip install pandas
4# -*- coding: UTF-8 -*-
5
6# 导入 pandas 库
7import pandas as pd
2、筹备数据文件

3、读取文件工作表
 1# 读取 excel 文件指定工作表数据
 2
 3print("工作表:data1 数据内容")
 4data_fram_data1 = pd.read_excel('C:/python 集中营 /pandas 操作 excel 数据 /data.xls', sheet_name='data1')
 5print(data_fram_data1)
 6
 7print("工作表:data2 数据内容")
 8data_fram_data2 = pd.read_excel('C:/python 集中营 /pandas 操作 excel 数据 /data.xls', sheet_name='data2')
 9print(data_fram_data2)
10
11print("工作表:data3 数据内容")
12data_fram_data3 = pd.read_excel('C:/python 集中营 /pandas 操作 excel 数据 /data.xls', sheet_name='data3')
13print(data_fram_data3)
4、excel 基本操作
 1# 查看所有列名
 2print(data_fram_data3.columns)
 3# 查看数据类型
 4print(data_fram_data3.dtypes)
 5
 6# 查看前 10 行数据
 7print(data_fram_data3.head(10))
 8# 查看姓名到年龄的所有列数据
 9print(data_fram_data3.loc[:,'姓名':'年龄'])
10# 查看第一到三行、姓名到年龄的所有列数据
11print(data_fram_data3.loc[1:3,'姓名':'年龄'])
12
13# 删除姓名列
14data_fram_data3 = data_fram_data3.drop(['姓名'],axis=1)
15print(data_fram_data3)
16# 删除年龄 == 6 的行
17data_fram_data3 = data_fram_data3.loc[-(data_fram_data3['年龄'] == 6)]
18print(data_fram_data3)
19
20# 移除年龄反复的数据
21data_fram_data3 = data_fram_data3.drop_duplicates(['年龄'])
22print(data_fram_data3)

更多精彩返回微信公众号【Python 集中营】,专一于 python 技术栈,材料获取、交换社区、干货分享,期待你的退出~

正文完
 0