共计 1052 个字符,预计需要花费 3 分钟才能阅读完成。
相干扩大库
1# -*- coding: UTF-8 -*-
2
3# 导入扩大库
4
5import pandas as pd
6
7import numpy as np
创立空 DataFrame 对象
1# 自定义列名创立空的 DataFrame 数据对象
2
3df = pd.DataFrame(columns={"name": "","age":"", "sex": "","score":"", "rate": ""})
4
5print(df)
6
7# Empty DataFrame
8# Columns: [name, age, sex, score, rate]
9# Index: []
数组创立 DataFrame 对象
1# 自定义数组创立 DataFrame 对象
2
3list_data = [['1', '2', '3']]
4
5df = pd.DataFrame(list_data, columns=['first', 'second', 'third'])
6
7print(df)
8
9# first second third
10# 0 1 2 3
字典创立 DataFrame 对象
1# 自定义字典类型的数据创立 DataFarme 对象
2
3data_dict = {'first_col': [1, 2, 3, 4], 'second_col': [5, 6, 7, 8]}
4
5df = pd.DataFrame(data_dict)
6
7print(df)
8
9# first_row second_row
10# 0 1 5
11# 1 2 6
12# 2 3 7
13# 3 4 8
文件返回 DataFrame 对象
1# 读取数据文件返回 DataFrame 对象
2
3df=pd.read_csv('/usr/load/data.csv',split=',')
4
5df=pd.read_csv('/usr/load/data.xls',sheet_name='data')
6
7print(df)
np 创立 DataFrame 对象
1# 应用 numpy 科学计算库提供的二维数组创立 DataFrame 对象
2
3data_array = np.random.rand(4, 2)
4
5df = pd.DataFrame(data_array, columns=['first', 'second'])
6
7print(df)
8
9# first second
10# 0 0.410413 0.510788
11# 1 0.726956 0.647775
12# 2 0.502573 0.226714
13# 3 0.926117 0.124414
更多精彩返回微信公众号【Python 集中营】,专一于 python 技术栈,材料获取、交换社区、干货分享,期待你的退出~
正文完