关于python:python数据分析-多种方式获取pandasDataFrame数据对象

6次阅读

共计 1052 个字符,预计需要花费 3 分钟才能阅读完成。

相干扩大库
1# -*- coding: UTF-8 -*-
2
3# 导入扩大库
4
5import pandas as pd
6
7import numpy as np
创立空 DataFrame 对象
1# 自定义列名创立空的 DataFrame 数据对象
2
3df = pd.DataFrame(columns={"name": "","age":"", "sex": "","score":"", "rate": ""})
4
5print(df)
6
7# Empty DataFrame
8# Columns: [name, age, sex, score, rate]
9# Index: []
数组创立 DataFrame 对象
 1# 自定义数组创立 DataFrame 对象
 2
 3list_data = [['1', '2', '3']]
 4
 5df = pd.DataFrame(list_data, columns=['first', 'second', 'third'])
 6
 7print(df)
 8
 9#   first second third
10# 0     1      2     3
字典创立 DataFrame 对象
 1# 自定义字典类型的数据创立 DataFarme 对象
 2
 3data_dict = {'first_col': [1, 2, 3, 4], 'second_col': [5, 6, 7, 8]}
 4
 5df = pd.DataFrame(data_dict)
 6
 7print(df)
 8
 9#    first_row  second_row
10# 0          1           5
11# 1          2           6
12# 2          3           7
13# 3          4           8
文件返回 DataFrame 对象
1# 读取数据文件返回 DataFrame 对象
2
3df=pd.read_csv('/usr/load/data.csv',split=',')
4
5df=pd.read_csv('/usr/load/data.xls',sheet_name='data')
6
7print(df)
np 创立 DataFrame 对象
 1# 应用 numpy 科学计算库提供的二维数组创立 DataFrame 对象
 2
 3data_array = np.random.rand(4, 2)
 4
 5df = pd.DataFrame(data_array, columns=['first', 'second'])
 6
 7print(df)
 8
 9#       first    second
10# 0  0.410413  0.510788
11# 1  0.726956  0.647775
12# 2  0.502573  0.226714
13# 3  0.926117  0.124414

更多精彩返回微信公众号【Python 集中营】,专一于 python 技术栈,材料获取、交换社区、干货分享,期待你的退出~

正文完
 0