创建Pandas DataFrame的6种方法

Pandas是Python的数据分析利器,DataFrame是Pandas进行数据分析的基本结构,可以把DataFrame视为一个二维数据表,每一行都表示一个数据记录。本文将介绍创建Pandas DataFrame的6种方法。

创建Pandas数据帧的六种方法如下:

  • 创建空DataFrame
  • 手工创建DataFrame
  • 使用List创建DataFrame
  • 使用Dict创建DataFrme
  • 使用Excel文件创建DataFrame
  • 使用CSV文件创建DataFrame

1、创建空的Pandas DataFrame

学编程,上 汇智网 ,在线编程环境,一对一助教指导。

首先我们看一下如何创建一个空的DataFrame(数据帧):

pd.DataFrame(columns=['A', 'B', 'C'], index=[0,1,2])

columns参数用来定义列名,index参数用来定义行号。上面的代码创建了一个3行3列的二维数据表,结果看起来是这样:


嗯,所有数据项都是NaN。

2、手工创建Pandas DataFrame

接下来让我们看看如何使用 pd.DataFrame 手工创建一个Pandas数据帧:

df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'])

使用data参数来声明数据,结果看起来是这样:


由于我们没有定义数据帧的列名,因此Pandas默认使用序号作为列名。和原来一样,可以使用columns参数来声明列名:

df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates', 'Eggfruit'], 
                  columns=['Fruits'])

结果如下:



最左侧的列被称为索引,默认从0开始,和原来一样我们用index自行定义:

df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'], 
                  index = [1,2,3,4,5],
                  columns=['Fruits'])

现在的数据帧看起来是这样:



那么如果要添加一个Quantity列来表示水果数量该怎么做?

pd.DataFrame(data=[['Apple',5],
                   ['Banana',10],
                   ['Cherry',8],
                   ['Dates',3],
                   ['Eggfruit',7]],