pandas读取行和列
最近在学习用python做数据分析,pandas的这个库当然是学习的重点,关于网上的一些教程,太杂了,看完这个看那个,就容易弄混,而且有很多事用不上的,所以我打算自己写一个关于pandas读取行和列的总结。
pandas的基本数据结构有两个:series、dataframe。
Series
Series其实就是一个一维数组,通过在对象后面加上[索引]就行了
import pandas as pd
obj=pd.Series([1,2,3,4])
print obj[1],obj.values,obj.index
Dataframe
Dataframe是pandas最常见的数据结构,因为运用pandas读文件的结构都是Dataframe结构。
1、读取行
读取行有三种方法,分别是loc,iloc,ix。
loc通过行标签索引来确定行的
import pandas as pd
d=[[1,2,3,4],[5,6,7,8]]
index=["one","two"]
df=pd.DataFrame(d, index=index)
print df.loc["one"]
iloc通过行号索引来确定行
import pandas as pd
d=[[1,2,3,4],[5,6,7,8]]
index=["one","two"]
df=pd.DataFrame(d, index=index)
print df.iloc[0]
ix就是iloc和loc的集合,loc和iloc的方法都可以用在ix上。
2、读取列
读取方式有三种,分别是[],"."和上面的三个。
import pandas as pd
d=[[1,2,3,4],[5,6,7,8]]
index=["one","two"]