df = pd.DataFrame()
    date_col = ['Dip Time']
    data = pd.read_csv(atg_path, delimiter=',', skiprows=[1], skipinitialspace=True,
                                   dayfirst=True,
                                   parse_dates=date_col)

这里它跳过了第一行的数据。但我需要它。

If I use skiprows=[0], then I get errors on some columns, e.g. ValueError: 'Dip Time' is not in list

我不知道为什么?它不应该跳过任何数据。有什么问题吗?

3 个评论
smci
你是否想跳过阅读页眉, or the 第一行数据 ("aaa,bbb,...")?你究竟想用skiprows=[0]达到什么目的?你的问题不清楚。
smci
替换代码0】(整数)意味着"不要跳过任何行"所以它没有影响。而skiprows = [0](有一个元素的列表,0)意味着"跳过第0行,即标题行"所以它跳过标题(有列名)并读入数据。
smci
The pandas.read_csv() doc解释了skiprows作为一个整数和一个列表的作用。
python
pandas
csv
Ratha
Ratha
发布于 2019-10-04
1 个回答
jezrael
jezrael
发布于 2019-10-04
已采纳
0 人赞同

我认为这里的参数skiprows是没有必要的,你可以省略它。

但如果通过0值,则意味着don't skip any rows

skiprows=0
import pandas as pd
from io import StringIO
temp="""Site,Tank ID,Product,Volume,Temperature,Dip Time
aaa,bbb,ccc,ddd,eee,fff
a,b,c,d,e,f
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp))
print (df)
  Site Tank ID Product Volume Temperature Dip Time
0  aaa     bbb     ccc    ddd         eee      fff
1    a       b       c      d           e        f
temp="""Site,Tank ID,Product,Volume,Temperature,Dip Time
aaa,bbb,ccc,ddd,eee,fff
a,b,c,d,e,f
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), skiprows=0)
print (df)
  Site Tank ID Product Volume Temperature Dip Time
0  aaa     bbb     ccc    ddd         eee      fff
1    a       b       c      d           e        f

但如果通过[0],就意味着删除文件的第一行,这里的头,意味着"skip the 0'th row, i.e. the headed row

temp="""Site,Tank ID,Product,Volume,Temperature,Dip Time
aaa,bbb,ccc,ddd,eee,fff
a,b,c,d,e,f
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'