我有一个EXCEL数据,我用Python pandas读进去。
import pandas as pd
data = pd.read_csv('..../file.txt', sep='\t' )
模拟数据看起来像这样。
unwantedjunkline1
unwantedjunkline2
unwantedjunkline3
ID ColumnA ColumnB ColumnC
1 A B C
2 A B C
3 A B C
在这种情况下,数据在打头之前包含3个垃圾行(我不想读进去的行),有时它还包含4个或更多的垃圾行,所以在这种情况下,我读进了数据。
data = pd.read_csv('..../file.txt', sep='\t', skiprows = 3 )
数据看起来像。
ID ColumnA ColumnB ColumnC
1 A B C
2 A B C
3 A B C
但每次不需要的线的数量都不同有什么办法可以在不使用'skiprows='的情况下用pandas读入一个表格文件,而是使用一些与文件头相匹配的命令,这样它就知道从文件头开始读了? 这样我就不用每次都要点击打开文件来计算文件中包含多少不需要的行,然后再手动改变'skiprows='选项。