我正在寻找一种方法,只读取大量大型CSV文件的标题行。
使用Pandas,我有这样的方法,对每个csv文件都有。
>>> df = pd.read_csv(PATH_TO_CSV)
>>> df.columns
I could do this with just the csv module:
>>> reader = csv.DictReader(open(PATH_TO_CSV))
>>> reader.fieldnames
这些文件的问题是,每个CSV文件的大小都在500MB以上,如果只是为了提取标题行而读取每个文件的全部内容,似乎是一种巨大的浪费。
我做这一切的最终目的是为了拉出独特的列名。一旦我有了这些文件中的列头列表,我就可以做到这一点。
如何快速地只提取CSV文件的标题行?