基于这个相关问题替换代码,似乎Excel使用的是\n
。chr(10)
作为换行,但你的文件有\r\n
。chr(13)chr(10)
。避免这种情况的一个方法是进行替换操作。每次你看到\r\n
,就用\n
替换它。在向pandas
发送之前,我在缓冲区内修改文件。
import numpy as np
import os
import glob
def read_files(path):
df2 = pd.DataFrame()
data = pd.DataFrame()
for each in os.listdir(path):
sub_path = path+"/"+each
files = glob.glob(os.path.join(sub_path, "*.xlsx"))
for f in files:
with open(f, 'rb') as fp:
text = fp.read().replace(b'\r\n', b'\n')
df = pd.read_excel(text)