基于这个相关问题替换代码,似乎Excel使用的是\n。chr(10)作为换行,但你的文件有\r\n。chr(13)chr(10)。避免这种情况的一个方法是进行替换操作。每次你看到\r\n,就用\n替换它。在向pandas发送之前,我在缓冲区内修改文件。
import numpy as np
import os
import glob
def read_files(path):
df2 = pd.DataFrame()
data = pd.DataFrame()
for each in os.listdir(path):
sub_path = path+"/"+each
files = glob.glob(os.path.join(sub_path, "*.xlsx"))
for f in files:
with open(f, 'rb') as fp:
text = fp.read().replace(b'\r\n', b'\n')
df = pd.read_excel(text)
