相关文章推荐
慷慨大方的香烟  ·  ajax ...·  9 月前    · 
求醉的剪刀  ·  c# datetime format ...·  1 年前    · 
开朗的洋葱  ·  win8: ...·  1 年前    · 
豪气的青蛙  ·  Day 21 Puppeteer API ...·  1 年前    · 
new_line = line.strip() # 去除尾部的\n data.append(new_line) array = c_array[-1].split('\t') # \t表示tab键,去除tab键空格 label.append(array[-2]+' '+array[-1]) print('data:',data) print('label:',label)

(1)因为按行读取文本数据,会附带将行末的换行符“\n”读进去,因此需要strip()函数去除换行符。

(2)第一行的读取结果如图所示,可以发现每一行四个元素之间以制表符隔开,因此使用split()函数将四个元素提取出来。但是,split的结果却是将四个元素生成了五个元素,观察输入文本发现,split将每行的最后一个元素中的一个空格键误认为tab键进行分割了。这点不知道是什么原因,但是针对文本,可以将生成的array数组中的倒数两个数重新连接,便还原了原始元素。

该文本的最终输出结果是

剔除重复的,可以set一下,结果如下

print(set(label))
{'normal no lenses', 'normal hard', 'reduced no lenses', 'normal soft'}
数据 可以发现文本的最后一列数据是由几个单独的字符串构成,那么如何读取呢? 代码with open(filename,"r") as f: data = [] label = [] # 按行读取数据 for line in f.readlines(): new_line = line.strip() # 去除尾部的\n ... 目前大多数的 数据 集以 txt 文件 居多,但是我们在 数据 处理 ,可能最终会在Excel上进行一些分析、制图, 当然也可以使用 python 制图包,也可以做出很精美的结果图。 此篇只是简单的 读取 文件 ,保存到Excel ,可以做一些回归分析、相关系数等; txt 的原始 数据 这段代码 ,我们首先使用pandas库的`read_csv`函数 读取 CSV 文件 ,并将`header`参数设置为`None`,表示不使用第一行作为 名。然后,我们通过`iloc`方法获取第一行,将其作为 名,并将其从 数据 删除。最后,我们将修改后的 数据 保存到一个新的CSV 文件 。 需要注意的是,如果CSV 文件 包含非ASCII字符,可能需要指定 文件 编码。例如,如果CSV 文件 使用UTF-8编码,可以将`read_csv`函数调用修改为: ``` python df = pd.read_csv('data.csv', header=None, encoding='utf-8')