import os
os.chdir('C:/Users/Administrator/Desktop')
df = pd.read_excel('数据.xls', index_col=False)
-
index_col=0——第一列为index值
import pandas as pd
import os
os.chdir('C:/Users/Administrator/Desktop')
df = pd.read_excel('数据.xls', index_col=0)
这是没有index的情况:
在第一列生成了一个0-9的索引列
>>> stu = pad.read_excel("d:\\resu\\python_test\\练习文件\\例题源程序-学生\\data\\studentsInfo.xlsx",'Group1')
序号 ...
1.index_col 默认值(index_col = None)——重新设置一列成为index值
2.index_col=False——重新设置一列成为index值
3.index_col=0——第一列为index值
index_col=0,将第一列变为index。
函数用于从Excel文件中读取数据并将其转换为DataFrame对象。这使得我们可以利用pandas库的强大功能来进行数据分析与处理。接下来,我们将详细解释每个参数的作用及应用场景。
index_col的值有三种,整数型,序列,布尔,并且是可选的,默认是None
如果您的文件格式不正确,每行末尾都有分隔符,则可以考虑使用index_col=false强制pandas不使用第一列作为索引(行名)。
在默认为None的时候,pandas会自动将第一列作为索引,并额外添加一列。所以大多我们会使用index_col=0,直接将第一列作为索引,不额外添加列。
import io
import pandas
pandas是python中的一个库,read_csv是pandas的读取csv数据的一个函数。而index_col是read_csv中的一个参数。用来指定表格的索引值。
来看下pandas官方文档是怎么定义index_col的:
index_col : int, sequence or bool, optional
Column t
1 Excel文件的读取
import pandas as pd
df=pd.read_excel(r'C:\01Pylearn\air_data.xlsx', sheet_name='sheet1', index_col=0, header = 0, usecols=0, nrows=5)
#r 为转义符,避免路径里面的\被转义,亦可以不加,但是‘\’要换成‘/’
#sheet_name = ‘sheet1’, 指定打开表格里
index_col: int or sequence or False, default None
用作行索引的列编号或者列名,如果给定一个序列则有多个行索引。
如果文件不规则,行尾有分隔符,则可以设定index_col=False 来使得pandas不使用第一列作为行索引。
train_df = pd.read_csv('./input/train.csv')
print...
1.index_col 默认值(index_col = None)——重新设置一列成为index值
2. index_col=False——重新设置一列成为index值
3.index_col=0——第一列为index值
Pandas 基础
2.1 文件的读取和写入2.1.1 文件读取2.1.2 数据写入3.1 基本数据结构3.1.1 Series3.1.2 DataFrame4.1 常用基本函数4.1.1 汇总函数4.1.2 特征统计函数4.1.3 唯一值函数4.1.4 替换函数4.1
padas自动识别或区分数据和表头
对于index_col来说,若数据都是相同类型,比如数值型,则表示无index,输出默认index为0,1,2,…;若数据第一列为字符,其他列为数值,则会将第一列视为index;若设置index_col=False, 则表示无index(默认将0, 1, 2,…作为数据的index)
对header,当第一行为字符,则第一行默认为表头;当第一行与其他数据类型相同时,也会把第一行当作表头,所以无表头时应设置header=N.