在 Pandas 中,可以使用 set_index() 函数将某一列设置为索引。
语法: DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
其中,keys 是要设置为索引的列的名称或序号。
drop 参数默认为 True,表示将设置为索引的列从数据中删除,如果设置为 False 则保留该列。
inplace 参数默认为 False,表示返回一个新的 DataFrame,如果设置为 True 则在原 DataFrame 上进行修改。
示例代码:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Chicago', 'Los Angeles']}
df = pd.DataFrame(data)
# 将 name 列设置为索引
df.set_index('name', inplace=True)
print(df)
输出结果:
age city
Alice 25 New York
Bob 30 Chicago
Charlie 35 Los Angeles
注意:如果要将多列设置为索引,可以将多列名称放入一个列表中作为 set_index() 函数的参数。
df.set_index(['name','age'], inplace=True)
这里将name和age都设置为索引,即成为了多级索引