相关文章推荐
心软的香菜  ·  查找标点符号,除了- ...·  6 月前    · 
会搭讪的蚂蚁  ·  How to Configure the ...·  1 年前    · 
帅呆的黄瓜  ·  Pytest测试框架系列 - ...·  1 年前    · 

将数据某一列设为索引

将userid列设为索引列,inplace=True表示在原df上修改,drop=False表示保留userid列,默认删除userid列。

# 将userid列设为索引列
df.set_index('userid', inplace=True, drop=False)
# 若修改后可以这么查询userid为500的数据
df.loc[500]
# 相当于
df.loc[df['userid'] == 500]

使用index提升查询性能

  • 如果index是唯一的,Pandas会使用哈希表优化,查询性能为O(1);
  • 如果index不是唯一的,但是有序,Pandas会使用二分查找算法,查询性能为O(logN);
  • 如果index是完全随机的,那么每次查询都要扫描全表,查询性能为O(N);
# 判断index是否递增
df.index.is_monotonic_increasing
# 判断index是否唯一
df.index.is_unique

index自动对齐数据

import pandas as pd
s1 = pd.Series([1,2,3], index=list('abc'))
s2 = pd.Series([2,3,4], index=list('bcd'))
s1+s2

s1为
在这里插入图片描述
s2为
在这里插入图片描述
s1+s2结果为,相同索引b、c分别相加,a、d因无法相加操作返回NaN
在这里插入图片描述
*此文仅为个人笔记

用于储存一行或者一列的数据,以及与之相关的索引的集合;(与列表相似) from pandas import Series; x = Series(['a',True, 1], index=['first','second','third']); 追加新元素 这里需要对追加的结果进行接收,这里与列表的方式不同! n = Series(['2']) x = x.append...
我整理的一些关于【数据分析】的项目学习资料(附讲解~~)和大家一起分享、学习一下:https://edu.51cto.com/surl=f5rw22Python DataFrame索引类型转换 在PythonPandas库中,DataFrame是一种非常重要的数据结构,它用于存储和处理表格数据。DataFrame的每一...
import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data') df = pd.read_csv('03_Alcohol_Consumption.csv') df.head()
##Pandas索引index的用途 '''把数据存储于普通的column列也能用于数据查询,那使用index有什么好处?index的用途总结: 1.更方便的数据查询; 2.使用index可以获得性能提升; 3.自动的数据对齐功能; 4.更多更强大的数据结构支持;''' import pandas as pd df =pd.read_csv('F:\\python387\\pandas\\antlearnpandasmaster\\datas\\ml_latest_small\\ratings.csv'.
Python pandas index索引 查看,修改索引df = pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]}) print (df) #查看索引 print (df.index) #修改索引 df.index =["tom","mark","ann"] print (df) print (df.index) 在上面的示例中,`set_index('A')` 将列 'A' 设置为 DataFrame 的索引,并通过 `inplace=True` 修改了原始 DataFrame。 你也可以使用 `reset_index()` 方法来还原索引: ```python df.reset_index(inplace=True) 这会将索引还原为默认的整数索引