pandas 筛选符合条件的索引
时间: 2024-05-05 13:14:18
浏览: 77
在 pandas 中,我们可以使用布尔索引(Boolean indexing)来筛选符合条件的数据。布尔索引是一种通过传递布尔值(True 或 False)来选择数据的方法。其原理是:对于一个DataFrame或Series[对象](https://geek.csdn.net/educolumn/04c51611e4b730957464192e0307b82c?spm=1055.2569.3001.10083),我们可以将条件[表达](https://geek.csdn.net/educolumn/1410a16bee391aa5cfc33ba70e3247b7?spm=1055.2569.3001.10083)式应用到数据集上,返回的是一个由布尔值组成的DataFrame或Series[对象](https://geek.csdn.net/educolumn/04c51611e4b730957464192e0307b82c?spm=1055.2569.3001.10083),对于表中每一行或每一个元素,如果满足条件,那么相应的位置就会返回True,否则就会返回False。可以使用这个布尔型的DataFrame或Series[对象](https://geek.csdn.net/educolumn/04c51611e4b730957464192e0307b82c?spm=1055.2569.3001.10083)作为索引,从而得到我们想要的数据。
举个例子,假设我们有以下的一个DataFrame[对象](https://geek.csdn.net/educolumn/04c51611e4b730957464192e0307b82c?spm=1055.2569.3001.10083)df:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)})
print(df)
```