python pandas dataframe filter string

对于使用 Pandas 操作 DataFrame 中的字符串类型数据进行筛选,可以使用 Pandas 的字符串方法和条件筛选语句来实现。

首先,我们可以使用 Pandas 的字符串方法,例如 contains() startswith() endswith() match() 等,来选取 DataFrame 中符合特定条件的字符串。

例如,假设我们有一个 DataFrame df ,其中包含一个名为 name 的字符串类型列,我们想筛选出所有以字母 "A" 开头的字符串,可以使用以下代码:

import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Adam', 'Amy', 'Tom']})
result = df[df['name'].str.startswith('A')]

这样,result 变量中将保存所有以字母 "A" 开头的字符串。

除此之外,还可以使用条件筛选语句来选取 DataFrame 中符合特定条件的行。例如,我们可以使用 ==!=>>=<<= 等条件语句来进行筛选。

假设我们有一个 DataFrame df,其中包含一个名为 name 的字符串类型列和一个名为 age 的整数类型列,我们想筛选出所有名字为 "Alice" 且年龄大于等于 18 岁的行,可以使用以下代码:

import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Adam', 'Amy', 'Tom'], 'age': [20, 19, 17, 21, 18]})
result = df[(df['name'] == 'Alice') & (df['age'] >= 18)]

这样,result 变量中将保存所有符合条件的行。

总之,使用 Pandas 对 DataFrame 中的字符串数据进行筛选,可以通过字符串方法和条件筛选语句来实现。这两种方法都可以根据具体的需求选择使用。

  •