df[ ].str.strip( )
先创建带有空格的df:
df = pd.DataFrame({'Company':['company A','company B','company C','company A'],
'Sales':['Peter ',' Amy','John ','Mi ke']})
Out[38]:
有时候需要删除数据表中某一列中包含指定字符串的行,可以使用pandas的字符串包含函数.str.contains:
pd.Series.str.contains(pat, case=True, flags=0, na=None, regex=True)
#pat是搜索字符,case表示是否区分大小写,flags表示是否传递给 re 模块的标志,regex=True则pat是一个正则表达式,regex=False表示pat是一个字符串
官网详细解释链接:https://pandas.pydata.org/d
df = pd.DataFrame([['AAA'], ['BBB'], ['CCC'],[123]])
# 删除含某特定字符串的行
df1 = df.drop(df[df[0].str.contains('A',na=False)])
# 删除含某特定数字的行
df2 = df.drop(df[df[0] == 123].index)
你可以使用 `pd.to_numeric` 函数来实现这个功能。首先你需要导入 pandas 库,然后使用如下代码即可将 DataFrame 中的金额字符串转换成整数。
import pandas as pd
# 假设你的 DataFrame 叫做 df,你想要转换的列叫做 "amount"
df["amount"] = pd.to_numeric(df["amount"])
如果你想要将转换后的数据类型设置为 int,可以使用如下代码:
df["amount"] = pd.to_numeric(df["amount"], downcast="integer")
这样就可以将 DataFrame 中的金额字符串转换为整数了。