0 True
1 False
2 True
3 True
4 True
dtype: bool
可见df.isnull().any()会判断哪些列包含缺失值,该列存在缺失值则返回True,反之False。
df.isnull().sum()
dtype: int64
isnull().sum()就更加直观了,它直接告诉了我们每列缺失值的数量。
Python pandas库中的isnull()函数问题描述python的pandas库中有一个十分便利的isnull()函数,它可以用来判断缺失值,我们通过几个例子学习它的使用方法。首先我们创建一个dataframe,其中有一些数据为缺失值。 import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand...
df = pd.read_csv(path=’file.csv’)
参数:header=None 用默认列名,0,1,2,3…
names=[‘A’, ‘B’, ‘C’…] 自定义列名
index_col=’A’|[‘A’, ‘B’…] 给索引列指定名称,如果是多重索引,可以传list
skiprows=[0,
python的pandas库中有⼀个⼗分便利的isnull()函数,它可以⽤来判断缺失值,我们通过⼏个例⼦学习它的使⽤⽅法。
⾸先我们创建⼀个dataframe,其中有⼀些数据为缺失值。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(10,99,size=(10,5)))
df.iloc[4:6,0] = np.nan
df.iloc[5:7,2] = np.nan
df.iloc[7,3] = np.n
ISNULL(参数1,参数2),判断参数1是否为NULL,如果是,返回参数2,否则返回参数1。
存储过程中使用,看懂下面的例子你就会了
IF ISNULL(@参数,’ ‘)<>’ ’
isnull和notnull:检测是否是空值,可用于df和series
dropna:丢弃、删除缺失值
axis : 删除行还是列,{0 or ‘index’, 1 or ‘columns’}, default 0
how : 如果等于any则任何值为空都删除,如果等于all则所有值都为空才删除
inplace : 如果为True则修改当前df,否则返回新的df
fillna:填充空值
value:用于填充的值,可以是单个值,或者字典(key是列名,value是值)
method : 等于ffill使用前
pandas 对于数据分析的人员来说都是必须熟悉的第三方库,pandas 在科学计算上有很大的优势,特别是对于数据分析人员来说,相当的重要。python中有了Numpy ,但是Numpy 还是比较数学化,还需要有一种库能够更加具体的代表数据模型,我们都非常的清楚在数据处理中EXCEL 扮演着非常重要的作用,表格的模式是数据模型最好的一种展现形式。
pandas 是对表格数据模型在python上的模拟,它有简单的像SQL 对数据的处理,能够方便的在python上实现。
pandas 的安装
pandas 在python上的安装同样的使用pip进行:
pip install pandas
DataFrame.loc
Access a group of rows and columns by label(s) or a boolean array.
.loc[] is primarily label based, but may also be used with a boolean array.
# 可以使用label值,但是也可以使用布尔值
Allowed inputs are: # 可以接受单个的label,多个label的列表,多个label的切片
A single label, e.g. 5 or ‘a’, (note that 5 is in