得到结果,可以看到显示False的变量,如Date、Location、RainTomorrow 是没有缺失值的
而True则表示有缺失值
Date False
Location False
MinTemp True
MaxTemp True
Rainfall True
Evaporation True
Sunshine True
WindGustDir True
WindGustSpeed True
WindDir9am True
WindDir3pm True
WindSpeed9am True
WindSpeed3pm True
Humidity9am True
Humidity3pm True
Pressure9am True
Pressure3pm True
Cloud9am
import pandas as pd# data即为数据pd.isnull(data).any()得到结果,可以看到变量Date、Location、RainTomorrow 是没有缺失值的Date FalseLocation FalseMinTemp TrueMaxTemp TrueRainfall TrueEvaporation TrueSunshine
缺失值
的产生原因多种多样,主要分机械原因和人为原因。
机械原因是由机械导致的
数据
缺失,比如
数据
存储的失败、存储器损坏、机械故障导致某段时间的
数据
未能收集(对于定时
数据
采集而言)。
人为原因是由人的主观失误、历史局限或有意隐瞒造成的
数据
缺失。
2.观察
数据
是否
存在
缺失值
当我们拿到一个
数据集
时,我们无法第一时间看出
数据集
中
是否
有
缺失值
,因此本次博客主要介绍7
中
方法来观察
数据集
中
是否
存在
缺失值
:
首先我们先导入需要的
数据
:
import numpy as np
我们在处理
数据
的时候,经常需要检查
数据
的质量,也需要知道出问题的
数据
在哪个位置。我找了很久,也尝试了很多办法,都没能找到一种非常直接的函数,本文所要介绍的是一种我认为比较方便的方法:np.where()
我举个例子
import
pandas
as pd
import numpy as np
df = pd.DataFrame(np.arange(12).reshape(4,3), ind...
在
Python
中
,可以
使用
Pandas
库
来
查看
缺失值
。
Pandas
是一个强大的
数据
处理
库
,可以方便地进行
数据分析
和处理。
下面是一些
Pandas
中
查看
缺失值
的方法:
1.
使用
is
null
() 函数
查看
数据
中
所有的
缺失值
```
python
import
pandas
as pd
# 读取
数据
data = pd.read_csv('data.csv')
#
查看
缺失值
print(data.is
null
())
2.
使用
is
na
() 函数
查看
数据
中
所有的
缺失值
```
python
import
pandas
as pd
# 读取
数据
data = pd.read_csv('data.csv')
#
查看
缺失值
print(data.is
na
())
3.
使用
is
null
().sum() 函数
查看
每一列的
缺失值
数量
```
python
import
pandas
as pd
# 读取
数据
data = pd.read_csv('data.csv')
#
查看
每一列的
缺失值
数量
print(data.is
null
().sum())
4.
使用
drop
na
() 函数删除所有含有
缺失值
的行
```
python
import
pandas
as pd
# 读取
数据
data = pd.read_csv('data.csv')
# 删除所有含有
缺失值
的行
data.drop
na
(inplace=True)
以上是一些常用的
Pandas
查看
缺失值
的方法,希望能对你有所帮助。