NumPy 是一种用于数值计算的 Python 库,提供了大量的数组和矩阵操作函数。其中,
numpy.ndarray
类是 NumPy 中最基本的数组对象,可以通过
numpy.array()
函数创建。
在数据处理中,经常会遇到缺失值的情况。
numpy.ndarray
类中提供了
numpy.isnan()
和
numpy.nanmean()
函数来处理缺失值。具体而言,可以先使用
numpy.isnan()
函数找出数组中的缺失值,再使用
numpy.nanmean()
函数计算数组中非缺失值的均值,最后使用
numpy.ndarray
类的
numpy.ndarray.fill()
方法将缺失值替换为均值。
下面是使用 NumPy 处理缺失值的示例代码:
import numpy as np
# 创建一个含有缺失值的数组
arr = np.array([1, 2, np.nan, 4, 5])
# 找出数组中的缺失值
mask = np.isnan(arr)
# 计算非缺失值的均值
mean = np.nanmean(arr)
# 将缺失值替换为均值
arr[mask] = mean
# 输出结果
print(arr)
在上述示例代码中,numpy.isnan() 函数用于找出数组 arr 中的缺失值,将缺失值的位置标记为 True,形成一个布尔类型的掩码数组 mask。numpy.nanmean() 函数用于计算数组 arr 中非缺失值的均值,并将结果赋值给变量 mean。最后,使用 numpy.ndarray.fill() 方法将数组 arr 中的缺失值替换为均值。