在 NumPy 中,可以使用
numpy.nan
表示缺失值。如果数组中存在缺失值,可以使用
numpy.isnan()
函数来判断。
对于缺失值的处理,可以使用
numpy.nan
或其他数值来填充缺失值。可以使用
numpy.nan_to_num()
函数将缺失值替换为指定的值,例如:
import numpy as np
# 创建一个包含缺失值的数组
a = np.array([1, 2, np.nan, 3, np.nan, 4])
# 将缺失值替换为 0
b = np.nan_to_num(a, nan=0)
print(b)
[1. 2. 0. 3. 0. 4.]
也可以使用 numpy.ma.masked_array()
函数创建一个掩码数组,将缺失值标记为掩码值,然后对掩码数组进行操作,例如:
import numpy as np
# 创建一个包含缺失值的数组
a = np.array([1, 2, np.nan, 3, np.nan, 4])
# 创建掩码数组
masked_a = np.ma.masked_array(a, np.isnan(a))
# 对掩码数组进行操作
mean_a = np.mean(masked_a)
print(mean_a)
在这个例子中,numpy.ma.masked_array()
函数将缺失值标记为掩码值,使得这些值不会参与计算。numpy.mean()
函数计算不包含掩码值的平均值。