numpy 填充缺失值

在 NumPy 中,可以使用 numpy.nan 表示缺失值。如果数组中存在缺失值,可以使用 numpy.isnan() 函数来判断。

对于缺失值的处理,可以使用 numpy.nan 或其他数值来填充缺失值。可以使用 numpy.nan_to_num() 函数将缺失值替换为指定的值,例如:

import numpy as np
# 创建一个包含缺失值的数组
a = np.array([1, 2, np.nan, 3, np.nan, 4])
# 将缺失值替换为 0
b = np.nan_to_num(a, nan=0)
print(b)
[1. 2. 0. 3. 0. 4.]

也可以使用 numpy.ma.masked_array() 函数创建一个掩码数组,将缺失值标记为掩码值,然后对掩码数组进行操作,例如:

import numpy as np
# 创建一个包含缺失值的数组
a = np.array([1, 2, np.nan, 3, np.nan, 4])
# 创建掩码数组
masked_a = np.ma.masked_array(a, np.isnan(a))
# 对掩码数组进行操作
mean_a = np.mean(masked_a)
print(mean_a)

在这个例子中,numpy.ma.masked_array() 函数将缺失值标记为掩码值,使得这些值不会参与计算。numpy.mean() 函数计算不包含掩码值的平均值。

  •