讲者首先从现有的 AI 算法所存在的一些问题(如识别错误)引入,类比现有的非 AI 程序中存在的 bug,来解释 AI 程序中的 bug——不公平问题是如何产生的,继而给出了 AI 算法(尤指神经网络)中“公平”的定义。报告介绍的论文提出了一种检测神经网络不公平因素的模型(ADF)和验证神经网络算法有效性的方法(PFA)。在检测方面,其巧妙地利用神经网络中回传的梯度,对输入特征进行干扰,从而高效、准确地测试出干扰项。在验证方面,则将训练后的神经网络的隐藏层中蕴含的信息进行提取、聚类,从而对原神经网络进行抽象,更方便最终的验证。在与几种已有的检测、验证神经网络算法的方法比较之后,实验结果显示作者提出的方法获得了较好的效果。