梁 绮红
南方医科大学公共卫生学院生物统计学系,广东 广州 510515,
Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China
余 晓琳
南方医科大学公共卫生学院生物统计学系,广东 广州 510515,
Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China
安 胜利
南方医科大学公共卫生学院生物统计学系,广东 广州 510515,
Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China
南方医科大学公共卫生学院生物统计学系,广东 广州 510515,
Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China
[
23
]
,即均方误的大小(公式1)。当均方误较大组所对应的样本量占比增加时,其w增加,检验效能提高,反之,检验效能降低。本研究中,第3组均方误最大,第1组其次。所以若增加第3组样本量或第1、3组样本量同时增加时,则降低了均方误较小组所占比例,导致检验效能增加。因此,为了保持或提高检验效能,可适当增加均方误较大组的样本量占比,但组间样本量不宜差异过大(比如样本量比值为1: 1: 4或20: 1: 20);(2)总样本量不固定时(
),单独增加某组样本量可提高检验效能,且组的均方误越大,检验效能增幅越高。提示若不考虑总样本量的限制,建议选择增加均方误最大组的样本量。
对于Kruskal-Wallis
H
检验,(1)总样本量固定时(
),无论增加一组还是同时增加两组样本量占比,只要牵涉第2组的样本量占比增加,则检验效能降低,且降幅较大;第1或第3组样本量占比单独增加时,检验效能随占比的增加,可能先升高,后降低;若同时增加第1、3组的占比,则占比越大,检验效能越高,即使组间样本量差异较大时(如20: 1: 20),仍有较大增幅;(2)总样本量不固定时(
),类似单因素方差分析,检验效能的增幅与增加样本量的组别有关。但是增加总样本量所导致的检验效能增幅与固定总样本量条件下,增加均方误较大组样本量近似。因此,为提高检验效能,可考虑提高均方误较大组样本量占比,同时又不必增加总样本量。
我们的前期研究仅对非平衡设计下的单因素方差分析中样本量与检验效能的关系进行了探讨
[
24
]
,本文对包含Kruskal-Wallis
H
检验在内的两种方法均进行了研究,显示两种方法的结果略有不同:(1)总样本量固定时,若同时增加两个均方误较大组的样本量占比,虽然两种检验方法的检验效能均有增加,但是对于单因素方差分析,组间样本量差异不宜太大,而Kruskal-Wallis
H
检验不受此影响;(2)总样本量不固定时,单因素方差分析中,增加均方误最大组的样本量导致的检验效能增幅最大,而Kruskal-Wallis
H
检验中,均方误较大组各自所导致的检验效能增幅差别不明显;(3) Kruskal-Wallis
H
检验中,不固定总样本量时,单独增加较大均方误所在组的样本量,与固定总样本量条件下增加较大均方误所在组样本量占比所引起的检验效能的增幅相当,但是单因素方差分析仍然是增加总样本量所引起的检验效能增幅更大。
总之,当总样本量固定时,可根据文献或预实验结果,适当减少预计均方误较小组的样本量、增加均方误较大组的样本量、且最好是同时增加多个均方误较大组的样本量占比;当总样本量不固定,增加均方误较大组的样本量可使得检验效能的增幅更明显;对于KruskalWallis H检验,相较于增加总样本量,通过调整各组样本量比值也能获得较高的检验效能,且更具有成本优势。因此,为了节约实验资源,避免样本量太大而造成浪费
[
25
]
,对于Kruskal-Wallis
H
检验,建议优先考虑通过调整各组样本比来提高检验效能,而非直接增加样本量。若出于成本、时间等限制需要减少样本量时,建议优先减少均方误较小组的样本量,使其对检验效能的影响降到最低。
本研究尚有以下不足:在针对Kruskal-Wallis
H
检验的模拟研究中,均基于从正态分布抽样产生数据,但在实际情况下,Kruskal-Wallis
H
检验可适用于各种分布情形。在其他各种分布、甚至分布形态不明的情形下是否仍然具有与本次研究相同的结论,尚需进一步探讨。
Funding Statement
国家自然科学基金(71673126);南方医科大学大学生创新创业训练计划项目(201912121272)
Supported by National Natural Science Foundation of China (71673126)