The .gov means it’s official. Federal government websites often end in .gov or .mil. Before sharing sensitive information, make sure you’re on a federal government site. The https:// ensures that you are connecting to the official website and that any information you provide is encrypted and transmitted securely. As a library, NLM provides access to scientific literature. Inclusion in an NLM database does not imply endorsement of, or agreement with, the contents by NLM or the National Institutes of Health. Learn more about our disclaimer.
Nan Fang Yi Ke Da Xue Xue Bao. 2020 May 20; 40(5): 713–717.
PMCID: PMC7277317

Language: Chinese | English

定量资料非平衡设计下各组样本量对检验效能的影响

Influence of group sample size on statistical power of tests for quantitative data with an imbalanced design

梁 绮红

南方医科大学公共卫生学院生物统计学系,广东 广州 510515, Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China

Find articles by 梁 绮红

余 晓琳

南方医科大学公共卫生学院生物统计学系,广东 广州 510515, Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China

Find articles by 余 晓琳

安 胜利

南方医科大学公共卫生学院生物统计学系,广东 广州 510515, Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China 南方医科大学公共卫生学院生物统计学系,广东 广州 510515, Department of Biostatistics, School of Public Health, Southern Medical University, Guangzhou 510515, China [ 23 ] ,即均方误的大小(公式1)。当均方误较大组所对应的样本量占比增加时,其w增加,检验效能提高,反之,检验效能降低。本研究中,第3组均方误最大,第1组其次。所以若增加第3组样本量或第1、3组样本量同时增加时,则降低了均方误较小组所占比例,导致检验效能增加。因此,为了保持或提高检验效能,可适当增加均方误较大组的样本量占比,但组间样本量不宜差异过大(比如样本量比值为1: 1: 4或20: 1: 20);(2)总样本量不固定时( 表 2 ),单独增加某组样本量可提高检验效能,且组的均方误越大,检验效能增幅越高。提示若不考虑总样本量的限制,建议选择增加均方误最大组的样本量。

对于Kruskal-Wallis H 检验,(1)总样本量固定时( 表 3 ),无论增加一组还是同时增加两组样本量占比,只要牵涉第2组的样本量占比增加,则检验效能降低,且降幅较大;第1或第3组样本量占比单独增加时,检验效能随占比的增加,可能先升高,后降低;若同时增加第1、3组的占比,则占比越大,检验效能越高,即使组间样本量差异较大时(如20: 1: 20),仍有较大增幅;(2)总样本量不固定时( 表 4 ),类似单因素方差分析,检验效能的增幅与增加样本量的组别有关。但是增加总样本量所导致的检验效能增幅与固定总样本量条件下,增加均方误较大组样本量近似。因此,为提高检验效能,可考虑提高均方误较大组样本量占比,同时又不必增加总样本量。

我们的前期研究仅对非平衡设计下的单因素方差分析中样本量与检验效能的关系进行了探讨 [ 24 ] ,本文对包含Kruskal-Wallis H 检验在内的两种方法均进行了研究,显示两种方法的结果略有不同:(1)总样本量固定时,若同时增加两个均方误较大组的样本量占比,虽然两种检验方法的检验效能均有增加,但是对于单因素方差分析,组间样本量差异不宜太大,而Kruskal-Wallis H 检验不受此影响;(2)总样本量不固定时,单因素方差分析中,增加均方误最大组的样本量导致的检验效能增幅最大,而Kruskal-Wallis H 检验中,均方误较大组各自所导致的检验效能增幅差别不明显;(3) Kruskal-Wallis H 检验中,不固定总样本量时,单独增加较大均方误所在组的样本量,与固定总样本量条件下增加较大均方误所在组样本量占比所引起的检验效能的增幅相当,但是单因素方差分析仍然是增加总样本量所引起的检验效能增幅更大。

总之,当总样本量固定时,可根据文献或预实验结果,适当减少预计均方误较小组的样本量、增加均方误较大组的样本量、且最好是同时增加多个均方误较大组的样本量占比;当总样本量不固定,增加均方误较大组的样本量可使得检验效能的增幅更明显;对于KruskalWallis H检验,相较于增加总样本量,通过调整各组样本量比值也能获得较高的检验效能,且更具有成本优势。因此,为了节约实验资源,避免样本量太大而造成浪费 [ 25 ] ,对于Kruskal-Wallis H 检验,建议优先考虑通过调整各组样本比来提高检验效能,而非直接增加样本量。若出于成本、时间等限制需要减少样本量时,建议优先减少均方误较小组的样本量,使其对检验效能的影响降到最低。

本研究尚有以下不足:在针对Kruskal-Wallis H 检验的模拟研究中,均基于从正态分布抽样产生数据,但在实际情况下,Kruskal-Wallis H 检验可适用于各种分布情形。在其他各种分布、甚至分布形态不明的情形下是否仍然具有与本次研究相同的结论,尚需进一步探讨。

Biography

梁绮红,本科在读,E-mail: moc.qq@0975392401

Funding Statement

国家自然科学基金(71673126);南方医科大学大学生创新创业训练计划项目(201912121272)

Supported by National Natural Science Foundation of China (71673126)

References

1. Hogan JW, Peipert JF. Power and Sample Size. http://d.old.wanfangdata.com.cn/Periodical/dgjsxb200911020 JAVMA. 1990; 197 (7):38–40. [ Google Scholar ]
2. 钱 俊, 陈 平雁. 假设检验中计算观察检验效能的意义的探讨 中国卫生统计 2005; 22 (3):133–7. doi: 10.3969/j.issn.1002-3674.2005.03.002. [ CrossRef ] [ Google Scholar ]
3. 余 红梅. 实验设计样本含量与检验效能估计的讨论 中国卫生统计 2005; 22 (1):51–4. doi: 10.3969/j.issn.1002-3674.2005.01.019. [ CrossRef ] [ Google Scholar ]
4. 徐 勇勇, 孙 振球. 医学统计学. 北京: 人民卫生出版社; 2014. [ Google Scholar ]
5. 于莉莉.临床试验中区间检验的样本量与检验效能估计[D].西安: 第四军医大学, 2004.
http://cdmd.cnki.com.cn/article/cdmd-90026-2004080367.htm
6. 高 洪, 孙 平辉. 假设检验中检验效能的研究进展 中国热带医学 2007; 7 (2):270–2. doi: 10.3969/j.issn.1009-9727.2007.02.053. [ CrossRef ] [ Google Scholar ]
7. 陈 平雁. 临床试验中样本量确定的统计学考虑 http://d.old.wanfangdata.com.cn/Periodical/zgwstj201504058 中国卫生统计 2015; 32 (4):727–31, 733. [ Google Scholar ]
8. 林 洁, 孙 志明. SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较 http://d.old.wanfangdata.com.cn/Periodical/yycyzx201518034 中国医药导报 2015; 12 (18):133–7. [ Google Scholar ]
9. 姚 嵩坡, 刘 盛元, 王 滨有. 假设检验中检验效能的计算及SAS实现 中国卫生统计 2010; 27 (4):434–6. doi: 10.3969/j.issn.1002-3674.2010.04.039. [ CrossRef ] [ Google Scholar ]
10. Cohen J. Eta-squared and partial eta-squared in fixed factor anova designs. Educ Psychol Meas. 1973; 33 (1):107–12. doi: 10.1177/001316447303300111. [ CrossRef ] [ Google Scholar ]
11. Hoenig JM, Heisey DM. The abuse of power: The pervasive fallacy of power calculations for data analysis. Am Stat. 2001; 55 (1):19–24. doi: 10.1198/000313001300339897. [ CrossRef ] [ Google Scholar ]
12. 段 重阳, 吕 朵, 陈 平雁. 样本量估计及其在nQuery和SAS软件上的实现:均数比较(四 中国卫生统计 2012; 29 (2):279–83. doi: 10.3969/j.issn.1002-3674.2012.02.044. [ CrossRef ] [ Google Scholar ]
13. Lenth RV. Some practical guidelines for effective sample size determination. Am Stat. 2001; 55 (3):187–93. doi: 10.1198/000313001317098149. [ CrossRef ] [ Google Scholar ]
14. 丁 元林, 孔 丹莉. 多个样本及其两两比较的秩和检验SAS程序 中国卫生统计 2002; 19 (5):313–4. doi: 10.3969/j.issn.1002-3674.2002.05.021. [ CrossRef ] [ Google Scholar ]
15. 蔡伟斌. Monte Carlo模拟在Wilcoxon秩和检验样本量估计中的应用及其SAS实现[D].武汉: 华中科技大学, 2012.
http://cdmd.cnki.com.cn/Article/CDMD-10487-1014028323.htm
16. Shieh G, Jan S, Randles RH. On power and sample size determinations for the wilcoxon-mann-whitney test. J Nonparametric Stat. 2006; 18 (1):33–43. doi: 10.1080/10485250500473099. [ CrossRef ] [ Google Scholar ]
17. Berry KJ, Jr MP. Exact and Monte carlo resampling procedures for the wilcoxon-mann-whitney and kruskal-wallis tests. Perceptual Motor Skills. 2000; 91 (3 Pt 1):749. [ PubMed ] [ Google Scholar ]
18. 张 超, 胡 军, 陈 平雁. 完全随机设计两样本比较的非参数方法的检验功效比较 中国卫生统计 2008; 25 (3):230–2, 235. doi: 10.3969/j.issn.1002-3674.2008.03.002. [ CrossRef ] [ Google Scholar ]
19. 颜 杰, 李 彩霞, 方 积乾, et al. 完全随机设计两组t检验与秩和检验的功效比较 中国卫生统计 2004; 21 (1):10–3. doi: 10.3969/j.issn.1002-3674.2004.01.003. [ CrossRef ] [ Google Scholar ]
20. 丁 元林, 孔 丹莉. 检验效能在临床试验研究阴性结果评价中的应用 医学新知杂志 1997; 7 (2):95–6. [ Google Scholar ]
21. Lachin JM. Introduction to sample size determination and power analysis for clinical trials. http://d.old.wanfangdata.com.cn/NSTLQK/10.1016-0197-2456(81)90001-5/ Control Clin Trials. 1981; 2 (2):93–113. [ PubMed ] [ Google Scholar ]
22. Mumby PJ. Statistical power of non-parametric tests: a quick guide for designing sampling strategies. Mar Pollut Bull. 2002; 44 (1):85–7. doi: 10.1016/S0025-326X(01)00097-2. [ PubMed ] [ CrossRef ] [ Google Scholar ]
23. Lowerre JM. On the mean square error of parameter estimates for some biased estimators. Technometrics. 1974; 16 (3):461–4. doi: 10.1080/00401706.1974.10489217. [ CrossRef ] [ Google Scholar ]
24. 王 星杰, 汪 玉风, 潘 海燕, et al. 非平衡设计对检验效能的影响 http://d.old.wanfangdata.com.cn/Periodical/zgwstj201904041 中国卫生统计 2019; 36 (4):623–6. [ Google Scholar ]
25. Lewis JA. Statistical principles for clinical trials (ICH E9): an introductory note on an international guideline. Stat Med. 1999; 18 (15):1903–42. doi: 10.1002/(SICI)1097-0258(19990815)18:15<1903::AID-SIM188>3.0.CO;2-F. [ PubMed ] [ CrossRef ] [ Google Scholar ]

Articles from Journal of Southern Medical University are provided here courtesy of Editorial Department of Journal of Southern Medical University