在臨床試驗中,除了對受試對象個體進行篩選外,樣本含量也會進行估算,樣本含量的多少也會對臨床試驗造成一定的影響。
一、樣本含量
樣本含量( sample size)是指在臨床試驗中需要多少數量的受試對象。樣本含量估算的重要意義在于,合適的樣本含量有助于研究者用最合理的資源發現有意義的臨床差異(如果這個差異確實存在的話)。過少的樣本含量難以準確回答試驗所研究的科學問題,而過多的樣本含量是巨大的資源浪費。
二、樣本含量估算方法
樣本含量估算方法必須基于明確設計方法、假設檢驗和主要研究目的指標的特性。例如, 臨床試驗、診斷性試驗、病因學研究有不同的樣本含量估算方法;臨床研究中平行對照設計、交叉對照設計、Williams 設計、序貫設計、連續測量設計等都有不同的樣本含量估算方法;主要目的指標是計數資料或計量資料需要不同的樣本含量估算方法;基于計量資料的 t 檢驗和 F 檢驗,基于計數資料的卡方檢驗和 Fisher’s exact test 等都有不同的樣本含量估算方法;差異性檢驗、非劣效性檢驗和等效性檢驗也有不同的樣本含量估算方法,等等。
三、樣本含量變化的基本影響因素
▶ 檢驗水平(α)
Ⅰ型錯誤表示, 統計推斷拒絕了實際上成立的無效假設(H0)。Ⅰ型錯誤的概率用 α 表示,進行統計推斷時, 研究者需要對容許犯Ⅰ型錯誤的大小作出規定,通常是 α≤0.05,檢驗水平 α 值越小,所需樣本含量越大。
▶ 把握度(power, 1-β )
Ⅱ型錯誤表示,統計推斷的結果不拒絕實際上不成立的 H0, 其出現的概率用 β 表示,β 值越小,所需要的樣本含量越大。根據實際情況,通常規定 β≤0.10,必要時,可取 β=0.20。
▶ 變異(σ )
變異指樣本中所包含的個體的差異程度。個體之間的差異越大,所需要的樣本含量越大,反之,若個體之間的差異越小,則所需要觀察的例數越少。
▶ 臨床有意義的差值(δ )
臨床有意義的差值也可稱為組間效應的差異程度,即不同藥物可能的療效差異。組間差異越大,所需要的病例數越少,反之,則所需要觀察的病例數較多。
▶ 單側檢驗和雙側檢驗
差異性檢驗和等效性檢驗需要雙側檢驗,而非劣效性檢驗和優效性檢驗需要單側檢驗。單側檢驗所需樣本含量少于雙側檢驗。
----------------------------------------------------------------------
參考文獻:
1. 《藥物臨床試驗質量管理規范》(GCP) 2020版。
2. Center for Drug Evaluation , Food and Drug Administration. Guideline for the format and content of the clinical and statistical sections of an application [J/OL].
3. 國家食品藥品監督管理局.藥物研究技術指導原則(2005 年)[M].北京:中國醫藥科技出版社,2006. 161-173.
4. 楊進波.探討藥物臨床試驗中樣本量及相關問題[ J ].中國臨床藥理學雜志,2007;23 :68-69.
5. CCTS工作組,陳平雁 執筆 臨床試驗中樣本量確定的統計學考慮,中國衛生統計,2015,32(4):(727-733).
6. Lai T L , Lavori P W , Shih M C . Adaptive Trial Designs[M]. Annu Rev Pharmacol Toxicol, 2012.
7. Noordzij M , Dekker F W , Zoccali C , et al. Sample size calculations.[J]. Nephron Clinical Practice, 2011, 118(4):319-323.
-----------------------------------------------------------------------
供稿 / 醫學部 于麗杰
|