医疗器械临床试验中缺失数据处理⽅法研究
在临床试验实施过程中,常由于受试者的失访、依从性差、不良事件的出现、急救药物的使⽤等情况造成缺失数据。缺失数据减弱了随机试验的优势、降低试验的把握度、引⼊了潜在的偏倚[1-3],影响试验结果的解释和可信度[4]。忽略缺失数据的影响是不可取的,不恰当的缺失数据处理⽅法将引⼊更多的偏倚[5],如何处理缺失数据是临床试验研究中必须考虑的问题。
ICH E9以及我国《药物临床试验的⽣物统计学指导原则》均提出需考虑缺失值对试验结果的影响。美国⾷品药品监督管理局(Food and Drug Administration ,FDA)委托美国国家研究委员会(National Research Council,NRC)成⽴临床试验缺失数据处理⼯作组针对临床试验缺失数据问题进⾏研究并提出相应的建议,以减少缺失数据的出现,应⽤合适的统计分析⽅法处理含有缺失数据的试验[1]。欧洲药品管理局(European Medicines Agency,EMA)专门就如何处理由于患者退出临床试验或失访造成的数据缺失制订了相应的指导原则[5]。缺失数据处理⽅法的研究⼀直为临床试验评价的热点和难点。本⽂将介绍缺失数据相关的基本概念并就当前常见的缺失数据处理⽅法进⾏介绍。
1 缺失数据定义
缺失数据是指由于各种原因应该得到⽽没有得到的数据[6]。针对临床试验具体情况,需明确定义缺失数据。NRC 定义缺失数据为对于分析有意义却没有收集的数据[1]。若患者发⽣死亡,则死亡后的⽣
活质量评价由于对分析没有意义,不应被视为缺失。EMA主要讨论没有收集到受试者主要终点指标的缺失情况[5]。在ICH E9R1提出的估计⽬标框架下,应根据具体的估计⽬标判断某个数据是否为缺失值[7]。
©千库⽹
徐若瑄露点©千库⽹
2 缺失机制与缺失模式
林萍老公
2.1 缺失机制
LITTLE等[8]提出了以下3 种缺失机制类型:
完全随机缺失(Missing Completely at Random,MCAR):数据的缺失与观测和未观测到的数据均⽆关。假设Y为感兴趣的数据,Yo表⽰观测数据,Ym表⽰缺失数据,Y=(Yo,Ym)。R为缺失与否的指⽰变量。X为协变量,Xo表⽰观测数据,Xm表⽰缺失数据。MCAR缺失机制下P(R|Yo,Ym,Xo,Xm)=P(R) 。例如受试者因移居⽽脱落或者由于设计因素随机抽取部分受试者进⾏评估。此种机制假设较强,在临床试验中⼀般不成⽴。
随机缺失(Missing at Random,MAR):数据的缺失与观测到的数据有关,但与未观测到的数据⽆关,则
P(R|Yo,Ym,Xo,Xm)=P(R|Yo,Xo)。⽐如受试者因为观测到的疗效不佳⽽退出试验。MAR缺失机制更为常见,该假设允许使⽤观测到的数据预测/填补缺失数据。
⾮随机缺失(Missing Not at Random,MNAR):当数据的缺失不属于MCAR和MAR缺失机制下,换⾔之,数据的缺失与未观测的数据有关,则缺失为⾮随机缺失,也称缺失不可忽略。如在基于症状的临床试验中,受试者由于症状的恶化⽽退出试验,退出前的数据并未收集,或受试者由于不良事件退出试验,不再接受试验⼲预。该部分受试者脱落后症状的变化常不同于留在试验中具有相似协变量的受试者,此种情况下使⽤观测到的数据预测/填补缺失数据是不合适的。⽬前并没有⽅法可以识别数据的缺失属于以上何种缺失机制,分析⼈员需要考虑不同缺失机制对结果的影响,考查试验结果的稳健性。
2.2 缺失模式
缺失模式定义数据在何处缺失[1,9],主要分为单⼀缺失(univariate missing)、单调缺失(monotone missing)、⾮单调缺失(non-monotone missing/arbitrarymissing)。若观测⼀次的数据缺失,则为单⼀缺失。单调缺失和⾮单调缺失在纵向数据中出现,若Yj缺失则Yjtl也缺失(其中j表⽰访视点),则数据为单调缺失,否则为⾮单调缺失。明确数据的缺失模式有助于了解缺失原因以及缺失原因与结果的关系。⼜由于部分处理⽅法不适⽤于所有缺失模式,识别缺失模式也是有必要的。
3 常见的缺失数据处理⽅法
在临床试验试验设计、操作及数据管理过程中,应积极预防缺失数据的产⽣。当出现缺失数据时,⽬
前常⽤的处理⽅法⼤致可以分为基于完整数据、基于填补、基于极⼤似然和基于MNAR缺失机制四类。
3.1 基于完整数据
基于完整数据是缺失数据处理⽅法中最简单但是也较为常⽤的⽅法。主要有个案删除(listwise deletion)、变量删除和加权调整法。个案删除法是将具有缺失数据的受试者删除的⽅法,临床试验中常定义的符合⽅案集则属于此种处理⽅法。变量删除法不将整个受试者删除,仅在分析某⼀项数据时忽略缺失数据。个案删除法和变量删除法均基于MCAR缺失机制假设,若该假设不成⽴或者缺失数据⽐例较⼤,此种⽅法会产⽣偏倚。若数据缺失机制为MAR假设,加权调整法通过对完整数据进⾏加权修正,可⼀定程度降低偏倚,但需要选择合适的加权⽅法。基于完整数据的⽅法违背了ITT原则、降低检验效能、导致结论发⽣偏倚,不推荐其作为确证性临床试验中处理缺失数据主要的分析⽅法[10-13]。
3. 2 基于填补
基于填补法利⽤已观测数据填补缺失数据。根据缺失数据填补值个数,可以分为单⼀填补和多重填补。
3.2.1 单⼀填补
⽬前使⽤最⼴泛的单⼀填补法有末次观测结转、基线观测结转和最差观测结转,分别⽤最后⼀次观测数据、基线观测数据和所有观测数据中最差观测数据填补缺失值。其余单⼀填补⽅法还有均数填补、回归填补、EM算法填充、热层填补、冷层填补。单⼀填补⼤多简单易懂,但多数⽅法假设缺失数据的真实值与填补值相同的概率为1,此种假设低估了数据变异、歪曲数据的分布和数据间的关系。有研究表明常⽤的末次观测结转法并不总是保守的[11,14],除⾮有充分的科学依据,否则不应该采⽤末次观测结转法作为主要分析⽅法[1,15-16]。
3.2.2 多重填补
多重填补法由Rubin在1977年⾸次提出[17],该⽅法对每个缺失值填补多次得到多个完整的数据集,对每个完整数据集进⾏分析并进⾏结果的合并。因此,多重填补包括3个步骤,填补数据、数据分析及合并结果。其中,填补数据需要选择合适的填补模型,⽬前主要有以下⼏种填补模型:
线性回归线性回归填补模型适⽤于连续性变量单调缺失数据的填补,建⽴感兴趣数据与协变量的回归⽅程后,基于此⽅程从参数的后验预测分布模拟出新的⽅程⽤于缺失值的填补。
假设Yj是⼀个含有缺失值的连续性变量,建⽴回归⽅程Yj=β0+β1X1+β2X2+…+βkXk,其中,X=(X1,X1…Xk)为协变量,β^=(β^0,β^1…,β^k)为回归参数的估计值,对应的协⽅差矩阵为σ^2jVj,Vj=(X'X)-1。⽽后,从
(β^0,β^1…,β^k),σ^2j和Vj中模拟出新的参数β*=β^+σjV'hjZ和σ2*j=σ^2j(nj-k-1)/g,其中g为x2nj-k-1的随机变
量,nj为Yj中⽆缺失的观测数,Vhj为柯列斯基分解中的上三⾓矩阵(Vj=V'hjVhj) ,Z是k+1维的随机正态变量。最后,通过回归⽅程Y*j=β*0+β*1X1+β*2X2+…+β*kXk+zjσ*j产⽣缺失数据的填补值,其中,z j为标准正态的随机变量。
预测均数匹配(predictive mean matching)预测均数匹配填补模型适⽤于连续性变量单调缺失数据的填补,通过线性回归填补模型为缺失值计算得填补值后,选取最接近填补值的K个已观测数据后从中随机挑选⼀个进⾏填补。该填补模型确保了填补数据的值不超过已观测数据的最⼤最⼩值。K的选择需要谨慎,K过⼩将提⾼多次填补值的相关性,导致重复抽样中点估计的变异增⼤,⽽K过⼤将使填补模型效能降低,导致估计的偏倚。
倾向性得分(propensity score)倾向性得分填补模型适⽤于连续性变量单调缺失数据的填补,通过计算给定观测协变量的每个数据缺失概率的倾向性得分,将所有数据根据倾向性得分分组后对在每⼀组内应⽤近似贝叶斯bootstrap填补本组缺失值。该填补模型也可确保填补数据的值不超过已观测数据的最⼤最⼩值,但该⽅法仅利⽤了数据是否缺失的协变量信息,⽽未考虑变量间的相关性[2]。
Logistic回归和判别函数Logistic回归填补模型适⽤于分类变量单调缺失数据的填补。Logistic回归填补
分为两步,第⼀步为P步,与线性回归相似,在建⽴Logistic回归⽅程后从参数的后验预测分布模拟出新的回归⽅程,计算出每个缺失数据所属分类的概率。第⼆步为I步,通过⽐较均匀分布随机数与P步得到的概率⼤⼩,填补缺失数据。判别函数与Logistic回归类似,只是适⽤于多分类变量。
马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)MCMC填补模型适⽤于连续性变量⾮单调缺失数据的填补。MCMC为贝叶斯理论中⼀种探索后验概率的⽅法,假设数据服从多元正态分布,通过填补步和后验步的循环进⾏为缺失值抽取填补值。如第t 次迭代得到参数估计θ(t),填补步从P(Ymis|Yobs,θ(t))中抽取填补值Y(t+1)mis,后验步从
P(θ|Yobs,Y(t+1)mis)中抽取参数估计θ(t+1)。最后迭代⽣成马尔可夫链(Y(1)mis,θ(1),(Y(2)mis,θ(2),…,使之最终收敛于分布P(Ymis,θ|Yobs)。
全条件定义法(fully conditional specification,FCS)FCS填补模型不考虑被填补数据与已观测数据的联合分布,⽽是利⽤单个数据的条件分布建⽴⼀系列回归模型逐⼀填补并迭代。由于FCS将多维问题分解为多个⼀维问题,回归模型可以选择上述所有适⽤于单调缺失的模型,故可以应⽤于⾮单调缺失的所有类型数据,使⽤更加灵活[18-19]。假设Y= (Y1,Y2,…,Yj) 是⼀个含有缺失值的纵向数据,X为协变量,FCS迭代地从P(Yk|X,Yj* k,θk)条件分布中抽取填补值,在每次迭代抽取θk参数值时不使⽤缺失数据信息。
多重填补基于MAR缺失机制假设,通过多次填补增加填补数据的变异程度。在进⾏多重填补时,需合理构建填补模型和选择填补次数,对填补后数据集的分析建议与填补模型保持⼀致以避免填补模型和分析的⽭盾。填补模型中应纳⼊与缺失相关的、与待填补数据取值相关的以及填补后数据集分析中使⽤到的变量。建议在临床试验报告中不仅报告多重填补结果,还需报告使⽤的具体填补模型。
©千库⽹
3.3 基于极⼤似然
基于极⼤似然的⽅法是建⽴总体分布的参数模型,不需要对缺失数据进⾏填补,⽽是基于观测数据估计模型参数。基于极⼤似然估计的⽅法构建似然函数如下,其中θ,ψ是相互独⽴的模型参数。
L(θ,ψ|Y0,X,R)=∫p(y0,ym|x ; θ)p(r|y0,ym,x ; ψ) dym
finally found you= p(r|y0,x; ψ)∫p(y0,ym|x ; θ)dym
= p(r|y0,x ; ψ)p(y0|x ; θ)
常⽤的基于极⼤似然估计⽅法为重复测量的混合效应模型(mixed-effects model for repeated measures,MMRM)、⼴义混合模型。该⽅法基于MAR假设,通常情况下,需要有⾜够⼤的样本才能保证得到⽆偏的似然估计值。由于似然函数是基于完整数据的某个假定的参数模型,在实际应⽤中,如果模型假定错误,基于似然法的估计可能稳定也可能不稳定[20]。有模拟研究表明MMRM在处理MAR假设下的缺失数据中,可有效地控制⼀类错误,有较⾼的检验效能和较⼩的估计误差,建议将其作为主要的分析⽅法[21-23]。
3.4 基于MNAR缺失机制
上述三类处理⽅法⼤多基于MCAR或MAR,在临床试验中,由于⽆法验证MCAR或者MAR假设是否成⽴,需要考虑缺失机制为MNAR的敏感性分析,以考察结论的稳健性。处理MNAR缺失机制的模型有模式混合模型(pattern mixed model,PMM)、选择模型(selection model,SEM)和共享参数模型(shared parametermodel,SPM)。
近年来,由于PMM对缺失数据分布假设易于解释并具有临床意义,采⽤PMM对缺失数据进⾏敏感性分析受到青睐。PMM中,Y和R在观测协变量X条件下的联合分布为p(Yo,Ym,R|X) = p(Yo,Ym|R,X)p( R | X) =
东风破伴奏下载p(Ym|Yo,R,X)p(Yo|R,X) p(R|X)。MNAR 假设中,不同p(R|X)模式下p(Ym|Yo,R,X)与p(Yo|R,X)的关系不总是相同的。换⾔之,缺失数据的分布与观测数据的分布是不同的。根据不同的p(R|X)模式以及缺失数据与观测数据的不同假设,⽬前常⽤的有基于δ调整的PMM以及基于对照的PMM[24-27]。基于δ调整的PMM假设缺失数据⽐完整数据平均相差δ,相当于对缺失数据填补结果进⾏⼀定程度的惩罚。此⽅法的⼀个特殊应⽤为临界点分析法(tipping point) ,即
均相差δ,相当于对缺失数据填补结果进⾏⼀定程度的惩罚。此⽅法的⼀个特殊应⽤为临界点分析法(tipping point) ,即寻到⼀个δ使结论发⽣逆转[28-29]。基于对照组的PMM假设为,数据缺失后的分布与对照组类似。该假设在对照组为安慰剂或标准,试验组受试者脱落后采⽤标准的试
验设计中更为合理[27]。如,EMA发布阿尔茨海默病的药物临床研究指导原则指出,处理缺失数据时基于对照组受试者信息的模型更加合适[30]。⽆论是基于δ调整的PMM还是基于对照组的PMM都对缺失数据的分布进⾏较强的假设,使⽤时需结合实际情况考虑假设的合理性,也可同时考察多个假设,进⾏不同假设的敏感性分析。
4 总结
缺失数据在临床试验研究中是常见、难以避免的,缺失数据将降低试验的检验效能,也可能带来偏倚。因此,加强预防缺失值的产⽣、选择合适的处理⽅法显得尤为重要。⾸先,应根据试验设计,识别缺失数据。其次,在选择缺失数据处理⽅法时,应留意处理⽅法的假设条件(特别是对缺失机制的假设)及其局限性。删除法操作简单但基于MCAR假设且违背了ITT原则; 单⼀填补的⽅法对缺失数据的假设⼤多不属于MCAR且降低数据的变异程度,常⽤的末次观测结转法不被推荐作为主要分析⽅法。⽬前⽐较常见的基于MAR假设的处理⽅法主要有多重填补和基于极⼤似然的⽅法。多重填补考虑了缺失数据的变异性,但在选择填补模型时需注意各个模型的使⽤条件及其局限性,如MCMC模型假设数据服从多元正态分布,也存在⼀定的迭代收敛问题[9,18,31]。当样本量⾜够⼤时,采⽤基于极⼤似然的⽅法与多重填补有类似的结论,但模型假定的正确性对参数估计有较⼤影响[20]。若缺失机制为MNAR,若仍然使⽤以上⽅法将带来更多的偏倚,故需要考虑MNAR缺失机制下缺失数据的处理⽅法[1,5,25,32]。⽬前常⽤的是基于δ调整的PMM以及基于对照的PMM。两种⽅法对缺失数
据的分布有具体的假设,适⽤于探索结论稳健性的敏感性分析。
缺失值处理的研究⼀直是临床试验研究领域突出和热门的话题。近年来PERMUTT等结合估计⽬标的框架,将所有缺失数据作为最坏的结果,提出使⽤截断均数(trimmed mean)结合置换检验处理临床试验缺失数据等。有研究表明截断均数在假设合理的条件下是⼀个有⽤的缺失值处理分析⽅法[33-35]。在ICH E9R1估计⽬标框架下,临床试验对于缺失数据的定义将更加准确和具体,相应的处理⽅法也有待进⼀步更加细致深⼊的研究。everyoneisno.1
参考⽂献
[1]NATIONAL RESEARCH COUNCIL. The prevention and treatment of missing data in clinical trials[M]. 2nd edition. Washington: The National Academies Press,2010: 3-56.
[2]王骏,韩景静,黄钦. 临床试验缺失数据的统计学考量[J]. 中
国临床药理学杂志,2016,32(5) : 469-472.
[3]蒋志伟,李婵娟,王陵,等. 临床试验中缺失数据的预防与处
理[J]. 药学学报,2015,50(11) : 1402-1407.
[4]INTERNATIONAL CONFERENCE ON HARMONIZATION OF
Web_Site/ICH_Products/Guidelines/Efficacy/E9/Step4/E9_Guideline. pdf.
[6]岳勇,⽥考聪. 数据缺失及其填补⽅法综述[J]. 预防医学情
报杂志,2005,21( 6) : 683-685.
[8]LITTLE R J A,RUBIN D B. Statistical analysis with missing data[M]. 2nd edition. Hoboken: Wiley,2002: 25-30.
[9]BERGLUND P,HEERINGA S G. Multiple imputation of missing
data using SAS[M]. Kerry: SAS Institute,2014: 1-4.丁芙妮
[10]鲍晓蕾,⾼辉,胡良平. 多种填补⽅法在纵向缺失数据中的⽐
较研究[J]. 中国卫⽣统计,2016,33(1) : 45-48.