中国中西医结合杂志2009年2月第29卷第2期C J I T W M, F e b r u a r y 2009, V o l . 29, N o . 2·161·
·临床试验方法学·
实用性临床试验与解释性临床试验的比较
张彦红 梁伟雄 朱 磊 刘云涛 张万方 温泽淮
摘要
临床试验的设计实用性和分解释性两种, 实用性临床试验用来衡量一种治疗方法在日常的临床
实际中的效果, 而解释性临床试验是用来衡量一种治疗方法在理想条件下的治疗效能。目前国内对实用性临床试验方法介绍甚少, 本文对其特点和优缺点进行了介绍, 并以德国一项针刺疗法治疗腰背痛的实用性临床试验为例具体说明该方法实际中的具体应用, 对试验设计的关键步骤进行详细的解析, 并对实用性临床试验中的常见问题如内部准确度与外部准确度的平衡、结局的评价等问题做出了合理的建议。
关键词
实用性临床试验; 解释性临床试验
C o m p a r i s o n o f P r a g m a t i c C l i n i c a l T r i a l s a n dE x p l a n a t o r yC l i n i c a l T r i a l s Z H A N G Y a n -h o n g , L I A N G We i -x i o n g , Z H U L e i , e t a l D M EC e n t e r , G u a n g z h o u U n i v e r s i t y o f T r a d i t i o n a l C h i n e s e M e d i c i n e , G u a n g z h o u (510405)
A B S T R A C T Cl i n i c a l t r i a l s a r eo f t e nd e s i g n e da s e i t h e r p r a g m a t i c o r e x p l a n a t o r y . T h e p r a g m a t i c c l i n i c a l t r i -a l sa r eg e n e r a l l yu s e df o r m e a s u r i n gt h ee f f e c t i v e n e s s o f at r e a t m e n t i nc o m m o nc l i n i c a l p r a c t i c e , w h i l et h ee x -p l a n a t o r y t r i a l f o r m e a s u r i n gt h ee f f i c a c yo f at r e a t m e n t u n d e r i d e a l c o n d i t i o n s .S i n c et h em e t h o d sc o n c e r n i n g p r a g m a t i cc l i n i c a l t r i a l sa r el e s s i n t r o d u c e d i nC h i n a , i t s a r c h e t y p a l f e a t u r e s , a d v a n t a g e sa n dl i m i t a t i o n s w e r ei n -t r o d u c e di nt h i s p a p e r . A n dac u r r e n t s t u d yo f p r a g m a t i cc l i n i c a l t r i a l so nu s i n ga c p u n c t u r ef o r t r e a t m e n t o f l o w b a c k p a i nc a r r i e do u t i nG e r m a n w a s t a k e n a s a n e x a m p l e t o i l l u s t r a t e t h ep r a c t i c a l m e t h o d s c o n c r e t e l y . T h ek e y s t e p s o f t h ed e s i g nw e r ep r e s e n t e d i nd e t a i l , a n dr e a s o n a b l es u g g e s t i o n s a b o u t t h ep r o b l e m s o f t e n e n c o u n t e r e d i nt h et r i a l , a s w e l l a sh o w t ob a l a n c et h ei n t e r n a l a n de x t e r n a l v a l i d i t y , o u t c o m em e a s u r e m e n t , e t c . , w e r eo f -f e r e d .
K E YWO R D S p r a g m a t i cc l i n i c a l t r i a l s ; e x p l a n a t o r y c l i n i c a l t r i a l s
实用性临床试验(p r a g m a t i c c l i n i c a l t r i a l s , P C T s ) 作为一种灵活的临床研究方法, 在国外已被认可并较多的应用, 它是与解释性临床试验(e x p l a n a t o r y c l i n i -c a l t r i a l s ) 相对而言的一种试验方法, 用以回答临床决策者所面临问题而设计的试验, 旨在帮助医疗卫生做出循证的决策。
临床试验的设计分解释性和实用性两种, 实用性
试验用来衡量一种治疗方法在日常的临床实践中的效果(e f f e c t i v e n e s s ) , 而解释性试验是用来衡量一种治疗方法在理想的实验条件下对严格符合受试条件的受试者的治疗效能(e f f i c a c y , 一般与安慰剂作对照) 。它们的区别最早由S c h w a r t z D 等
〔2〕
〔1〕
试验应用相对较少, 但近年来以实用性试验为研究设计的临床试验在国外正逐年增多, 常被应用于初级保健和替代疗法的研究。实用性临床试验以其独特的优势适合替代医学(在我国主要指中医药学) 研究。但在国内目前关于“实用性临床试验”尚鲜有人报道, 本文旨在对实用性试临床试验的特点和应用作一概括性的介绍, 希望能够起到抛砖引玉的效果, 引起国内研
究学者对该试验方法的关注。
1 实用性试验方法的特点、优势与不足 实用性临床试验是与解释性临床试验相对而言的。解释性的试验通常选择在大型的健康中心进行, 患者是同质性的, 并具有良好的依从性, 除了要治疗的疾病外通常不合并其他疾病。解释性试验确保控制除干预措施之外的所有变量来达到最大化内部准确度的目的。而实用性试验追求最大程度的外部准确度以使结果具有外推性
〔3〕
提出, 后又由M a c R a e
K D 进行了进一步的阐述, 两种方法在临床试验中都很重要, 但它们回答的问题不同。我们目前所应用
的临床研究方法大多为解释性临床试验, 实用性临床
基金项目:“十一五”国家科技支撑计划课题(N o . 2006B A I 04A 213)
作者单位:广州中医药大学D M E 中心(广州510405)
通讯作者:梁伟雄, T e l :020-86364466, E -m a i l :li a n g w x @pu b l i c . g g , 所以它要尽量的反映治疗措施欲施加的所有
范围内的患者, 这些患者可呈现不同的的依从性, 可
具有一定数目的合并症, 已经(或正在) 使用其他的药
供证据。它回答的问题是一项干预措施的整体效果,
而不能用来研究这个干预措施的不同组成成分对结局的贡献。实用性试验一般可用于检验一整套的干预措施, 包括与治疗有关的贡献、患者对结局的期望以及所使用的具体疗法的作用等。通常我们是拿这一整套的干预措施与另一种干预措施比较, 而不是与安慰剂比较。两种临床试验方法的具体区别可见表1。实用性试验通常强调某一干预措施在常规的临床实际条件下的获利、风险和成本。因此, 决定了其特征
〔4〕
2 实例介绍 我们以一项针刺治疗腰背痛的实用性随机对照试验为例, 进一步说明实用性临床试验在实际中的应用。
2. 1 设计概要2. 1. 1 试验名称 实用性随机对照试验评价针刺疗法在治疗慢性腰背痛的临床和经济效果
〔7〕
。
2. 1. 2 目的 比较针刺治疗加上常规保健与单纯常规保健治疗慢性腰背痛的效果与成本效益。2. 1. 3 设计 实用性试验设计, 包含1个多中心两组平行随机对照试验和另1组非随机试验。
2. 1. 4 场所 德国医疗保健机构。2. 1. 5 研究对象 11630名慢性腰背痛患者, 年龄为18岁或以上。
2. 1. 6 分组方法 患者按其意愿进入随机对照试验和另1组非随机的观察。愿意接受随机分配的患者进行随机对照试验, 随机分配进入针刺治疗组和对照组。针刺治疗组的患者接受3个月立即进行的针刺治疗, 对照组的患者接受3个月常规保健措施后, 再接受3个月的针刺治疗。拒绝接受随机分配的患者直接进入本研究的另1组非随机患者队列, 也接受3个月立即进行的针刺治疗。
2. 1. 7 干预措施 每位患者最多接受15次针刺治疗, 每位医师均留针以便判断针刺效果, 只接受针具针刺治疗, 其他非针具的针刺诸如激光针刺等均不能使用。每位患者观察6个月, 其中包括3个月治疗期和3个月随访期。所有3组患者如果需要均允许附加使用日常治疗措施。
2. 1. 8 结局测量 分别在基线时点、3个月和6个月时点完成标准问卷调查。由于非随机针刺治疗组的患者较多, 随机抽取其中50%进行在6个月后的问卷调查。主要结局指标为3个月时点的H a n n o v e r F u n c t i o n a l A b i l i t y Q u e s t i o n n a i r e (H F A Q ) 量表评分, 并以此为基础计算“背功能损失值”,该值与入组时相比改善20%以上认为治疗有效。次要结局指标为从入组时开始用S F -36量表测量健康相关生活质量, 3个月后测腰背痛评分(L o wB a c k P a i n R a t i n g S c a l e ) 的减少百分比。观察并记录针刺的不良反应。
2. 1. 9 结果 11630例合格患者中有3093例患者原意参加随机对照试验, 其中针刺治疗组1549例, 对照组1544例, 其余8537例患者被纳入非随机针刺治疗组。在3个月时点, 随机对照试验中针刺治疗组的背功能评分改善从12. 1分到74. 5分, 对照组从2. 7分到65. 1分, 差异是9. 4分(95%CI 为8. 3~为:(1) 选择评价的干预措施为临床实践中常用
的; (2) 纳入研究的对象要有代表性, 通常不作严格限制, 以尽可能的接近临床实际情况; (3) 对象的来源要尽可能的代表不同的医疗机构, 如社区医疗机构、专
科医院和综合性医院; (4) 资料收集与评价更注重健康相关的结局; (5) 试验样本量相对较大、随访时间相对较长。它的优势在于可以传达在日常临床环境中有效的治疗证据, 这对于复杂的干预措施更有效。对成本效益(c o s t -e f f e c t i v e ) 的评价更适合用实用性试验。实用性试验产生的证据在对决策形成、治疗方案的确立、临床指南的形成都起着潜在的巨大影响
〔5〕
。另
外, 临床医师和患者可能更喜欢参加实用性试验, 因为医师在治疗患者时具有较大的灵活性。但实用性试验也有它的不足, 由于它是作为一个整体被评价的, 所以不能用来准确的确定在治疗过程中哪一组分的效果, 也即无法解释治疗关系的贡献对总体效果的贡献程度。另外, 实用性试验的一个潜在的问题是增加资源的使用, 会增加研究的费用, 包括由于更大的样本量而增加的花费。同时, 可能因为缺乏盲法而带来偏倚等。解释性临床试验与实用性临床试验(典型特
〔6〕
征) 比较(表1) 。
表1
解释性临床试验与实用性临床试验
(典型特征) 比较
解释性试验实验环境评价效能
更适合急性状态安慰剂对照
单盲法或双盲法以减少偏倚目的是为了使非特异性的效果均衡
标准化治疗, 简单干预措施医师对标准方案很熟练常为短期随访
具有较高的内部准确度, 但较低的外部准确度对实践的影响小患者具有同质性样本量可能较小实用性试验
日常卫生保健环境评价/比较效果更适合慢性状态非安慰剂对照
患者非盲法以观察最大的联合效果
目的是加大非特异性效果日常治疗, 复杂干预措施医师对日常卫生保健较熟练多为长期随访
具有较低的内部准确度, 但较高的外部准确度对实践的影响较大患者具有非同质性可能需要大的样本量
照试验患者有更严重的症状, 但背功能评分改善情况相似。增加的成本效益比为每1质量调整生命年(q u a l i t y -a d j u s t e d l i f e y e a r ) 10526欧元。
2. 1. 10 结论 针刺合并常规治疗与上述慢性腰背痛患者显著的临床改善有关, 并取得了相应的成本效益。
2. 2 评述
2. 2. 1 纳入/排除标准 实用性随机对照试验的一个特征就是研究对象能够反映临床实际中治疗措施所欲施加的所有人群
〔8〕
他们认为对患者有利。
2. 2. 4 随机化 多数的实用性随机对照试验由于缺乏盲法, 内部准确度较低, 往往需要在患者分组时实施严格的随机化减少选择性偏倚来保证一定的内
〔10〕
部准确度。
2. 2. 5 盲法 该研究在进行观察时未对医师和患者实施盲法。实用性临床试验一般很难做到盲法, 在实用性试验中使用安慰剂作对照和实施盲法观察通
〔11〕
常是不恰当的, 因为可能不具有生态学有效性(e c -o l o g i c a l v a l i d i t y ) 。由于使用了盲法和安慰剂对照, 医师不知道患者对治疗无反应是由于治疗方法的不正确还是因为患者是在安慰剂组。但非盲法观察确实会对结局评价造成影响, 患者对不同疗法的偏好会影响到结局的评价, 从而降低实用性试验的内部准确度。多数文献推荐采用独立结局评价, 如可以在结局的测量时, 安排不知患者分组情况的独立观察者进行结局测量, 这可使测量结果较为客观。一般认为, 在实用性试验中无盲法观察而造成的医师或患者的偏倚并非是有害的, 应把它作为医师或患者对治疗的反应去接受, 但须在结局分析时对此进行分析、讨论。
2. 2. 6 结局测量与评价 实用性试验通常选取与日常生活相关的主要结局, 尤其是可以衡量的患者功能状态或生活质量。如该试验中选择H F A Q 量表评分为主要结局指标, 以疼痛评分和S F -36量表测量健康相关生活质量为次要结局指标, 而解释性试验的结局测量则通常较少与日常生活相联系。
2. 2. 7 统计分析 实用性试验的结果分析必须基于意向性治疗分析(i n t e n t i o n -t o -t r e a t , I T T ) 的基础上。因为在实用性试验中, 允许患者象在真实生活中一样改变他们的治疗方法, 这对试验来说是有很大风险的, 可能因此而降低治疗的有效性。
解决这个问题的做法一般有3种:第一种方法是按患者最初被随机分配至的组别进行分析, 即I T T , 而不管他们是失访还是改变了组别。第二种方法是在选取合适的患者入组时, 我们可以只选取从未接受过试验中任一治疗措施的患者, 或只收取那些对治疗措施无偏好的患者, 但这会造成患者来源的短缺; 另一个方法是接受那些对治疗措施有偏好的患者, 在进入试验之前了解他们对治疗措施的偏好, 如果他们愿意接受随机分组, 冒50%的风险接受对照组治疗的话, 就允许他们加入试验, 但在结果分析时应分析患者的偏好对试验结局的影响。如果他们不愿意冒50%的风险接受对照组治疗, 那么便不纳入这些患者。第三, , 〔12〕
。该研究的纳入标准包括:
(1) 临床诊断为腰背痛且病程超过6个月; (2) 年龄大于18岁; (3) 提供书面的知情同意书。排除标准包括:(1) 一个或多个椎间盘突出并伴有神经系统症状的; (2) 曾做过脊柱手术的; (3) 脊柱感染性疾病; (4) 由于感染、中毒或自身免疫性疾病引起的腰背痛; (5) 除脊柱前弯、侧凸之外的脊柱先天性脊柱畸形; (6) 由于骨质疏松引起的压缩性骨折; (7) 脊柱狭窄; (8) 脊椎滑脱症。
我们可以看出所有患有腰背痛的成年人组成了目标人群, 纳入标准十分宽泛, 而排除标准主要是为了排除脊柱或脊椎的器质性病变, 因为这不是针刺疗法的适应症。实用性试验设计尽量使到研究对象能够代表广泛的患者人群, 能够代表治疗措施所欲施加的所有患者, 这样得出的结果才具有普遍的外推性。这也就意味着我们必须设置较宽的纳入条件, 使患者不能因具有合并症或正在服用其他治疗药物而被排除, 从
〔9〕
而反映出日常临床实践的情况。
2. 2. 2 样本量 该研究的随机对照试验部分样本量为3093人, 样本量较大。因为实用性试验是从广泛的人群中挑选具有异质性的患者群体, 有的患者还服用了其他的药物, 由于患者间的这种差异可能使治疗达不到最大效果。所以, 由于患者异质性较大而增加组内的变异性以致需要更多的样本量, 但这并不破坏试验的可信度。另外, 由于实用性试验通常设计为长期随访的形式, 需要更大的样本量以防止患者失访造成损失。
2. 2. 3 干预措施 在这个试验中, 每个患者接受最多15次的针刺治疗, 为了评价针刺治疗在一般医疗实际中的作用, 研究者只规定了特定的针刺穴位, 由医师决定每次用哪几个穴位, 一共治疗几次等。在治疗期间, 医师可决定在必要时加用常规治疗措施。实用性试验中医生和患者都具有较大的自由度, 医师可以像平时一样自由地决定治疗措施, 允许,
按患者对治疗的偏好设计一个随机对照试验和一个非
随机试验, 让愿意接受随机分组的患者进入随机对照试验, 随机分入试验组和对照组, 不愿接受随机分组的患者进入非随机试验接受试验措施, 并在结果分析时比较两个试验的结局。
总之, 该研究设计是用来反映现实生活中发生的事件的, 重点是记录并报告实践中的改变, 而不是强制规定患者的治疗选择去歪曲实际上可能发生的事情, 这不但不符合生态学有效性, 也是不尊重患者的表现。
2. 2. 8 随访 实用性试验更倾向于长期随访, 因为患者和决策者都很关心在长期的随访后是否能确认某些益处。这在研究替代医学(如中医学) 时格外有利, 因患者报告的一些变化是经过一段时间后才出现的。如该试验进行了3个月的治疗期和3个月的随访, 结果表明针刺在6个月时的长期效果只比3个月治疗期结束时有很小的差异(不具有统计学意义) 。2. 2. 9 结果的报告和发布 由于实用性试验比解释性试验的干预措施复杂很多, 所以报告其结果具有更大的挑战, 需要将治疗措施的所有特征都报告出来以使干预措施可以得到重复。在发布试验结果时, 必需要讲清楚该实用性试验适用的研究选题, 并应承认其中固有的缺点。本试验在讨论部分对试验设计中的不足进行了客观的分析, 这是非常值得我们借鉴的。
3 讨论 实用性试验和解释性试验在评价健康保健干预措施上都有重要的作用, 两种试验方法的应用选择主要决定于研究的目的。对于实用性试验, 需要研究者客观、全面地报告治疗措施的复杂情况、研究结局和研究对象的各种主要特征, 科学分析和评价研究设计存在的局限性以及由此带来的对研究结果的影响, 甚至需要仔细进行敏感性分析, 以比较不同方式下试验结果的差别, 并做出合理的解释。
从上述例子和实用性临床试验的设计特点看, 该方法适合进行中医药临床研究。目前所进行的中医药临床试验多采用解释性的临床试验, 由于临床实际中的中医干预措施往往是复合干预, 通常不仅仅是某一活性成分起作用, 而且常与基础治疗措施合并使用, 通常无法区分中医药的效应在整体治疗中所占的贡献有多大, 在评价其治疗效应时应将中医药与基础治疗措施的联合效应一起进行分析评价才较为客观、合理。实用性临床试验方法正是可以在实际临床实践中客观
评价这种整体效应的设计, 因此, 该方法在中医临床
研究中的应用是很有前景的。
参考文
献
[1] Sc h w a r t zD , L e l l o u c hJ . E x p l a n a t o r y a n dp r a g m a t i ca t -t i t u d e si nt h e r a p e u t i c a l t r i a l s [J ]. JC h r o nD i s , 1967, 20(8) :637-648.
[2] Mac R a eK D . P r a g m a t i cv e r s u se x p l a n a t o r yt r i a l s [J ].
I n t J T e c h n o l A s s e s s H e a l t hC a r e , 1989, 5(3) :333-339.
[3] Go d w i n M , R u h l a n dL , C a s s o nI , e t a l . P r a g m a t i cc o n -t r o l l e dc l i n i c a l t r i a l s i n p r i m a r y c a r e :t h e s t r u g g l e b e t w e e n e x t e r n a l a n di n t e r n a l v a l i d i t y [J ]. B M C M e dR e sM e t h -o d o l , 2003, 3:28.
[4] T u n i s S R , S t r y e r D B , C l a n c y C M , e t a l . P r a c t i c a l c l i n -i c a l t r i a l s :i n c r e a s i n gt h ev a l u eo f c l i n i c a l r e s e a r c hf o r d e c i s i o nm a k i n gi nc l i n i c a l a n d h e a l t hp o l i c y [J ]. J A -M A , 2003, 290(12) :1624-1632.
[5] H e l m sP J .R e a l w o r l dp r a g ma t i cc l i n i c a l t r i a l s :wh a t
a r et h e ya n dw h a t d ot h e yt e l l u s [J ]? P e d i a t r A l l e r g y I m m u n o l , 2002, 13(1) :4-9.
[6] M a c p h e r s o nH . P r a g ma t i cc l i n i c a l t r i a l s [J ]. C o m p l e -m e n t T h e r M e d , 2004, 12(2-3) :136-140. [7] Wi t t C M, J e n aS , S e l i m D , e t a l . P r a g m a t i c r a n d o m -i z e dt r i a l e v a l u a t i n gt h ec l i n i c a l a n de c o n o m i ce f f e c -t i v e n e s so fa c u p u n c t u r e f o rc h r o n i c l o w b a c k p a i n [J ]. A m J E p i d e mi o l , 2006, 164(5) :487-496. [8] M c Ma h o nA D . S t u d yc o n t r o l , v i o l a t o r s , i n c l u s i o nc r i t e -r i aa n dd e f i n i n ge x p l a n a t o r ya n dp r a g m a t i ct r i a l s [J ]. S t a t Me d , 2002, 21(10) :1365-1376.
[9] Fr a n s e nG A , v a nM a r r e w i j kC J , M u j a k o v i cS , e t a l .
P r a g m a t i ct r i a l s i np r i m a r yc a r e . Me t h o d o l o g i c a l c h a l -l e n g e sa n ds o l u t i o n s d e m o n s t r a t e d b yt h eD I A MO N D -s t u d y [J ]. B M C M e dR e s Me t h o d o l , 2007, 7:16.
[10] Gl a s g o wR E , M a g i d D J , B e c k A , e t a l . P r a c t i c a l c l i n -i c a l t r i a l sf o r t r a n s l a t i n gr e s e a r c ht op r a c t i c e :de s i g n a n dm e a s u r e m e n t r e c o m me n d a t i o n s [J ]. M e dC a r e , 2005, 43(6) :551-557.
[11] va n d e r Wi n d t D A , K o e s B W, v a nA a r s t M , e t a l . P r a c t i -c a l a s p e c t s o f c o n d u c t i n ga p r a g m a t i c r a n d o m i s e dt r i a l i n p r i m a r yc a r e :pa t i e n t r e c r u i t m e n t a n do u t c o m ea s s e s s -m e n t [J ]. B r J G e nP r a c t , 2000, 50(454) :371-374.
[12] Ro l a n dM , T o r g e r s o nD J .Wh a t a r ep r a g ma t i ct r i a l s
[J ]? B M J , 1998, 316(7127) :285.
(收稿:2008-04-16 修回:2008-11-17)