
EMEA发布的非劣效性界值选择的指导原则.doc
11页EMEA发布的《非劣效性界值选择的指导原则》审评四部审评八室黄钦审校伦敦,2005 年 7 月 27 口 索引:EMEA/CPMP/EWP/2158/99人用药品委员会(CHMP)生效日期2006年1月目录—1— 刖H1. 背景2. —般考虑3. 证明疗效3. 1三个组的试验:试验产品、参照品和安慰剂3.2两个组的试验:试验产品和对照产品3. 3不能肯定优于安慰剂的情况4. 确定与活性对照药相比可接受的疗效5. 难以证明有合理非劣效性界值的情况5. 1使用显著性水平升高的优效性5. 2在另一方面有优势的产品6. 结论刖H许多将一种试验产品与一种活性对照药物进行比较的临床试验被设计为非劣效性试验 目前“非劣效性”这一术语已得到普遍认可,但如果从字面上来理解可能会产生误导非劣 效性试验的目的往往声明为了证实试验产品不亚于对照药物但只有优效性试验才能证实这 一点事实上非劣效性试验的目的是为了证实试验产品不如对照产品的程度,不超过事先指 定的一个较小的量这个量被称为非劣效性界值(non-inferiority margin),或称为A 0在许多情况下,可能进行非劣效性试验而不做优效性试验,或者除了做优效性试验,另 外再做劣效性试验。
这些情况包括:1在某些情况下不可能进行生物等效性研究时(例如缓释产品或局部用制剂),根据基 本上相似的情况提出的申请;1与标准治疗相比安全性方面可能有优势的产品需要与标准治疗进行疗效比较,以便进行风险-受益评价;1需要直接与活性对照进行比较以协助风险受益评价的情况;1与活性对照相比疗效没有显著降低可以接受的情况;1不能用安慰剂组,要用活性对照试验以证实试验产品疗效的某些疾病在以上最后4种情况下,如果能显示优于参照产品则不一定要做非劣效性试验为证实非劣效性,推荐的方法是在方案中事先指定一个非劣效性的界值研究完成后, 计算出两种为物真正差异的双侧95%可信区间(或单侧97. 5%可信区间)这一区间应当完 全在非劣效性界值(non-inferiority margin)的有利…侧△的选择在临床上和统计学 方血一定要合理一•定要根据特定的临床情况而具体制定,没有适用于各种情况的统一规则 但某些原则可作为一 •般指导以下法规性的指南可供参考用于选择非劣效性或等效性界值这些指南要与本指南结合 起来看1 ICH指南E9的注释(临床试验的统计学原理)(ICH Note for Guidance E9 (Statistical Principles for Clinical Trials);1 ICH 指南 E10 的注释(对照组的选择)(ICH Note for Guidance E10 (Choice of Control Group);1 CPMP优效性和非劣效性转换的考虑要点(CPMP Points to Consider on Switching Between Superiority and Non-inferiority)这些文件中,有关如何选择非劣效性界值的讨论有限。
但它们确实就非劣效性研究的设 计和操作作了详细的讨论这些问题极为更要,如果试验的开展没有达到足够高的标准,那 么△的选择就毫无意义本文件讨论两种类型的非劣效性试验:2个组的试验即试验产品和对照品;3个组的试 验,即试验产品、活性对照药和安慰剂试验产品的表现有许多方面需要考虑这些大致与疗效和安全性有关,但这些方面的每 一项都可以针对每个产品细分为许多关注点一项临床试验或临床计划可能是为了显示某些 变最的非劣效性,而其他一些变景:可能需要证明优效性这份文件中“非劣效性”和“优效 性”用于指单个终点而不是整个产品的特点始终假定治疗效果可•以测定,并且测鼠值可以区分期望的(正面)与不期望的(负面) 作用再进-步假定所测变量的正面数值越大,则正血.作用越大文件中多数使用不同治疗之间的绝对差值作为例子来描述这一概念这些讨论也适用于 考虑相对效果的研究,只需进行少量修改即可例如在一•项考虑相对效果的试验中,点估计 值为I反映治疗之间无差异,估计值为0则表示有差异尽管安全性参数也可-定义非劣效性界值,但本文件中提到的方法均使用疗效参数进行描 述,因此,对疗效终点的许多讨论不适用于安全性试验,特别是整个第3节。
1. 背景非劣效性试验的结果通常以双侧95%nJ-信区间进行评价,这个区间显示的是试验产品(试验:T)和活性对照药(参照:R)之间真正差异的可信范围结果中有2个方血应当引 起特别注意一个是差异的点估计值,即所观察到的试验产品和参照产品之间的差异另- 个是可信区间的下限点估计值表示真正差异的最佳估计值,因此如果它是正数,并且这是 所获得的所有证据,那么试验产品很可能优于参照产品,反之亦然另一方面,可信区间的 下限表示较低的限度,其含义通常是根据所列数据可以排除的试验品不如参照产品的程度 事实上这不是一个真正的低限,劣效性的幅度可能更大但一般认为真正差异比这一限度所 提示的差异更不好的机率在一定认可水平非常小如果T和R效果相等,那么无论样本量大小,差异的点估计值应当有50%的机率为正数, 有50%的机会为负数因此位纯点估计值不足以作为相对疗效的指标在真正相等的情况下, 差异的可信区间的下限随样本量的增加会逐渐接近于0,因此理论上可以通过足够大的样本 来排除任何所期望程度的非劣效性但如果治疗真正等效时,就不町能设计一个研究来排除 所有程度的非劣效,因为这需要规模无穷大的实验因此从…开始就要明确,如果T不可能不如R,那么就不能用非劣效性试验开发与对照 约疗效相等的产品。
2. 一般考虑1非劣效性界值的选择要根据统计学推理和临床判断综合考虑1试验药、参照药和安慰剂的三组试验可以在本试验内部对非劣效性界值进行一定程度 的验证,因此这是推荐的试验设计;应当尽可能采用1正确选择界值应当确保试验约物临床上有意义的作用大于0选择界值的这个方而在 第3节讨论1通常非劣效性试验的主要焦点是试验产品和参照产品的相对疗效,血不m纯是要证明 试验产品有效在这些情况下,正确选择界值,除了证明产品有效之外,还要证明试验产品 不会比参照品差很多,因此得到比较严谨的界值选择界值的这个方面在第4节讨论1对于大多数非劣效性试验,必须证明界值可以满足第3节和第4节的要求在方案中必须说明非劣效性界值选择的合理性,合理性解释中应当解决这两节所考虑的问题1把非劣效性界值定义为活性对照和安慰剂之间差异的比例是不恰当的形成这种想 法,其目的是想确保试验产品优于(假定的)安慰剂;但他们可能达不到这一目的如果参 照产品与安慰剂相比有较大的优势,这并不意味着差异大不重要,它正好说明参照产品非常 有效1使用效果大小(治疗差异除以标准差)作为选择非劣效性界值的依据是不恰当的这 个统计量是提供检出有差异的难度方面的信息,但无助于证明差异所具有的临床意义,也不 能确保试验产品优于安慰剂。
1界值的选择应当不考虑把握度应当根据本文后面章节提到的临床和统计学原理,而 不是根据样本量的问题,因为有临床意义的差异的大小不因研究规模的大小而发生变化不 能因为研究的规模小就采用比较宽的非劣效性界值1如果已经选择了一个恰当的非劣效性界值,全部处于・小与0之间的可信区间(即试 软产品不如参照产品,但相差的程度不超过△)仍足以证明非劣效性如果这•结果不能 接受,那么这证明△的选择不恰当见第V节有关难以判断各种非劣效性数量的情况的 讨论)1不川能在所有情况下进行非劣效性试验根据治疗领域和参照产品的特点考虑进行非 劣效性试验的决定应当合情合理1许多情况下疗效己经确定的药物在安慰剂对照的试验中并不能始终如一地证明其优 越性(例如抑郁症或过敏性鼻炎)有这种缺乏灵敏度的情况下,不包括安慰剂组的非劣效 性试验是不恰当的见ICH E10有关灵敏度的更详细的讨论1如果试验中参照产品的表现与确定非劣效性界值时所假定的表现有很大不同,那么所 选的非劣效性界值可能不再合适这个问题牵涉的情况应当在制定计划的阶段做好考虑3. 证明疗效非劣效性试验数据解释中所涉及的决策过程的最低要求是:如果开展安性剂对照试验, 我们必须相信试验产品会有效本节的讨论采用优效性试验数据解释中常用的方法,作为评 价非劣效性试验数据的最低要求的模型。
如果一个试验的目的是证明试验产品优于安慰剂,现在来解释这样一个试验中的数据, 应当采用非正式的两阶段方法,同时考虑到统计学意义和临床意义同样的两阶段方法也可 用于解释非劣效性试验在优效性试验中,首先可能要证明试验产品在统计学意义上优于安 慰剂这指的是ICHE10中“统计学推理和临床判断”相结合的“统计学推理”阶段统计 学意义•般采用双侧0.05 (或侧0.025)的显著性水平来评价表明符合这一要求的另一 种方法是活性药物与安慰剂之间差异的双侧95%可信区间的下限(或单侧97. 5%区间)必须 大于0 ,解释优效性试验的下-步是考虑与安慰剂的差异是否具有临床意义这是ICHE10中 “统计学推理和临床判断”相结合的“临床判断”阶段要确定试验产品与安慰剂相比其受益有临床意义,应当同时考虑试验产品与安慰剂之间 差异的点估计值,并评价其临床意义,町以用原始数据,也可以用有效率这主要不是统计 学问题,但确实需要将临床思维和对数据的理解巧妙结合起来统计学意义已经被证实,因 此可认为存在这种效应必须判断出所见的这一差异在临床上是否有用这•判断通常是根 据安全性情况通过受益/风险评价而做出的3.1三个组的试验:试验产品、参照品和安慰剂这种试验设计可以直接证明试验产M和活性对照均优于安慰剂。
I大此,没有必要指定, 个△值以确定试验药有效,但在解释试验数据时应当说明以下几点和安慰剂对照的优效性试验一样,试验产品必须证明在统计学意义上优于安慰剂试验 产品与安慰剂差异的95%可信区间的下限必须大于0在这一阶段,参照组的表现不是主要的考虑对象,但如果试验产品和参照产品均未能显 示在统计学意义上优于安慰剂,可能提示试验不灵敏或者缺乏检测灵敏度和优效性试验一样,然后要用临床判断来评价所观察到的与安慰剂的差异是否具有临床 意义如果有参照组,可有助于做出这一判断如果参照产品是经批准的药物,并且已知在 这种类型的试验中通常可以得到具有临床意义的效果,那么这•试验中所见的参照品与安慰 剂之间的差异有助于评价安慰剂与试验产品之间差异的临床意义例如,如果试验中试验组 的表现优于参照组,则假定试验产品的受益具有临床意义是合理的如果参照品未能证明在统计学意义上优于安慰剂,或者其表现与我们根据经验作出的预 测有很大不同,那么应当对试验中参照产品的表现提出疑问此时参照组的结果不能作为参 照,试验为的任何阳性结果都是单方而的要对参照治疗中意料之外的结果的原因进行讨论 3.2两个组的试验:试验产品和对照产品山于这种类型的试验没有安慰剂叩,必须通过以往参照产出与安慰剂相比较的研究来与 安慰剂进行间接比较,以确定产品有效。
这样做本身有一•定难度,并且必须要指定非劣效性 界佰但95%可信区间的下限仍可用于确定疗效优于安慰剂如果实际没有使用安慰剂,则 常常用“假定的安慰剂”这一术语应当进行系统性综述以找出在所考虑的条件下参照治疗和安慰剂进行比较相关的研究 这些研究可用于估计在目标患者人群中参照产品和安慰剂之间的差异如果不能估计这•无 异,或者在有足够把握度的试验中不能-致证明对照药优于安慰剂时,则使用这-对照药进 行非劣效性研究的灵敏度可能会受到质疑,只有试验产品优于对照为(活性药或安慰剂)的 结果才能解释如果参照产品是某一类药物。
