科睿唯安推出先进的临床成功率预测模型

科睿唯安
生命科学与制药

最近几年,尽管药物研发支出持续攀升,但高达90%的处于临床阶段的项目最终仍不能进入市场。高临床失败率大幅增加了药物的成本,而研发成本又很大程度上归咎于临床阶段的失败。在此背景下,制药公司比以往更加迫切想要知道其投资组合的价值,希望更快筛选掉那些临床成功率低的药物,从而将资金投向更有希望的项目。

许多制药公司使用内部的数据管理来支持研发管线的决策,然而这种方式仍有其限制。常设的竞争情报和业务开发团队的制药公司,通常使用分析师报告、新闻报道和其他数据源构建的数据库;不设竞争情报和业务开发团队的小公司,可能由外部顾问或分析师协助。这类方式多数需要人工整理,时间成本和经济成本都很高,而面临人工整理数据不完整或存在时效性的局限。

使用对标(benchmarking)、综述知识、科学文献和评估,对于一部分资产或特定治疗领域是有帮助的,却很难转化到投资组合层面的评估。

 

导入“统计模型和机器学习”寻求解决办法

认识到对标的局限性后,我们采用了大量的药物开发数据建立了模型,从而建立一种能够更准确地预测药物研发成功率和上市时间的预测方法。Cortellis是科睿唯安生命科学领域的旗舰数据库,积累了20多年所有治疗领域从临床开发到注册所有阶段的药物开发和临床试验信息。Cortellis采用自动化处理和人工管理相结合的方式运行,这保证了Cortellis数据集的全面性。

基于Cortellis收录的15年(2000-2015年)的药物和临床试验信息,我们开发了一种可以预测药物临床成功率和上市时间的算法。这些信息包括32.5万份已完成或正在进行的临床试验,7.3万份在研发管线中确定的药物记录,16.5万份全球药物开发公司、研究所和研究组织的简介,900万项专利以及9.5万份关于生命科学许可交易、兼并与收购的报告。

我们正在为“科睿唯安DTSR”预测模型申请专利,该分析模型包括多变量分析、统计建模和机器学习。模型建立之初,我们筛选了15个可以对药物开发计划、药物开发者以及药物本身进行定性的特征。然后通过机器学习识别主要特征并对这些特征分配权重,使其具有预测成功率的能力,最终形成“科睿唯安DTSR”预测模型。

 

DTSR演算法的验证

基于Cortellis收录的15年(2000-2015年)的药物和临床试验信息建立完预测模型之后,我们又采用2015-2018年的数据,与真实世界临床推进的成功率相比,来验证该模型的预测准确性,结果显示:

通过DTSR预测的临床推进成功率大于90%的药物中,实际成功率为92%。

通过DTSR预测的I期临床向II期临床推进的成功率大于80%的药物中,实际成功率为88%。

通过DTSR预测的II期临床向III期临床推进的成功率为大于70%的药物中,实际成功率为77%.

通过DTSR预测临床失败率超过70%的药物中,实际有超过3/4的药物失败。

 

与对标或其他算法等传统预测模型的对比

为了进一步对比“科睿唯安DTSR”预测模型与传统算法的优劣,我们将两种方法测得的结果进行了比较。国际药物研究中心(CMR)是药品研发绩效指标的领先供应商(也是科睿唯安的全资子公司),该研究中心的报告显示:2000-2015年期间,从I期临床到II期临床的成功率为61%,从II期临床到III期临床的成功率下降到36%,从III期临床到注册前阶段的成功率为75%,从注册前到完成注册的成功率为88%(见图1)。

图1、国际药物研究中心(CMR)的对标测算数据

临床阶段转换 成功率(2000-2015年)
I期临床→II期临床 61%
II期临床→III期临床 36%
III期临床→注册前 75%
注册前→完成注册 88%

 

我们将DTSR计算后的结果与CMR的对标测算结果进行了比较,计算了预测成功率和实际成功率之间的差异(用精度度量∆%表示:数字越小,方法越准确)。结果显示,对所有治疗领域进行测算后,“科睿唯安DTSR”的∆%为28%,CMR的基准算法为40%(见图2)。该差异显示,“科睿唯安DTSR”的预测准确率比行业基准分析算法高25%。

图2、“科睿唯安DTSR”的预测准确率比对标测算法高25%。

 

展望

“科睿唯安DTSR”目前可以为在美国、欧盟和日本进行临床试验的单个药物项目进行成功率和上市时间的预测(其他国家和地区敬请期待)。由于该模型成功率和上市时间的预测是基于数据和统计模型得出的,数据比行业对标分析的计算方式更准确,可应用于治疗领域或整个投资组合层面。

值得强调的是,“科睿唯安DTSR”输出是实时成功率,因为它根据最新的信息生成预测。其预测的数据会随着新里程碑的实现而更新;此外,该算法还将继续从新的数据输入和药物项目中迭代学习。随着时间的推移和行业趋势的发展,“科睿唯安DTSR”将持续改进并适应制药行业最新的发展变化。

持续有力验证、输入最新的药物开发数据,以及模型的持续优化将极大地增加我们对“科睿唯安DTSR”分析模型的信心。我们希望,大规模临床数据的力量将为药物开发人员提供更高的预测准确性,强化战略投资组合决策,并最终提高研发效率,使患者和药品开发者获益。

Clarivate科睿唯安

加速创新