用一颗“芯”药,找到无数颗新药
2018年,一部现实主义电影《我不是药神》意外走红,让仿制药这一话题走入了人们的视野。仿制药是指与原研药在剂量、安全性、效力、质量、药效以及适应症上均相同的一种仿制药品。印度1970年的《专利法》限制了对药品化合物的知识产权保护,致使印度药企得以大量生产仿制药。一种药在美国上市后几个月,就能在印度找到价格低廉的仿制药。相比于价格高昂的原研药,仿制药能够在一定程度上降低患者的治疗成本。那么,作为仿制药所临摹的对象,原研药究竟贵在哪里?
一般来说,原研药的研发工作伴随着巨大风险,投资周期长、投入成本高,为此业界流传着所谓的“双十定律”,即医药企业在研发一款创新药的时候,往往可能需要投入超过十亿美元以上的资金,而且研发的周期从药物设计到临床实验,再到申报上市,往往要经历十年、甚至更长的时间。另外,在整个过程当中,新药研发的失败率也是相当之高。据Pharma Intelligence 公司在2021年提供的报告显示,在此前十年间,仅有不到10%的新药可以顺利完成临床I、II、III期试验,并在NDA/BLA后获批上市。[1]
而在中国,由于包括专利侵权风险在内的诸多原因,仿制药的发展也并非一帆风顺,药物上市经常面临各种挑战。因此,越来越多的制药企业正在将目光重新投向原研药的研发。
在这一过程中,大量制药企业正在期待利用计算机辅助药物设计,降低研发成本、缩短研发周期,并最终提高成功率。那么,数字技术是如何加速新药研发,并推动医药行业智能化转型的呢?
新药难寻,算力做药引
药物的研发一般起始于药物探索与发现,随后进行临床前研究与临床实验,在成功后进行相关审批,通过审批的药物则可以进入商业化生产与药物销售流通环节。在药物探索阶段,靶点的发现可谓至关重要,如果靶点不是创新的,这便不能被称作一款真正意义上的创新药。为此,很多制药企业选择与国内知名的转化医学中心进行合作,进行临床数据挖掘与生物信息分析。
然而,用以研究开发新药的生物信息可谓浩如烟海,传统分析手段既耗时又费力。不过,近期瑞金医院国家转化医学研究中心利用现代科技所取得的成果,让诸多企业在新药技术研发方面看到了希望的曙光。
早在2017年,瑞金医院国家转化医学研究中心已经开始着手打造一个集存、传、算、用(即:数据存储、数据传输、数据分析计算和数据的整合应用)为一体的定制化高密度计算平台——ASTRA。
ASTRA拥有4000个CPU计算核心,存储系统为总容量10PB的高性能并行文件存储系统,同时配备了200GB的HDR IB网卡以及15 PetaFLOPS的AI计算能力。其采用的第三代英特尔?至强?可扩展处理器更适用于需要兼顾生产和科研的平台,能够灵活满足相关需求。同时,借助英特尔开发的DAOS(Distributed Asynchronos Object Storage,分布式异步对象存储)开源文件系统,使得瑞金医院的ASTRA系统能够突破存储瓶颈,充分发挥性能,满足实时、高频和高效的数据访问和处理需求。
2021年11月,ASTRA以持续85GB/s和2984 kIOP/s的成绩获得了2021年IO500排行榜十节点榜单的第八名,成为当时中国乃至全球生信领域唯一一个打进十节点榜单前十名的系统。
借助这一平台,瑞金医院针对某基因组的变异分析耗时和某肿瘤全基因组分析的时长都大大降低。通过这样的提升,此前的很多医学设想也得以照进现实。
在瑞金医院的技术应用实践之外,借助AlphaFold2与GROMACS,高性能计算在转化医学和新药研发等领域的关键性驱动作用也愈发明显。前者是DeepMind 提出的深度神经网络蛋白质形态预测方法,也被称为迄今为止准确度最高的蛋白质三维结构预测模型;后者则是一个分子动力学软件包,用于模拟设计新药物的蛋白质、脂质和核酸。这些模拟为研究人员提供了所需的生物大分子结构信息,以了解结构与功能关系,用于指导药物研发和设计过程。基于显著提升了人工智能与深度学习性能的第三代英特尔?至强?可扩展处理器,辅以英特尔AI套件的转换与优化,上述工具突破性地实现了23倍的性能提升,每日可预测的蛋白质长度从4.56大幅提升至105.35,这也意味着药物研发的试错过程能够被显著缩短。因此,这一进步也在医药行业大分子药物研究领域产生了不小的震动。
而在小分子药物的发现中,以晶泰科技为代表的本土研发团队则更有发言权——借助阿里云第七代云服务器ECS的计算单元,以及英特尔oneAPI提供的编译器数学库和优化能力,包括GATK,NAMD,LAMMPS,RELION和GROMACS在内的诸多生命科学领域的前沿应用运行速度大幅度提升,部分增长高达60%以上,结构晶体预测与碳化合物构成的研究变得更加容易。对于晶泰科技们而言,这有助于研究人员更有效地设计和评估新药,并能够显著节约资源。
去中心化的临床实验,隐私安全何解?
当一种药物的靶点和化合物,包括化合物优化完成后,新药就已具雏形。不过距离来到患者手中,它还要经历六到七年的临床试验阶段。在临床药物试验过程中,第三代英特尔?至强?可扩展处理器的一种独特安全技术——英特尔?软件防护扩展(SGX)——也在简化和加速流程方面发挥着重要作用。
英特尔?软件防护扩展(SGX)的核心是一组指令,可提高应用代码和数据的安全性,从而为它们提供更好的保护,以防止泄露或修改。
?通常来说,企业机构必须在确保患者隐私并遵守适用法规的前提下,从医院、诊所和医疗机构收集真实世界数据(RWD),而在近两年,对于患者的招募、随访,以及对服药之后的效果追踪变得尤其困难。因此,去中心化临床实验的概念正在兴起。
2020年7月,国家药品监督管理局发布了《新冠肺炎疫情期间药物临床试验管理指导原则(试行) 》,其中指出:“受疫情影响,传统临床试验面临着许多实际困难,可尝试选择远程智能临床试验方法,借助智能化临床试验管理平台及远程通讯技术,以受试者为中心开展临床试验。”这意味着通过远程智能的临床实验,患者可以足不出户,通过冷链配送获取药物,同时利用可穿戴设备完成数据的采集与上传。在这种情况下,保护患者隐私与数据安全就可能形成一个巨大的技术挑战,因为所有查询、数据、应用和结果都必须在静态、动态和使用状态下进行加密。
但现在,情况出现了转机。英特尔?软件防护扩展(SGX)能在CPU的支持下,在内存等特定硬件环境中构建出一个可信安全的飞地。这种飞地独立于操作系统、虚拟机以及BIOS系统之外,也就是说,即便这些比客户应用程序更底层的基础软件或系统在恶意攻击中沦陷,由英特尔?软件防护扩展(SGX)技术生成的飞地也可以通过基于硬件的、增强型的安全防护更有效地阻断这些攻击,尽力避免其中的数据或代码被窃取或篡改。这有助于确保数据完整性和隐私,提供了在各方之间安全共享私有信息的工具,并创建一个协作、实时的临床信息系统。而基于这一加密计算能力,阿里云ECS安全增强通用型g7t服务器持信息以更快、更安全的方式进行共享和验证,相关治疗方法可以更快地提供给有需求的人。
新药落地,仍待临门一脚
多年之后,终于来到新药上市前的生产与流通环节,算力也在持续提供着加速。
从某种程度上来说,我们可以将药物的生产比作进行化学实验,在包括剂量检测在内的多个环节中,都需要通过人眼进行观测。现在,制药企业可以利用机器视觉替代检测人员,不仅减少了在整个生产环节的人工成本,更提升了检测的准确率与效率。目前,通过阿里云与英特尔等公司的合作,此类应用已经在部分企业率先落地。经过简单模型与复杂特征的多重训练后,机器视觉与人工标注的一致率已经高达98.879%。
而在最终的药物流通上,数据仍然蕴含着大量亟待挖掘的价值。例如与某些疾病关联的药品,在需求上可能带有明显的地域集中性和时间周期性。因此,大量的AI算法应运而生,药物需求的预测正在成为可能。凭借第三代因特尔?至强??可扩展处理器强大的AI加速能力,以及英特尔在边缘计算上的全面布局,药物流通行业的参与者们也得以乘上数字化转型的东风,通过边缘实时的计算进行更精准的预测,从而制订更科学合理的药物销售与存储策略。
结语
随着时代的发展,医药行业自身也在经历着翻天覆地的变化,工具的极大丰富与快速迭代使医疗机构与制药企业从数字技术中获得强大的助推力。而借助算力与算法诞生的颗颗新药,也正在为人类的健康提供更坚实的守卫。
- [1]Clinical Development Success Rates and Contributing Factors 2011-2020. Biotechnology Innovation Organization, Informa Pharma Intelligence, QLS.
- 本文未以任何方式宣传或介绍医疗机构或医疗服务,也未推荐任何药品、医疗器械或保健食品。