【资料图】
北京时间5月2日凌晨,国际顶级学术期刊《Nature》正刊发表了百度与合作单位在生物计算领域的重磅突破性成果——《Algorithm for Optimized mRNA DesignImproves Stability and Immunogenicity》,提出mRNA序列优化算法LinearDesign。
这是中国科技企业首次以第一完成单位的身份在《Nature》杂志发表论文。鉴于论文对生物医学领域的重要性,Nature杂志在正式排版之前先将预览版快车道上线 (accelerated article preview),这也是AI应用于mRNA领域的首篇CNS主刊论文。
mRNA疫苗被公认为是遏制COVID-19的可行工具, 但mRNA疫苗和药物仍面临一些挑战。其中如何高效设计出稳定、成药性更好的mRNA序列,是mRNA疗法研究领域的难点之一。
百度运用自然语言处理中网格解析(LatticeParsing)技术,对mRNA疫苗序列进行优化,提升疫苗稳定性和有效性。LinearDesign算法巧妙地将序列设计的海量计算简化为自然语言处理中的经典问题,让“大海捞针”变成了“按图索骥”。
以新冠病毒Spike蛋白为例,若采用遍历法寻找一条稳定序列,需要查看10的632次方个mRNA序列。假如由一台超级计算机每秒计算一个序列,那么从宇宙诞生到现在的138亿年,连潜在mRNA序列的亿万分之一都无法计算完毕,而LinearDesign算法则能在短短11分钟之内找到最稳定的候选序列。
实验数据证明,LinearDesign算法设计序列将有助于生物医药公司快速研发更有效的mRNA疫苗,缩短研发周期,降低研发成本。这一算法的有效性已经在新冠mRNA疫苗和带状疱疹mRNA疫苗两种疫苗中得到验证。与传统基准相比,百度的设计显著改善了体外 mRNA 半衰期和蛋白质表达,使体内抗体反应增强了高达 128 倍。
计算 RNA 生物学家戴夫·莫格 (Dave Mauger) 则认为,这种新方法“非常了不起”,他曾在美国Moderna 公司工作,一家 mRNA疫苗制造商。“计算效率确实令人印象深刻,而且比以往任何时候都更加复杂。”
截至目前,百度已打造完整的基于飞桨的生物计算平台-螺旋桨PaddleHelix,涵盖文心大模型-生物计算大模型,探索AI技术在小分子、蛋白/多肽、RNA等场景的应用。其中生物计算等大模型属于百度文心大模型家族中的一员。
据了解,百度文心大模型形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等,最近火爆的文心一言就是百度自主研发的知识增强大语言模型。文心一言通过百度智能云对外提供服务,为企业构建自己的模型和应用,未来医疗、工业、金融等重点领域效率将会大幅提升,快速形成新产业空间。
关键词: