【创科广场】 DeepMind开启生物信息学新时代 第二代AlphaFold造福病人

2021-07-20 08:15

生物的蛋白质由氨基酸串组成,摺叠成3D形状,决定了蛋白质在细胞中功能,多年来研究人员致力重现高解像3D蛋白质结构,以促进研发药物设计和生产。

虽然基因研究突飞猛进,但基因之所以重要,全因带有生产蛋白质密码,生物利用密码转变成蛋白质,而在细胞内,蛋白质才是真正功能的执行者。

蛋白质3D结构无法直接观察,研究人员一直使用X射綫晶体学(X-ray Crystallography)或核磁共振仪(NMR)等技术测定蛋白质3D结构,但进度相当缓慢。

近年,低温电子显微镜(Cryo-TEM)分析蛋白质结构的效率大大提高;去年香港大学获李嘉诚捐赠了1亿港元,成立「低温电子显微设施研究中心」,显微镜可冻结移动中的微细生物分子,以原子尺度描绘,加快分析蛋白3D结构,推动本港药物研发工业。

上述数种方法既费时又昂贵,部分蛋白质不适合以上述方法分析;X射綫晶体学数个月才测定一种结构,Cryo-TEM设备极之昂贵,须高性能运算配合,安装和配置设备,也成本不菲。

AI模型脱颖而出

去年12月,两年一度举行的「国际蛋白质结构预测比赛」CASP,英国初创DeepMind以AlphaFold的AI模型,预测出多个蛋白质的3D结构,击败所有参赛者,准确性与实验结果匹配,准确度前所未见,一时技惊四座,顿成为生物讯息学最瞩目的科技。

DeepMind开发的AlphaFold模型,只根据蛋白质氨基酸的序列,就预测出3D的结构,破解蛋白质折叠困扰生物学的主要难题;AlphaFold以多序列对齐,进行深度学习演算开发AI模型,结合蛋白质结构物理和生物学,开启出生物信息学的新时代。

DeepMind以AI利用蛋白的基因序列,准确推测蛋白的结构,不止震惊了学术界,也导致研究上百花齐放,争相开发AI模型。

上周,《自然》期刊的报道,DeepMind公布名为AlphaFold2深度学习神经网的开源版本,与去年参加CASP的比赛版本,已经脱胎换骨,模型仍以Python语言开发,但速度更快。DeepMind在《自然》期刊上,发表《以AlphaFold精准预测蛋白结构》的论文。

同一天,受AlphaFold2模型的启发,另一组学术研究人员也公布了另一个蛋白预测模型RoseTTaFold,发表论文和开源代码,预测能力亦媲美AlphaFold2。

如何预测蛋白质3D结构,困扰生物学长达50年之久。AlphaFold2和RoseTTaFold开源AI模型,代表学术界以上述开源工具,理解细胞蛋白质功能,一同改进AI模型准确度。

以往DeepMind对正进行AI研究,往往是讳莫如深,学术界遂自行研究,美国西雅图华盛顿大学生物化学家David Baker团队,摹仿AlphaFold2开发AI预测蛋白质3D结构,显示学术界亦掌握AI预测蛋白结构的能力。

虽然RoseTTaFold功能毫不逊色,准确度则与AlphaFold仍有落差,原因可能工程技术仍有差距,而不是分析方法较差。DeepMind改进AlphaFold2演算速度,较CASP比赛之际,AlphaFold花上数天才预测简单蛋白结构,开源版本分析速度提高16倍,往往数小时就可获结果。

AlphaFold2更易安装和设定

AlphaFold2和RoseTTaFold源码已上载到GitHub,AlphaFold2以容器开发,更易安装和设定,亦与研究机构合作推出新药;包括日内瓦「被忽视疾病药物研发组织」(Drugs for Neglected Diseases Initiative)合作预测蛋白结构,加速研发罕见病新药。

透过结构生物学研究蛋白质结构与功能之间的关系,可开发出临牀小分子药物。过去20年,生物技术疗法推陈出新,小分子药物市场萎缩,AI可加快发现生物标记和标靶,有机会重振小分子药物的市场。

李嘉诚旗下的维港投资亦是DeepMind早期投资者之一,其后出售予Google。

關鍵字

最新回应

關鍵字
You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad