【创科广场】 DeepMind开启生物信息学新时代 第二代AlphaFold造福病人
2021-07-20 08:15
虽然基因研究突飞猛进,但基因之所以重要,全因带有生产蛋白质密码,生物利用密码转变成蛋白质,而在细胞内,蛋白质才是真正功能的执行者。
蛋白质3D结构无法直接观察,研究人员一直使用X射綫晶体学(X-ray Crystallography)或核磁共振仪(NMR)等技术测定蛋白质3D结构,但进度相当缓慢。
近年,低温电子显微镜(Cryo-TEM)分析蛋白质结构的效率大大提高;去年香港大学获李嘉诚捐赠了1亿港元,成立「低温电子显微设施研究中心」,显微镜可冻结移动中的微细生物分子,以原子尺度描绘,加快分析蛋白3D结构,推动本港药物研发工业。
上述数种方法既费时又昂贵,部分蛋白质不适合以上述方法分析;X射綫晶体学数个月才测定一种结构,Cryo-TEM设备极之昂贵,须高性能运算配合,安装和配置设备,也成本不菲。
AI模型脱颖而出
去年12月,两年一度举行的「国际蛋白质结构预测比赛」CASP,英国初创DeepMind以AlphaFold的AI模型,预测出多个蛋白质的3D结构,击败所有参赛者,准确性与实验结果匹配,准确度前所未见,一时技惊四座,顿成为生物讯息学最瞩目的科技。
DeepMind开发的AlphaFold模型,只根据蛋白质氨基酸的序列,就预测出3D的结构,破解蛋白质折叠困扰生物学的主要难题;AlphaFold以多序列对齐,进行深度学习演算开发AI模型,结合蛋白质结构物理和生物学,开启出生物信息学的新时代。
DeepMind以AI利用蛋白的基因序列,准确推测蛋白的结构,不止震惊了学术界,也导致研究上百花齐放,争相开发AI模型。
上周,《自然》期刊的报道,DeepMind公布名为AlphaFold2深度学习神经网的开源版本,与去年参加CASP的比赛版本,已经脱胎换骨,模型仍以Python语言开发,但速度更快。DeepMind在《自然》期刊上,发表《以AlphaFold精准预测蛋白结构》的论文。
同一天,受AlphaFold2模型的启发,另一组学术研究人员也公布了另一个蛋白预测模型RoseTTaFold,发表论文和开源代码,预测能力亦媲美AlphaFold2。
如何预测蛋白质3D结构,困扰生物学长达50年之久。AlphaFold2和RoseTTaFold开源AI模型,代表学术界以上述开源工具,理解细胞蛋白质功能,一同改进AI模型准确度。
以往DeepMind对正进行AI研究,往往是讳莫如深,学术界遂自行研究,美国西雅图华盛顿大学生物化学家David Baker团队,摹仿AlphaFold2开发AI预测蛋白质3D结构,显示学术界亦掌握AI预测蛋白结构的能力。
虽然RoseTTaFold功能毫不逊色,准确度则与AlphaFold仍有落差,原因可能工程技术仍有差距,而不是分析方法较差。DeepMind改进AlphaFold2演算速度,较CASP比赛之际,AlphaFold花上数天才预测简单蛋白结构,开源版本分析速度提高16倍,往往数小时就可获结果。
AlphaFold2更易安装和设定
AlphaFold2和RoseTTaFold源码已上载到GitHub,AlphaFold2以容器开发,更易安装和设定,亦与研究机构合作推出新药;包括日内瓦「被忽视疾病药物研发组织」(Drugs for Neglected Diseases Initiative)合作预测蛋白结构,加速研发罕见病新药。
透过结构生物学研究蛋白质结构与功能之间的关系,可开发出临牀小分子药物。过去20年,生物技术疗法推陈出新,小分子药物市场萎缩,AI可加快发现生物标记和标靶,有机会重振小分子药物的市场。
李嘉诚旗下的维港投资亦是DeepMind早期投资者之一,其后出售予Google。
關鍵字
最新回应