【创科广场】Google网站助抗疫 人工智能突飞猛进

2020-03-17 07:53

德克萨斯大学奥斯丁分校以cryo-EM拍摄SARS-CoV-2的刺突蛋白,绘制新冠病毒刺突蛋白图谱,团队成员Jason McLellan教授 (左)、研究生Daniel Wrapp (中)及研究助理Nianshuang Wang。(图片来源:德克萨斯大学网站)
德克萨斯大学奥斯丁分校以cryo-EM拍摄SARS-CoV-2的刺突蛋白,绘制新冠病毒刺突蛋白图谱,团队成员Jason McLellan教授 (左)、研究生Daniel Wrapp (中)及研究助理Nianshuang Wang。(图片来源:德克萨斯大学网站)

美国Covid-19病毒传播初期,检测技术出错,抗疫受到挫折。美国软件工业发达,不少行业处于医疗事业前端。

上周五,美国总统特朗普透露,Google母公司Alphabet附属公司Verily Life Sciences(前称Google Life Sciences)正开发网站,协助怀疑感染Covid-19冠状病毒的患者自行分流测试。据Google传讯部门表示,Verily处于开发初阶段,计画于三藩市湾区推出,期望扩展至更多地点。

美国总统特朗普透露超过1700名工程师,正参与有关Verily开发工程。Alphabet股价受刺激,一度上升超过9%。

Verily为Alphabet拥有的生命科学业务,据报网站让用户填写问卷,自我检测病徵,并获悉从何可检测,是否感染Covid-19冠状病毒。网站亦介绍染感各种风险因素以及出现的病徵,用户自行判断有否属于受感染风险,再决定到附近检测中心,自行检测病毒。

Google大举投资人工智能,Verily可从网站和各种相关数据,预测长期病患,其至流行病风险;只要查询身体状况,再配合各种数据,就可推测出感染风险。Verily已在多国推动数据作诊断和医疗计画,并取得成果。

人工智能开发新药

Alphabet属下另一家人工智能公司DeepMind,亦对于开发Covid-19病毒SARS-CoV-2解药,可能有重大贡献.2018年低,DeepMind以人工智能推出演算法AlphaFold,预测复杂3D形状的蛋白质摺叠(Protein folding)竞赛上获冠军。最近亦算出SARS-CoV-2的3D蛋白结构。

了解复杂3D形状的蛋白质结构,被视为研发新药的关键技术。较早前,美国德克萨斯大学奥斯丁分校团队以「低温电子显微术」(Cryogenic electron microscopy,cryo-EM),快速成功拍摄SARS-CoV-2的「刺突蛋白」(Spike Protein),被视为开发病毒疫苗的突破。

SARS-CoV-2外围有多枚刺突蛋白,外形看似冠状,因此而被命名冠状病毒。刺突蛋白藉结合人类细胞上的ACE2受体进行入侵,入侵方式与2002年出现SARS病毒一致;不过研究发现,SARS-CoV-2结合强度,竟比SARS病毒强出10至20倍,所以较SARS更易人传人。

有关研究乃美国敏感及传染病研究中心资助,2月19日的《自然》期刊上发表;又发现了现存针对SARS开发的三种抗体,均无法成功结合SARS-CoV-2刺突蛋白加以中和,如果开发病苗或以抗体为基础的解药,就必须另觅新蛋白结构。

不少人以为,经过Covid-19冠状病毒,不少国家均会投资cryo-EM,以期更快找出蛋白分子结构,加速新药的开发。蛋白质是氨基酸通过肽键组成的綫性链,摺叠成3D结构,结构取决于氨基酸序列和互相的物理作用,最重要是结构决定了蛋白质的生物学功能。所以理解了病毒蛋白结构和功能,不但可理解病毒如何入侵人体细胞受体,以至如何作出抑制或中和病毒,但即使有低温电子显微术,人类理解的蛋白结构数据,仍然甚少。

美国国家科学基金会生物学部建立了蛋白质数据银行(PDB,Protein Data Bank),支援全球上载3D形状的蛋白结构资料处理,以加速开发新药。

目前,以传统「X射綫晶体学」(X-ray crystallography)重建的蛋白分子结构,每年不足1万,「X射綫晶体学」非常耗时,往往是缓不济急。cryo-EM可更快获得影像,但以往影响模糊。近年在电脑帮助下大有改善。2017年,Richard Henderson就是凭着改善cryo-EM拍摄蛋白结构的清晰度,并加快拍摄进程获得了诺贝尔奖。

「X射綫晶体学」极为耗时,cryo-EM安装和操作昂贵,也不容易普及。德克萨斯大学短时期内,重建SARS-CoV-2冠状病毒上刺突蛋白的结构,已经引起了哄动。不过决定整个结构仍然极为耗时,部分蛋白结构的来龙去脉,甚至无从稽考。

近期,科学家就利用了储存蛋白质的氨基酸序列(Amino acid sequence),只要以前相同蛋白结构已经获得实验证明,就可以「模块建模方式」(Template modelling),通过超级电脑以模拟计算,可估计出蛋白的结构。

以电脑预测白结构,一些特定蛋白质结构编码后,以不同相似蛋白质结构,建立监督模型加以训练,就可预测出结构。但是假如蛋白质结构从未重构过,旧的预测模式,就一筹莫展。

2018年底, DeepMind开发了AlphaFold演算法模型学习,并取得重大突破,竟能算出从未重构过的蛋白结构,称为「自由建模方式」(Free modelling);第13届全球蛋白质结构预测竞赛(Critical Assessment of protein Structure Prediction,CASP)上,终于大放异采。

电脑模拟计算蛋白结构

Alphabet演算法准确度惊人,43种蛋白质之中,准确预测其中25种,大幅领先第二名,只能准确预测出其中3种蛋白结构。部分蛋白质结构生物学家甚至认为,AlphaFold演算法是研究蛋白结构最大突破之一。

DeepMind再利用了AlphaFold演算法,网上公布了数个SARS-CoV-2蛋白结构的预测。DeepMind团队强调,有关蛋白结构并未经实验实证,不过AlphaFold演算法命中率,有关结构可助科学家研究,估计有关蛋白各种特性和功能,甚至配对以现存药对付Covid-19。

去年,麻省理工学院公布人工智能模型,可从氨基酸序列和蛋白结构,直接推断蛋白的功能。类似技术应用研究疫苗或者抑制剂,均具重大意义;只要AlphaFold估算出结构,也能获悉有关蛋白的功能。人工智能和疫症之间,正进行生死时速的竞赛。

全文刊于《星岛日报》「创科广场」

德克萨斯大学奥斯丁分校以cryo-EM,拍摄SARS-CoV-2刺突蛋白,绘制出新冠病毒上刺突蛋白的原子图谱,绿色标示部分是刺突蛋白,用于结合人类细胞上ACE2的受体结合区域(Receptor binding domain)。(图片来源:德克萨斯大学McLellan实验室
德克萨斯大学奥斯丁分校以cryo-EM,拍摄SARS-CoV-2刺突蛋白,绘制出新冠病毒上刺突蛋白的原子图谱,绿色标示部分是刺突蛋白,用于结合人类细胞上ACE2的受体结合区域(Receptor binding domain)。(图片来源:德克萨斯大学McLellan实验室

關鍵字

最新回应

關鍵字

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad