DeepMind AlphaFold背后的人工智能——及其对未来药物发现的影响

克里斯托夫Zsolt Szalay
《阿凡达》

Kristof Zsolt Szalay是Turbine的创始人和CTO。ai是一家模拟驱动的药物发现公司,也是Emerj人工智能研究的客座撰稿人。爱尔兰德国比分直播Kristof拥有Semmelweis大学的分子生物学和生物信息学博士学位。

DeepMind Alphafold 950x540背后的人工智能

这是由克里斯托夫Zsolt Szalay。Kristóf是涡轮公司的创始人和首席技术官。他拥有分子生物学和生物信息学博士学位。请联系editorial@www.schoolgirlslove.com查询外部专家提供的文章。

你能仅根据零件清单来预测一架飞机是如何飞行的吗?

这-与蛋白质-是本质蛋白质折叠的挑战

两周前,CASP蛋白质折叠挑战赛的组织者刚刚宣布DeepMind的AlphaFold基本上解决了这一挑战——它的预测得分略低于实验误差。

事实是应该是可操作已经为人所知有一段时间了——活细胞没有组装手册,所以编码部分的部件必须以及程序集的代码。我们甚至可以从薛定谔方程而建立——唉,现在即使是地球上所有计算机的综合能力也不足以做到这一点。

DeepMind AlphaFold的成就

对于蛋白质来说,外观就是一切。

就像用钥匙孔来匹配钥匙形状蛋白质的结构决定了它的相互作用伙伴,相反,它在组成细胞的20000种不同类型的蛋白质的复杂结构中的位置和功能。

对于一些蛋白质,它们的形状可以通过实验来确定——这就是CASP的金标准最初出现的原因。其他的适应性很强,它们并没有明确的形状。虽然有其他的研究方法来弄清楚特定蛋白质是如何运作的,AlphaFold应该能帮助弄清楚人体中有多少蛋白质在运作。在这方面,这一发现意义重大。

但这也可以在没有AlphaFold的情况下实现。尽管20000个蛋白质是一个很大的数字,但我们最终会发现的数量有限。

然而,如果没有像AlphaFold这样的工具,就不可能对大量的蛋白质进行研究。制造正确蛋白质的方法只有一种,但制造错误的方法有很多。这样的突变体蛋白许多重要的疾病,最值得注意的是,癌症

AlphaFold及其继任者可能会成为只有这样我们就能知道怎么做了损坏的蛋白质看起来像,然后用药物瞄准它们。

为了欣赏这一重大突破,《自然》杂志提供了一张图,展示了过去15年蛋白质折叠预测的准确性:

Alphafold2
来源:DeepMind

它基本上停滞在40%左右,直到AlphaFold2出现,并在4年时间里主导了所有其他竞争性的任务方法。

在如此重大的突破背后,肯定有一些开创性的科学见解,对吧?

在架构和计算方面具有优势

这里有个突破,只是和蛋白质

AlphaFold2也是建立在同样的基础上变压器机器学习建筑另一个突破是生成式预训练变压器3 (GPT-3)- OpenAI语言模型,在许多情况下生成的文本与人类的书写无法区分。

模型大小GPT-3
相互竞争的预训练NLP模型的各自模型大小——突出了相对庞大的GPT-3,它使用了与DeepMind的AlphaFold相同的变压器架构。来源:分析方面

变压器被设计成减少机器学习训练时间。这不是一种通过相同数量的参数产生更好或“更智能”结果的AI方法。相反,Transformer所做的是允许用它来训练模型数十亿的变量与此同时,使用数十万个机器小时。

因此,AlphaFold2可以被认为是一项工程突破,而非科学突破。自从DeepMind与谷歌合并后,它们可以利用基础设施提供的资源和方法,而这些基础设施为互联网本身提供了很多动力。我从很多科学家那里听说,只要AlphaFold2以“导入谷歌”开头,这是一个巨大的竞争优势,那么它发布源代码也没关系。

IBM的深蓝超级计算机1997年击败卡斯帕罗夫有人指责他并没有真正掌握国际象棋,只是简单地将蛮力计算能力用于一系列可能的走法和组合。即使是对人工智能持悲观态度的人也可能会说,这一成就意义重大。

我们也可以说AlphaFold也是如此。它没有“掌握”蛋白质折叠,只是整合了近乎无限的计算能力(尽管是以一种非常复杂的方式),以找到可能需要数百万年才能计算出来的组合。如果没有DeepMind拥有的硬件和人工智能方法,这些组合可能需要花费数百万年。

与“深蓝”一样,AlphaFold并没有改变药物发现——it改变科学。我们可以预期,这些工程上的突破将进入科学和工业的其他离散问题,我们很可能会看到AlphaFold或类似gpt -3的应用程序在未来一年出现在其他科学或工业领域。

对学术和私营部门研究团队的影响

我相信AlphaFold的主要近期影响将是一系列针对特定突变的新药,从而为患者增加许多额外的寿命。

研究蛋白质折叠的科学家们对DeepMind在短短几年时间里就摧毁了他们的研究领域感到震惊,但这适用于我们所有人。没有多少研究团队或机构有能力为这种模式的培训买单,更不用说了招募或保留一个技术团队这可以改善它。

我们这些没有在谷歌支持的公司工作的人可能仍然需要在科学上聪明,但我们必须建立能够竞争的肌肉。

学术研究不一定是注定的。然而,我也认为它需要改变以保持相关性。我想留下来的人会采用这样的结构欧洲核子研究中心-大量的人致力于相同的目标,共享一个共同的基础设施,只是在上面运行不同的、相关的项目。

讽刺的是,COVID-19可能起到了帮助作用。即便是深入了解如此大规模的遥远科学合作也闻所未闻,但现在我们更习惯于使用Zoom、Slack和它们的伙伴,所以这可能是可能的。我们有办法让成千上万的人远程一起编写代码,只是我们没有为研究建立相同的系统。也许是时候着手解决这些问题了。

编者按:

私营部门企业可以从学习DeepMind(谷歌)和OpenAI (OpenAI)等大公司部署的架构、工具和培训方法中受益。微软),但它们不可能在计算机领域与之竞争。他们也不太可能争夺原始的ML工程人才。深度和狭窄的主题专业知识将更有可能支持大型科技公司以外的公司的盈利发现和突破。

保持AI曲线的领先地位

发现在未来商业中区分赢家和输家的关键AI趋势和应用。

注册“AI Advantage”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
走在机器学习曲线的前面

加入超过20,000名专注于AI的商业领袖,每周接收我们最新的AI研究和趋势。

感谢您订阅Emerj的“人工智能优势”通讯,请查看您的电子邮件收件箱确认。