这种虚拟酵母细胞可以打开人工智能的黑匣子

 新浦京科技     |      2020-05-01

图片 1

图片 2

似乎每次你转过身,有人都在谈论人工智能和机器学习的重要性,加州大学圣地亚哥分校医学院和摩尔癌症中心教授Trey Ideker博士说。但所有这些系统都是所谓的黑匣子。它们可以非常具有预测性,但我们实际上并不了解它们的工作方式。

现代人工智能系统中举重若轻的深度神经网络的神秘工作原理依然未被世人知晓。

Ideker举了一个例子:机器学习系统可以分析数百万人的在线行为,将个人标记为潜在的恐怖分子或自杀风险。但我们不知道机器如何得出这个结论,他说。

它们就像是黑盒子:在一端输入一个问题后(比如,图片里的是一只猫吗?这场围棋中下一步最好策略是?无人驾驶汽车在这个黄灯亮起的路口是否应该加速?),就能在另一端得到答案。我们或许不能知道AI系统这个黑盒子的具体工作原理,但我们知道它能有效工作。

为了使机器学习在医疗保健中变得有用和值得信赖,Ideker说,从业者需要打开黑匣子并了解系统如何做出决定。

在一项新的研究中,研究人员将神经网络嵌入一个简单的酵母细胞中,并由此观察到AI系统是怎么运行的。同时这能揭示细胞生物学的进程。这项研究的成果可用于新型癌症药物和个体化医疗的发展。

机器学习系统建立在人工神经元层上,称为神经网络。这些层通过神经元之间看似随机的连接而连接在一起。系统通过微调这些连接来学习。

首先,让我们了解一下如今机器学习中一些关于神经网络的基础知识。

在最近发表在Nature Methods上的一项研究中,Ideker的研究团队最近开发了他们所谓的可见神经网络,并用它来构建DCell,这是一种功能正常的啤酒酵母细胞模型,通常用作基础研究的模型。为此,他们在一个地方积累了细胞生物学的所有知识,并创建了这些细胞成分的层次结构。然后他们将标准机器学习算法映射到该知识库。

我们感兴趣的是由进化过程而不是计算机学家们优化的神经网络。—Trey Ideker, UC San Diego

但最令Ideker兴奋的是DCell不是黑盒子;这种联系并不是一个谜,也不能通过偶然事件来形成。相反,学习仅由现实世界的细胞行为和约2,500个已知细胞成分编码的约束引导。该团队输入有关基因和基因突变的信息,DCell预测细胞行为,如生长。他们对数百万基因型的DCell进行了培训,发现虚拟细胞可以模拟细胞生长,几乎与实验室培养的真细胞一样准确。

计算机学家们通过设置不同的层来搭建神经网络的框架,每一层都包含了上千个执行简单指令的“神经元”。训练模型时,给神经网络投喂一个数据集(可以是百万张关于喵星人和汪星人的照片,百万种围棋走法,百万种驾驶行为与相应结果的配对数据),系统调配每层的神经元进行系统化的有序计算。数据经过神经网络后得到了结果,随后系统会评估神经网络的工作性能。最后重新调整神经元间的连接模式,再次输入数据,检测新的神经网络性能是否有所提升。当神经网络的性能达到一定准确率后,才能认为训练成功。

人类的知识是不完整的,思科的实验室助理研究科学家马建柱博士说,他领导了建立DCell的工作。我们希望完成这些知识,以帮助指导医疗保健和其他方面的预测。

如今,AI系统的黑盒子魔法创下了不少壮举。尽管还在起步阶段,给互联网上的喵星人照片归类,围棋比赛中大败世界冠军,实现无人驾驶汽车在高速公路的飞驰。

Ideker和Ma也对DCell进行了测试。如果他们故意给系统提供虚假信息,那就不行了。以核糖体为例。细胞利用这些微小的生物机器将遗传信息转化为蛋白质。但是,如果研究人员将核糖体连接到一个不相关的过程,如细胞凋亡,系统细胞就会自杀,DCell就无法预测细胞的生长。虚拟小区知道新的安排在生物学上是不可能的。

美国加州大学圣地亚哥分校生物医学工程的教授Trey Ideker说,尽管名为神经网络,这类系统仅是受了人类神经系统结构的启发而已。

Ideker和他的共同指导的癌细胞地图计划的同事现在正在产生他们为人类癌症建立DCell所需的一些实验数据。然后,他们将确定如何最好地个性化这种虚拟细胞方法,以获得患者独特的生物学。

“以打败围棋大师的AlphaGo为例,它的内部运行完全杂乱无章,根本不像人类大脑”,Ideker说,“它们只是恰好进化成很好完成预测的新结构而已。”

我们希望有一天能够输入您特定的癌症相关基因突变,并获得有关癌症侵袭性的最新信息,以及预防其生长和转移的最佳治疗方法,Ideker说,他也是加州大学圣地亚哥分校计算生物学和生物信息学中心。

Ideker主导了细胞生物学人工智能项目,想要尝试新的研究方向。他想要一个不仅产出结果、还能向研究人员展示得到结果过程的神经网络。将神经网络嵌入一个酵母细胞后,他的团队能了解生命的机理。“我们想要得到的是由进化过程而不是计算机学家们优化的神经网络。”他对IEEE Spectrum如是说。

这个项目的可行性在于,酿酒酵母是一种单细胞生物,自19世纪50年代以来一直作为研究的模式生物。Ideke说:“我们有大量关于细胞生物学的知识可以使用,很方便,“Ideker说,“事实上,我们对酵母细胞的结构足够了解。”

因此他的团队将神经网络的各层与酵母细胞的组成部分依次对应,从最微观的元素开始,到更宏观的结构如核糖体,最后到线粒体和细胞核等细胞器。总体而言,这个称为DCell的神经网络,仿造了酵母细胞的2526个子系统。

上一篇:草莓可以帮助减少结肠中的有害炎症 下一篇:没有了