ONE
一、主题分享
0 1
人工智能与化学合成——李成涛
报告介绍了人工智能在化学合成领域的应用,讲述了化学合成在生物医药及化学制药中的作用和地位,以及引入人工智能技术的原因和带来的好处;同时,介绍了人工智能用于筛选合成路线的大致思路及应用方法;最后介绍了相应的成果和合作前景。
一种新的药物从发现到最后通过审批投放市场平均需要十四年时间,研发周期非常漫长,期间需要大量的资金投入。而且,药物研发的投资回报率逐年下降,研发成功率也在逐渐下降,这使得新药研发伴随着巨大风险,随着时间的推移反而这个风险越来越高。探索更有效率的药物发现工具,提升药物研发效率,做到降本增效是应对药物研发风险的最佳途径之一。
其中目标药物分子的合成路线设计,即化学逆合成反应的构建,受到了Alpha Go围棋智能博弈程序的启发,AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助估值网络(value network)与策略网络(policy network)来解决围棋博弈中复杂的分支探索问题。
目标药物分子的单步合成方法设计,可以看作是其反应物前体的猜测问题。多样化的前体拆分方案,构成了多层次的多反应路径的选择问题,这与AlphaGo的围棋博弈中的胜利分支探索有了类似之处。
Nature报道的这项工作提出了借鉴AlphaGo解决该问题的方法,这其中解决了两个关键问题:(1)在单步逆反应中如何预测前体,(2)多步逆反应的搜索。自2017年以来,也有很多学做在这个方向做了很多研究。例如:
星药科技与Google Brain, MIT, Georgia Tech, 蚂蚁金服进行合作,开发了一些新的算法,取得很好的效果,比如发表在NeurIPS 2019以及ICML 2020的成果,相比传统方法取得明显的进步。
这里介绍的工作只是人工智能技术在药物研发中应用的冰山一角,星药科技一直致力于运用人工智能技术提升药物开发的效率,期望将合成路线设计在秒级别完成,达到降本增效的目的。最后,我相信人工智能技术将在药物研发上将有无限的潜力,也期待大家与星药科技的合作。
0 2
弱AI时代的药物发现——裴剑锋
报告首先介绍了人工智能技术的原理和应用场景,再到机器学习的分类及发展历程;重点介绍了人工智能技术在药物设计及化学信息学中的应用及研究进展,尤其是多种深度学习技术的核心思想,并展望了未来科研模型的转变机器引发的创新浪潮。
机器学习是属于人工智能中的一类技术,其包含了监督学习、非监督学习及强化学习。而深度学习又是隶属于机器学习领域中的一种最新技术,其在大数据方面表现出了更好的性能,但也更依赖大数据。
回到药物研发,传统的基于实验的高通量筛选化合物,效率比较低而且风险很大。引入人工智能的目的就是在于提高药物分子设计的效率和成功率、提前预知错误的药物分子或合成路线,及早止损。目前,人工智能主要应用在药物发现阶段,其他的阶段也有些应用。但是,回顾以往的研究,还没有完全证实人工智能技术能在特定成功的新药研发中发挥了绝对作用。下面介绍一下我们的一些基础性工作。
在基于人工智能的药物研发中,药物化合物的分子结构编码是必须解决的问题,一般包含三种方法:一是采用大量的化学描述符(deor),每个描述符描述分子的各种局部特征或有限的化学信息,加以组合形成矢量便可以提供化合物较为完善的信息;二是采用类似图卷积的思想,将不同半径范围内的分子子结构特征提取出来,形成分子指纹,例如类似于ECFP4环形分子指纹;三是采用自然语言处理技术,直接处理表示分子结构的线性字符串。
例如,我们将第三种方法应用在肝损伤的预测上。
这是我们运用第二种方法,在不同的分子半径上提取特征,完成构效关系建模及分子指纹分析的工作。
卷积神经网络的特点就是可以提取出图像的局部特征,如果应用在分子结构上,也可以找到一些与目标性质关联的局部特征,从而提供一些解释性证据。下面也提一下图结构及图神经网络,也有不少工作。
由于分子结构可以看成无向图,所以利用图神经网络来学习,但是也要解决一些其中关键的问题。在实现分子结构的编码及相关的性质/活性预测后,还需回答如何生成目标分子结构的问题。这里讲一下,现在非常热门的生成模型,也可以用在药物分子生成上,可以通过循环神经网络(Seq2Seq)来实现,也可以通过变分自编码器(VAE)或者对抗神经网络(GAN)来实现。
但是,这种思路没有考虑药物分子与靶点的结合能力,这是受限于了分子结构二维表达或线性字符编码。我觉得未来应该向三维的分子生成方式发展,这样可以引入一些分子三维结构上的组装可行性约束。我们正在努力实现三维分子生成,同时也做了一些合成路径设计方面的工作。
我们发现如何对合成路径进行打分这是一个很难的问题,即怎么定义一个合理的基准来评价最佳的反应路径。
另外,我们发现药物和化学研究中大量的数据都是非结构化数据,如何从分的利用的这些数据,也是非常值得研究的。
但是,较多研究提出的模型只能在基准测试数据集上进行评估,离实用还有一定的距离。我们期望能够开发更加实用的人工智能药物设计工具,通过把很多工作步骤串联在一起,改善模型的实验可验证性。
事实上,现有数据中的标注很多是用既有模型产生的,最典型是用量子力学的方式产生数据。科研分成三类:开普勒模式,从数据中总结规律,典型的方法就是机器学习;还有牛顿模式,先把公式从原理上提出来,然后模拟真实体系。但是量子力学,很难处理复杂的大分子问题。如果用人工智能、机器学习和物理模型结合的第三类模式,无论在材料设计方面,还是在药物设计方面,我觉得都是一个很好的新模式,既可以面对复杂问题,又不脱离基本原理的支撑。这可能导致未来科研模式的较大转变,会引发一些颠覆性的创新。
03
人工智能在开发环境健康安全溶剂中的应用——申威峰
溶剂是石油、医药、化工、食品等不可或缺的化合物,溶剂的生产和使用带来的潜在环境、健康和安全(EHS)风险是必须面对的问题,且大多数有机溶剂在使用后的回收再利用也必须考虑。因此,筛选或设计绿色溶剂替代具有较高EHS风险的溶剂具有重要的意义。报告介绍了运用人工智能技术对溶剂性质预测及潜在EHS风险评估方面的研究进展。
传统的试错方法通过实验筛选合适的溶剂分子结构,非常消耗时间和资金。采用计算机根据已有的实验数据构建数学模型,预测性质和优化溶剂分子结构,可以加速绿色溶剂的开发和筛选,减少成本。我们应用机器学习建立智能化的溶剂性质预测模型的具体思路,包含四个步骤:数据收集、数据整理和转换、模型搭建、模型训练及评估。
溶剂开发的数据,涉及分子结构、性质数据和危害标签,主要从一些权威的数据库中收集,并整理后统一采用关系数据库开发平台进行数据库构建。
我们通过深度学习技术来实现分子结构的自动化编码及构效关系建模。主要通过用于产生分子签名描述符的图规范化算法,将分子结构转换为树状的有向非环图(DAG),这样就可以采用一种递归神经网络——树状长短期记忆(Tree-LSTM)网络进行分子结构的学习。我们基于RDkit开发了分子结构到DAG的转换程序,由于单纯的DAG无法将化学键的信息保留给神经网络进行学习。因此,化学键以符合的形式合并到了DAG的顶点中。将顶点的每个符号在分子结构中的相邻关系进行采样,形成训练数据,就可以采用词嵌入的算法,将顶点的相邻关系的概率信息传递到后面的Tree-LSTM网络中。Tree-LSTM是一种动态的神经网络,可以自适应的模拟DAG的拓扑形状。Tree-LSTM输出的特征矢量代表了分子结构,可以与单个或多个前馈神经网络(FNN)进行组合,形成单任务或多任务学习的深度学习神经网络架构。这里模型的训练涉及数据集的划分,验证集主要用于对超参数进行调优,测试集用于最终模型的预测能力测试。这里涉及一些损失函数和优化器的选择问题。
我们将提出的深度学习架构用到预测溶剂的基础性质、环境性质和安全性质上取得了满意的效果。另外,也通过分子指纹和机器学习对溶剂分子结构与潜在EHS风险之间的关系进行了分析,尝试找到一些解释性的证据。
这是深度学习模型在溶剂的基础物性上预测的一个例子,预测的性质的临界性质,这种性质经常在溶剂的热力学计算中用到。结果表明,深度学习模型的效果较为理想。
这个例子是深度学习模型在环境性质方面的应用,预测辛醇水分配系数,比基于基团贡献法的KOWWIN模型有更好的性能。
但是,提出的深度学习模型的可解释性尚有不足。我们提出用一些经典的机器学习模型来预测溶剂的潜在EHS风险评分。这里也涉及到一个人工打分的规则问题,因此选取了欧盟公认的CHEM21作为依据。结果表明机器学习模型可以依据分子结果得到较为准确的EHS风险分级结果,同时也找出了一些风险较高的分子子结构特征。
总体而言,人工智能领域的深度学习和机器学习在绿色溶剂开发方面能够发挥较大的作用,表现出了较好的预测能力,可以实现一定程度上的虚拟高通量筛选。
最后,我展望一下后面的工作。我想还有些工作需要完成:就是人工智能模型给出的结果的置信度,还有它的应用域,这些问题怎么评估?当然,还有分子结构生成模型还需要更深入研究。这些都将使得人工智能技术在化学、制药、材料等领域有更好的应用前景。
TWO
二、主题讨论环节
· 议题 一 :人工智能在制药化学里面的运用,能够帮助解决哪些传统手段不能解决或者很难解决的问题?
杨庆怡:相比于比较经典的量子计算来说,AI科技模型能够覆盖更多的数据,从更多的数据里面获取信息,这些信息是很难被传统科学计算捕捉的,这是很大的优势。新的AI Deep Model能通过对大数据的训练和学习来提供更好的预测,以及产生新的分子结构。这都是经典的科学计算难以做到的事情。
杨东:现阶段AI的发展带来的最大帮助还是在于新药研发。药的研发是一个系统工程,这其中的环节实际上都是非常耗时耗力的,现在都是以低效的方式在进行,成本也都非常高。研发费用高、研发周期长、研发成功率低,一直是压在制药企业身上的“三座大山”,随着AI技术的加入以及不断发展和成熟可以逐步推倒这“三座大山”,为新药研发减负。另外,AI可以被应用于药物靶点的设计,可以利用阅读自然语言的办法阅读海量文献,总结之前的研究成果,来设计被人们忽略的药物靶点,都是在助力新药研发。所以我觉得随着AI的发展,将会开创一个更高通量的、更快、更有效和更便宜的药物开发时代。所以AI带来的最大帮助,未来还是在新药研发的过程中起到非常关键的作用。
李成涛:AI相对于传统的计算方法,不太一样的地方,在数据量足够多的情况下,可能某种程度上可以减少或者完全去除系统性的误差。AI肯定有好有坏,相比计算化学的方法,它是需要数据的。所以数量可能成为AI的一个问题,有些数据不足的情况下,用计算化学是比AI效果更好。这两个是两条路,各有优劣,在某些情况下AI会对计算化学有一点优势。从AI角度来讲,解决的最核心的问题是规模。AI提供了这样一个手段,现在不仅仅局限于几万、几百万个,可以几百亿个甚至更多,只要算力足够,模型是OK的,完全可以解决规模的问题。
· 议题 二 :人工智能在现代制药和化学领域已经有很多运用,但是它的局限性也比较明显。请裴剑锋和申威峰老师回应一下,现在应用中瓶颈在哪儿?未来向前发展,有待突破的领域在哪儿?
裴剑锋:第一个瓶颈是数据问题。在药物研发应用场景下,数据很难自动产生。比如说,做天然产物的合成,数据不够,可能需要人来打标签,那可能十几轮跌代后就做不下去了,如果用模型来生成数据,精度和准度也是有限制的。另外,在药物研发里,很多数据没有阴性数据,但是作为机器学习的模型,负样本非常重要。没有这个负样本,数据就不平衡。这个问题始终存在,需要很大的数据系统来支持。第二个瓶颈在于人工智能本身。药物研发就是人工智能的一个应用,也存在一些局限。因为药物系统本身很复杂,将一个前沿的东西应用到复杂系统,这里面就会出现瓶颈。比如药物专家的经验的学习和传承,人工智能很难处理。第三个瓶颈就是人才的问题,因为这是很强的交叉学科。
申威峰:准确可靠的实验数据是很难收集的,这是制约模型预测能力的重要因素。另外,虽然我们化工厂有很多有效和无效的数据,也有一个DCS自动控制系统来采集装置数据,但是很多数据都是重复的、无效的,处理工作量非常大。另一个问题,人工智能技术大多数是基于概率模型的,所以对一些现象和结果是没有提供充分解释证据的,是一个黑箱模型。无论是制药行业还是化学领域,都是有一定的特有知识、机理或者机制为标准的,单纯地应用人工智能并不能解决所有问题。如何将黑箱模型和化工的白箱模型结合、与制药的药理结合研究,来形成完善的研究方法以便于两个领域的难题,都是研究的重点。
· 议题 三 :我们回到人才问题,各位嘉宾走到今天进入了非常新、非常热的人工智能和化学制药领域,肯定都有自己独特的故事,所以想请大家自我介绍一下你们是怎么样进入到现在你们所专长的事情和职业轨道的。
杨庆怡:我自己的职业轨道比较简单,主要是很幸运。我本科毕业以后就到美国读博士,博士后就在GSK制药公司工作几年,然后就来到辉瑞,一直从事计算化学工作,所以很高兴的看到在过去几年计算化学有很大的发展,制药部门对计算化学也越来越重视。我们目前做的工作,主要还是通过比较经典的科学计算来设计和优化小分子模型。对于AI,我们非常感兴趣,也投入了很多研究,想发掘AI在制药上的潜力。我们有很大的兴趣在AI领域,希望各界同事和研究员在这方面有更多突破,这样能够把AI更多带入制药行业中。
杨东:我本身是做生物信息学的,我的导师的课题组主要是做癌症研究,科学家近几十年开发出了上百种抗癌药物,但是癌症对症下药的问题到现在也不尽令人满意,传统的办法是利用生物标记物,一两个基因突变来判断他是否适合某种药物,效果也不理想。我最早接触到人工智能,2016年AlphaGo的时候我发现它的处理是非常复杂的模式,当时就想可以通过人工智能的办法学习人类不同肿瘤基因组,实现对肿瘤的个性化用药。于是我开始学习了一些人工智能的知识,后来我发现还要把抗癌药物化合物的信息也融入进来,所以我又想办法学习了一些化学,希望对任何一个病人的药效预测能做得更加准确。如果要给大家一些建议的话,我一开始觉得人工智能距离生物特别远,可能是非常困难的事情。但是,当真正投入到科研中,就不要想太多,集中精力专注在知识里,不要害怕,一点点的认真学习,然后达到自己的研究目标。
李成涛:我的轨迹可能和各位老师不是特别一样,我一开始已经在人工智能列车上,是后来转向人工智能和化学这个宇宙飞船上的,当然现在也在不断学习丰富知识的过程。我本科在清华大学姚班,学的偏理论,计算机这边也涉及到一些,关于计算生物学,包括机器学习,后来去MIT之后也一直在做人工智能相关工作。当时一直对创业比较感兴趣,一直到2017年末的时候,当时是人工智能开始在化学应用了以GNN图神经网络为基础,然后扩散到各种各样的应用。2019年初我提前毕业然后做了这家公司。作为原本是人工智能这边专业的人,然后要进入整个化学领域或者制药领域,当时花了很多时间学习,但是很有意义。从我个人经历和大家交流,假如你是做AI的人,对这个问题比较感兴趣,不妨多花一些时间了解一下,尤其这次新冠疫情让大家对药物研发这件事的重视程度上升很多,整个信息还是比较畅通的,如果感兴趣的可以多看看。
申威峰:我当时在美国和法国从事的科研方向是计算机辅助化工生产,主要从事一些化工软件的开发改进,比较接近人工智能。我2016年回国,我们团队一起就做人工智能方向。我们化工产业,很多高端产品需要依赖国外进口,装置技术跟国外比差很远。最关键的就是我们可以通过更智能的工具来辅助和帮助我们精准决策,来提高产品质量。这个课题意义非常重大。在化工领域的人才培养,需要同时学习两个学科的知识和技能。我呼吁国内高校可以开办相应的交叉专业,适应未来对交叉学科领域人才的需求。
裴剑锋:我是学生物出身,当时比较喜欢计算机,自学了很多计算机的知识,博士的时候转到计算机辅助设计,我一直在这个方向上走。关于交叉人才培养,有药学和化学基础的可以多学习一些人工智能的知识。
议题 四 :请各位预测一下十年以后再看这个领域,制药和化学领域,人工智能再发展十年会是怎样的场景。
杨庆怡:一个方向就是有了更多的数据。化学数据库平台可以给化学家和生物化学家提供更大的便利。在化学信息学的基础上,如果AI技术能够从这些信息里面能探索出真正的知识,更一步从数据变成知识以后,相信能够带来更大的突破。十年以后真的很远,因为在一到两年内的变化都非常大,很难预测十年以后会怎么样。
杨东:我想十年以后更大可能性,还是会以计算机计算结合实验验证的模式进行,唯一不同是随着人工智能技术的加入,人工智能技术的不断成熟以及数据的积累,二者的占比会发生很大变化。可能十年以后是进行大量模拟计算预测成为主要部分,但是不太可能完全脱离实验,只是这个比例到底有多大变化,就看AI发展的快慢,这样这个比例变化的程度也会不一样。
李成涛:十年之后,人工智能整个发展一个是数据、一个是算力、一个是算法。算法就不用说了,十年之后,肯定算法都不太一样了,相信会有长足发展。十年之后,我相信会有一个相对来讲比较大规模的数据出现,对于人工智能来讲相对比较友好。现在正常机器学习能做的事情不一定很多,但数据量足够之后,它可以拟合到和自然更贴切,这样人工智能的输出相对就会更好。算力上,十年之后,我相信也会有长足发展,尤其是专有芯片。不仅仅只是推动了人工智能的发展,还有其他很多方面,比如超算。当模拟可以做很快很准之后,一方面人工智能这边积累一些数据,第二方面对我们做一些快速筛选这都很有益。退一步来讲,相信十年之后人工智能会对整个制药和化学领域产生非常深远影响,具体就体现它能算的更快、规模更大、算的更准。
裴剑锋:如果General Intelligence未来十年发展的很好的话,场景就非常乐观。比如在计算化学和化学机制的预测上,可以看到机器学习,量化和密度泛函理论结合的很好,数据量足够的时候,计算精度已经接近那个精度了,并且它的速度很快。如果采用不断迭代的方法,也许我们可以推动量化计算或者模拟它的体系的增大,对理论化学,这是非常有用的。另外,可能更多的数据大家会去注意积累,中国要成立国家数据中心,这也是非常重要的。可能十年后真的会产生一些比较大的突破。General的东西,我最希望它在自然语言处理上产生巨大突破,这样真的是能够帮我们读文献,把这么多散乱的非结构化的信息,组织成有用的知识。这无论对哪个行业,对制药行业都是非常重要。
申威峰:我感觉可能后面基于人工智能的一些化学产品的开发软件或者是化工辅助决策软件会大量出现,科技工作者可以利用这些工具快速筛选我们想要的分子结构,筛选我们想要的产品配方,筛选我们的合成路线,可以大大提高我们的合成效率,也可以保证高纯度产品,保证高质量产品,相当于提高国民经济,化工是产业支柱,在这方面肯定会发挥非常大的作用。既然把合成路线这些方法都缩短了,可能产生的一个影响就是做化学合成,或者做药物合成的一些重复劳动力的科研工作者可能会减少,这些数量可能转移到从事人工智能和化工药物结合的方向上。我觉得人工智能技术不仅可以加速我们研究的进程,出的新产品也非常多;同时可以向着更绿色、更健康、更便捷的方向发展,我觉得这是人工智能会给化学化工和药物制药产生非常好的促进作用。
议题 五 :大家发现有什么困难,很难做得更好的,或者有什么东西在学术界、工业界怎么样交流可以帮助整个领域往前推动。大家自由发言。
申威峰:对于化工方向,首先可以开发人工智能辅助的软件,帮助企业合成和分离过程的决策。另一方面,化工是一个质控系统,后面可以借助人工智能和化工制造系统结合,形成自优化、自诊断的智慧化工系统,我们可能要基于人工智能大数据、物联网,化工厂的设备监测技术融合,来构建一个智慧化工决策系统,开发一个能够分析化工厂企业的在线数据,开发适用于物联网的传感器,开发质控系统和人工智能的交互平台,形成决策软件包,这样可以帮助企业在化工过程中化工厂里面优化生产效益、减少能耗,控制生产风险,同时提高产品质量,我认为可以通过这样来对接。
李成涛:第一个方面从人工智能角度来讲,很多做人工智能的毕竟不是出身于药物研发或者化工产业,所以这就需要多交流,要知道现在这个产业的痛点在哪儿,人工智能能给他解决什么问题,能够给他提供什么产品,这个是非常重要的一点。另外一点,从制药和化工产业角度来讲,人工智能要和大家多交流。现在对人工智能了解相对比较少的领域专家,他们可能期待不太一样。有些人可能觉得人工智能做的事情可能不会达到我想要的要求,或者我自己的期望和现实的人工智能能做的事情是不符的,本质上说就是两边的期望没有合在一起,简而言之,人工智能如何跟现有制药和化工产业对接,从人工智能角度来讲,从化工制药产业来讲,相互多交流至关重要。这也是我自己的一个体验,谢谢。
杨东:人工智能的人需要和化工产业的人多交流,然后明白其中的问题所在,生产实践中的问题。化工产业也需要多和人工智能的人聊,这样人工智能的人可以帮助想用什么技术来实现和解决这个问题,我觉得在化学方面有几个地方可能需要进一步的在人工智能上有技术突破。另一方面,在学术界也在想如何把化合物更好地表述出来。如果把三维信息,整个化合物的结构以及它周围的带电情况等等,以及影响生物活性的属性更好的表述成为一个数字化的信息输入神经网络,也是需要学术界进一步的开发和研究,可能会进一步把整个化合物的预测达到更好的提高。
THREE
三、开放式讨论
Q:现在对于新冠病毒药物的开发,有很多文献,也有很多分子,人工智能怎么能够辅助快速开发治疗新冠病毒的药物?
裴剑锋:早期大家都是希望赶快把药拿出来,但是开发新药没有那么快,所以开始大家都用老药新用的策略。AI在老药新用方面的应用比较多,可以通过药物和靶点的相互作用的网络来预测老药新用。另外,还可以应用AI来做冠状病毒的药物、活性化合物以及确认无活性的化合物的区分模型,然后再进行预测。此外,针对靶点进行药物设计和筛选等等,都可以用到AI技术。但是由于对于新冠病毒的认识需要一个过程,药物研发和疫苗开发都不是很容易,大家也逐渐意识到了这个问题的复杂性。AI可以继续在这上面发挥作用。现在有些工作也预测出来很好的活性化合物或者已知药物。
Q:目前大药厂的研发重点是往大分子研发倾斜,各位嘉宾对于AI对于大分子研发有什么想法?我们说的是biologics(生物制剂),peptide(肽)和protein(蛋白质)。
杨庆怡:我的主要研究领域一直都是在小分子药物的研发,对于AI在大分子领域的贡献,同行业的大分子研发部门也投入了很多研究。尤其是通过AI预测大分子的性质,比如说黏度、活性或者毒性,这些方面都有很多很有潜力的发现。另外,AI带来的突破可能会在一些应用方面能够有一个很好的支持,或者说预测可行性较高的连接方式和结构等。
Q:化学目前在中学阶段地位有所下降,请各位专家怎么看待未来化学的核心地位?
申威峰:我觉得化学其实是国民四大支柱产业,我们的吃穿住用行都离不开化学,平时我们可能感觉不到,但是我们的各个方向都离不开化学,可能在中学阶段的同学可能由于了解不深,觉得化学地位有所下降,但是事实上化学作为基础学科地位毋庸置疑,结合AI技术未来化学的发展是无可限量的。
裴剑锋:未来老龄化化社会,以及人们对健康的追求,生物医药会变的非常重要,化学是生物医药的基础,没有化学生物医药是无法发展的,我不是很理解教育部的政策,我公开反对降低中学化学的重要性。
Q:下一个问题提给李成涛老师,现在AI路线设计会对真实工作有些辅助参考价值,但还做不到取代人,从参考到取代,你认为还有哪些问题?需要如何改进AI以实现呢?
李成涛:现在大家可能感觉AI已经无所不能了,实际上它能做的事情还有一定的局限,即使我是做AI的,而且我对AI非常有信心,但是这一点必须要承认。比如说,就化学逆合成来讲,AI的参考价值肯定是有的,但是我们真正要做的是把两者结合起来,而不是用一个来完全代替另外一个,两者应该是相辅相成的,人来做人的分工,机器来完成机器的任务。那么该如何实现这样一个过渡。第一就是工程问题,怎么把整个算法的速度提升上去,怎么样优化好细节问题,这对以后工具的应用和用户体验都是非常重要的。第二就是产业需求。化工产业或者整个工业界需要什么,不同的人需求的东西是不一样的。有的可能只需要一个大概的路线,有的可能需求更多,因为整个合成不仅仅是选择路线,还要考虑温度等其他因素。目前,路线规划可以做的非常好,我们也在进一步完善其他部分,以后可能在一些细节和具体操作上会更完善。比如说,现在要做一个菜,我们现在能做的就是告诉你,第一步就放西红柿,第二步放鸡蛋,第三步放糖。当然这个肯定是能提供一部分信息的。但是我们希望能做到下一个层次,能够提供一个更加完整的指导,从油热到什么程度可以放西红柿,什么时候放糖、什么时候放鸡蛋,或者类似的事情,当然这还是需要有一段路要走,但这肯定是最终希望能够实现的。所以回到问题,总结来讲是两个方面,第一,大家往往忽视了一点,你做工程角度来看,很多地方做的是远远不够的。第二,从业界需求来看,还是有可以改进的空间。
Q:化学过程的探索还是要追踪物理领悟,一个分子中某个原子的改变即可能很大程度上改变分子性质,更不用说生物大分子了。请问AI可以联系物理领域方面进行研究吗?
申威峰:这个问题特别好。AI和物理领域交叉也可能是一个新学科,很多东西是可以做的。例如,物理的基础研究可以推动计算机的运算能力提升,比如量子计算机如果未来可以用到AI上,AI可能会更加智能。另一方面,物理学科运用了很多统计学和概率论的思想和理论,而当今的AI技术中有不少模型是属于概率机,两者如果能结合起来,做一些微观的现象的智能化预测或分析,我想也是一个较好的交叉领域。其实,化学、AI都可以和很多学科交叉,包括管理,我们和经管的物流供应链也可以结合,可以和药学结合,可以和材料结合,我们化学、物理学科都可以研究物质的结构,所以它的结合可以是很多领域的。这位同学如果感兴趣可以进一步研究,我们后面可以继续交流。
Q:未来3D打印可以直接打印药物吗?药物与靶点体外模拟结合代替实验可以吗?
李成涛:这个想法很有意思,我是研究小分子相对比较多,我从小分子角度来说这件事情。3D打印我不是特别了解,我不好说3D打印药物能不能实现。这个问题本质上还是我们如何快速的合成药物,然后去验证,其实现代自动化合成方法,是可以做到这一点。回到问题,能不能,我不知道,但是有其他方法可以实现,而且现在已经有人在做。去年《Science》上有一篇来自MIT的文章,他们做了一个非常复杂的机器,一方面利用人工智能设计整个路径,一方面用机械手来做反应得到药物,需要的药物和计量都可以自动化实现,这个的效果和你所说的3D打印类似。为什么说这个问题好,化学合成实际上是药物研发在时间上的一个很大的瓶颈,比如合成几十个分子要两三个月的时间,等拿到结果再去迭代我的模型,这是不太高效的,所以说如果能有这种方法肯定是非常好的。这个问题的下半段,把药物与靶点体外模拟结合类似的事情,我不太清楚。但是现在治疗某种癌症,可能把癌细胞取出来,放在培养皿上面,滴几滴药,看看癌细胞是不是死了或者没有再生长。类似的东西是可以做的。波士顿的一些工作又在此基础上更进一步。比如现在培养皿是2D的,是平面上的东西,有没有可能搭建一个架子,比如做一个心肌细胞的实验,让这个心肌细胞长在上面,变成三维的结构,然后再去挤药,可能相比直接在二维平面上会更准一些。所以说这两块都是现代药物研发中比较迅速的,如果能达到你所说的能快速合成、快速的体外结合代替实验,那对整个药物研发都是非常大的好消息。
Q:网友提给杨庆怡老师,他想了解辉瑞制药公司中计算化学在你们公司中有什么样的运用?在量化和动力学不同的方面。
杨庆怡:辉瑞研发部门对计算化学非常重视,我们每一个研发的科学家和化学家一起工作,特定的某个治疗领域有计算化学的研究员,在其他的部门也有很多计算化学科学研究员,比如机器预测还有物理性质、生物物理性质预测都有一些专业的团队来做这件事情,所以这是非常重视的一个领域。具体说到量化、分子动力学对小分子的研究,主要应用于哪方面。量化应用的非常广,比如小分子特定的物理性质,它的3D结构,还有它的反应活性计算(Reactivity calculation),以及我们说到的晶型预测,还有稳定性(Stability)的预测,应用的非常广。分子动力学,比较近期的分子动力学模拟(MD simulation)我们用它做了很多结合模型(Binding model)的研究,还有从那些模型里产生设想,尤其是对早期的蛋白靶点的探索或者在发现新的蛋白靶点(Hit ID)方面发挥了比较大的用处。比如说预测生物结构活性、溶剂化活性,相关的计算都在研究方面起到了很大的作用。比较经典的化学计算在整个研发过程中还是非常重要的。
Q:最后一个问题,现在很多AI制药公司,怎么样区分好公司和坏公司?
杨东:有很多公司都会在说自己是用AI在开发药物,作为投资人需要有一些专业的AI专家或者团队去了解一下他们核心的AI技术是不是真正用于AI药物研发,就是要了解其中的AI原理或者技术,不是说一个噱头或者幌子。找一些技术人员真正深入了解它的技术。
李成涛:我完全同意,毕竟这个方向本质是技术驱动的,这个技术趋于成熟但还没有完全成熟,比如这个团队有自己研发能力,这是非常重要的事情,这可以作为判断不一样公司的标准,不能说是好公司或者坏公司。
YOSIA Webinar 旨在促进交叉学科的深度学术交流,探讨科研尖端问题,期望通过启发跨学科、跨领域合作,为学术研究带来新思维角度。2020年,推出「AI+ X科学」系列主题,邀请来自不同科研领域的青年科学家,分享AI推动科学发现的科研案例,一同探讨AI赋能科学与技术创新的发展方向。
未来论坛青年科学家创新联盟 简称“青创联盟”,为全球优秀的华人青年科学家提供学术探讨与思想交流的平台,在跨界碰撞中畅想未来,在交叉合作中孕育新思想,以共同推动跨界前沿科学的进步,从而发掘科研界的未来世界级领袖。 青创联盟成员可以在未来论坛平台上开展学术分享、科普宣传和科技成果转化。
来源:未来论坛(ID:futureforum)返回搜狐,查看更多