| 导读

2019年7月13日, 四川大学杨胜勇课题组和瑞士苏黎世联邦理工学院Gisbert Schneider课题组在Chemical Reviews (IF: 54.26)杂志上，发表题为“Concepts of Artiﬁcial Intelligence for Computer-Assisted Drug Discovery”的论文，四川大学作为第一单位。该论文的发布，引起业内重大关注。研究人员全面介绍了人工智能算法及其在药物化学中的应用。在介绍了算法的基本原理后，该综述进一步讨论了人工智能算法在基于结构和配体的虚拟筛选、从头药物设计、物化和药代动力学性质预测、老药新用及相关方面的应用。最后，作者总结了当前方法的一些挑战和局限性，以期为AI辅助药物发现和设计提供未来潜在的方向。

| 内容

近日，四川大学杨胜勇课题组和瑞士苏黎世联邦理工学院Gisbert Schneider课题组在化学类顶级期刊Chemical Reviews (IF: 54.26)，发表了关于“人工智能与计算机辅助药物发现”的重磅论文，引起业内广泛关注。今天药学帮带大家一起解读下这篇文章，了解一下当前人工智能与计算机药物发现的应用现状与挑战。

图片来源于Chemical Reviews杂志

一、人工智能，已渗透到各个行业（注：本部分内容主要来源于互联网，加工编辑）

人工智能（Artificial Intelligence, AI）是继蒸汽技术、电力技术、计算机信息技术革命之后的第四次科技革命核心驱动力。从20世纪50年代发展至今，人工智能经历了技术驱动、数据驱动，现在已经进入场景驱动阶段，作为一项极具前瞻性的技术已深入落地到各个行业之中去解决不同场景的问题。行业的实践应用也反过来持续优化人工智能的核心算法，形成正向发展的态势。目前，人工智能主要在新闻媒体、制造、金融、零售、交通、安防、医疗、物流、教育等行业中有广泛的应用。

| 1. 智能撰稿

人工智能技术在新闻稿写作中的应用已经开始。早在2010年，一位名叫Robbie Allen的思科工程师就把他创建的一家小公司的名字改成了Automated Insights，并开始了人工智能自动写作的研究和开发。2014年，世界三大新闻机构之一的美联社（Associated Press）使用人工智能新闻写作程序报道了地震新闻，该程序可以24小时无限期地工作。在我国，2016年由今日头条人工智能实验室和北京大学联合开发的写稿机器人张小明(xiaomingbot)，可以在2秒内完成手稿，并上传到媒体上发表，高度拟人化，短讯及长文章多类型稿件均可发布，并具有图片识别自动上传等功能。

| 2. 智能客服

说到人工智能客服，我们不得不谈谈客服工作的意义。客服作为客户与企业之间的纽带，承担着直接为客户服务的任务。解决业务问题，处理服务纠纷，加深客户对企业的理解，增强客户与企业之间的感情，这都是客户服务工作的内容。从某种意义上讲，客户服务代表着企业的形象，从客户服务工作中可以反映出企业的文化修养和综合素质。客户服务工作的质量直接关系到企业的利益。然而，客服工作枯燥而乏味，使客服人员容易产生消极情绪，导致客服人员流动性高，招聘管理困难，客户体验差。随着人工智能客户服务的出现，这些痛点得到了一定的缓解。因此，人工智能客户服务在服务业中得到了广泛的应用，并在各大行业和领域得到了推广。比如简单的在线关键词回复，电话语音客服等，企业在利用人工智能提高效率、降低成本、提高客户满意度方面取得了许多成就。

| 3. 无人驾驶

在国外，威莫(Waymo)无人驾驶出租车在美国正式商用，软银本田总联盟、二级自驾已开始在乘用车领域迅速普及，以及英伟达Xavier无人驾驶芯片已实现批量生产。在我国，百度的无人值守小巴Apollon实现了批量生产，无人值守配送车/清扫车在很多地方已运行，AVP自动停车技术在重庆登陆，中国第一辆无人驾驶出租车在广州公开开放体验。百度与力帆分时租赁公司、万达汽车、重庆市政府宣布，百度万达共享汽车驾驶示范园正式开放。首批搭载百度阿波罗AVP自动泊车技术的共享车在这里进行了示范运营。或许，不久的未来，马路上跑的都是无人驾驶车，我们的后代也不用再为驾照考试科目而头痛了，也不会存在闯红灯问题了，想想挺美好。。。

| 4. 智能物流

分拣机器人是一种具备了传感器、物镜和电子光学系统的机器人，收集已经发送到物流语音系统和的仓库控制系统的信息，实现快速进行货物分拣，现在自动分拣机器人已得了初步的应用。在这方面，日本技术比较领先。日本研制的西红柿分选机每小时可分选出成百上千个西红柿，苹果自动分送机，每分钟可选出540个苹果，根据颜色、光泽、大小分类、并送入不同容器内，自动选蛋机，每小时可处理6000个蛋。随着包装机器人、快递机器人、快递无人机的不断入局，智能物流的未来前景也逐渐显现出来。

| 5. 人脸识别

人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部识别的一系列相关技术，通常也叫做人像识别、面部识别。

人脸识别已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。美国“9.11”事件后，反恐怖活动已成为各国政府的共识，加强机场的安全防务十分重要。美国维萨格公司的脸像识别技术在美国的两家机场大显神通，它能在拥挤的人群中挑出某一张面孔，判断他是不是通缉犯。2012年4月13日京沪高铁安检区域人脸识别系统工程开始招标，上海虹桥站、天津西站和济南西站三个车站安检区域将安装用于身份识别的高科技安检系统——人脸识别系统，以协助公安部门抓捕在逃案犯。2013年9月5日，刷脸支付系统在中国国际金融展上亮相。刷脸支付系统基于天诚盛业自主研发的生物识别云金融平台，将自主知识产权军用级别的人脸识别算法与现有的支付系统进行融合，对接了我们生活中涉及到支付、转账、结算和交易的环节。2014年8月起，日本将在部分机场的出入国审查(边检)处重启人脸识别系统的实验。2012年实施的首次实验因错误频发而一度中止，但法务省认为，为迎接2020年东京奥运会需提高边检速度，于是决定重启实验。2015年3月15日汉诺威IT博览会(CeBIT)在德国开幕，阿里巴巴创始人马云作为唯一受邀的企业家代表，在开幕式上作了主旨演讲。在发表演讲后，马云还为德国总理默克尔与中国副总理马凯演示了蚂蚁金服的Smile to Pay扫脸技术，并当场刷自己的脸给嘉宾买礼物。人脸识别技术人工智能应用的一个重要领域，它具有五大优势，包括非侵扰性、便捷性、友好性、非接触性、可扩展性等。2016年以来，人脸识别在银行、证券、金融社保、交通、教育、电子商务等场景应用热度居高不下。

| 6. 医疗影像诊断

医学图像诊断主要是指人工智能医学图像辅助诊断系统。通过深入学习等技术，对医学图像数据进行处理和分析，发现病变，实现疾病的智能诊断功能。人工智能医疗领域的基础水平、技术水平和应用水平处于快速发展阶段。目前，医学影像学人工智能领域最流行、最具代表性的8条赛道是肺结节、眼底、乳腺癌、宫颈癌、皮肤病、骨龄检测、脑疾病和靶区划定。国内企业已经展开广泛的合作，如依图科技、汇医慧影、沈睿医疗、图玛深维和推想科技等公司其产品已与医院方进入合作阶段。。

| 7. 大数据

搜索引擎本质上是一种商业广告产品，它形成了大量的搜索用户流量和用户行为数据，通过操作卖给广告商。在扩展广告数据的深度和价值方面，人工智能的商业模式带来的更高效、更互动、更大数据、更智能的特点。

大数据和垂直行业的结合，是目前的热点。垂直行业包括医疗行业、教育行业、银行金融、制造业、贸易批发、能源、交通、通讯等。案例也很多，如佛罗里达大学使用免费公共卫生数据和Google地图创建视觉数据，可以更快速地识别和有效分析医疗信息，用于跟踪慢性病的传播。美国FDA正在使用大量数据来检测和研究食物相关疾病和疾病的模式。从而做出更快的反应，提供更快的治疗，减少死亡。Spotify则是按需音乐服务，使用Hadoop大数据分析，从全球数百万用户收集数据，然后使用分析的数据向个人用户提供个性化的音乐推荐。亚马逊Prime通过在一站式商店中提供，视频，音乐和Kindle书籍提供良好的客户体验，也是在利用大数据。

二、人工智能在药物研究中的发展过程（注：本部分主要内容来源于Chem. Rev.原文）

创新性药物研发面临着众多挑战，如研发成本高、临床试验成功率低、周期长等问题。据最新数据统计，研制成功一种新药成本高达26亿美元。事实上，很多钱都浪费了，因为90%的候选药会在从初审到药监局批准上市过程中的某个阶段就会被砍掉，而花在90%候选药的钱也就白白浪费了。这个领域中的每一个人都想解决这个问题。

图片来源于Chemical Reviews杂志

随着科技的快速发展，人工智能，特别是深度学习，为创新药物的发现和开发提供了机会。近年来，人工智能技术在新药研发各个阶段中的应用已逐渐深入，推动药物研发从传统的以靶点和结构信息为核心，逐渐转变为以数据和算法为核心的模式。

实际人工智能在药物发现中的应用已久，最早可以追溯到1937年哈米特方程(Hammett)的出现，它是一个描述反应速率及平衡常数和反应物取代基类型之间线性自由能关系的方程（苯甲酸衍生物作为研究对象），以及1964年Hansch对生物活性分子理化性质开创性的采用计算机辅助鉴别与定量分析，Hansch也因此被称为制药界的“QSAR之父”。

自此以后，越来越多的药学化学家采用各种人工智能方法来解决评估和预测化学物质、生物学效应的核心挑战。特别是BOČEK等人在1965年提出的一种“模式识别方法” (Nature,1965, 207, 981)，它是解释和检查化学实体之间通用模式方法，即具有相似结构的化合物也应具有相似的物理化学性质和体外生物学效应。

1990年左右早期的神经网络（如感知器）原型和应用作为解决此类问题的一种潜力手段出现，开始在制药行业产生影响，它们作为“模式识别的引擎”来使用。这一时期的一个典型例子是1992年Weinstein等人发布了一篇文章，他们开发了神经网络来预测癌症药物筛选中的作用机制。

1994年，基于神经网络和进化算法的第一个全自动分子设计方法发布。这些综合学习和决策模型代表了构造性机器学习的第一个实例，并拥有人工智能的所有特征，即（i）解决问题，（ii）吸取经验教训，（iii）应对新情况。除上述方法外，后期还开发了多种机器学习算法[如支持向量机（SVM）和随机森林（RF）]并应用于药物设计，来帮助弥合基于偶然性和合理药物设计之间的误差。

2010左右，为了探索和预测分子表征和观察生物活性、毒性等之间的复杂关系，研究者们开发了一些更深入的机器学习方法。为人工智能和计算机辅助药物发现提供了更强有力的基础。

直到现在，生物制药的巨头们一致认为寻找创新药物研发的人工智能解决方案已迫在眉睫。辉瑞公司已使用IBM Watson系统的机器学习技术搜索癌症免疫治疗药物；赛诺菲在使用英国初创公司ExScientia的人工智能（AI）平台研究代谢疾病药物；罗氏公司的子公司Genentech采用美国Gnshealth公司开发的AI系统，应用到抗癌药物的研发。

三、人工智能在创新药物发现的应用（注：本部分框架来于Chem. Rev.，内容来于互联网）

近年来，计算机辅助药物设计(Computer-Aided Drug Design，CADD)方法在药物研发中不断崭露头角，如已批准上市的卡托普利、沙奎那韦、利托那韦和茚地那韦等，其早期研究大大受益于CADD方法。CADD已成为药物研发流程中不可或缺的一部分。

| 1. 基于结构的虚拟筛选

基于结构的虚拟筛选主要通过解决两个任务来完成先导化合物的发现和结构优化：1、预测小分子与蛋白质靶标结合；2、计算结合亲和力。

基于结构的虚拟筛选主要通过分子对接爱实现。分子对接是通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计的方法。主要研究分子间(如配体和受体)相互作用,并预测其结合模式和亲合力的一种理论模拟方法。近年来,分子对接方法已成为计算机辅助药物研究领域的一项重要技术，主要用于确定蛋白质靶区小分子的最佳位置和方向。

分子对接这一想法的历史可以追溯到19世纪提出的受体学说，Fisher提出的受体学说认为，药物与体内的蛋白质大分子即受体会发生类似钥匙与锁的识别关系，这种识别关系主要依赖两者的空间匹配。随着受体学说的发展，人们对生理活性分子与生物分子的相互作用有了更加深刻的认识，从基于空间匹配的刚性模型逐渐发展成为基于空间匹配和能量匹配的柔性模型。模型的优化使通过计算模拟分子间相互作用的设想更容易实现。

另一方面，计算机和计算科学的迅速发展又使得人们能够处理大量数据，这两方面的因素共同促成了分子对接方法的出现。早期的分子对接方法用分子力学方法或者量子化学方法计算小分子之间分子识别，在一些分子模拟软件包中也含有分子对接的模块。但是由于算法和计算机处理能力的限制，早期的对接方法较难处理含有大分子的分子对接过程。

1995年由Accelrys公司开发的计算化学软件Affinity上市，这是第一个可以进行有大分子参与的商业化分子对接软件，此后，商业化和免费的分子对接软件层出不穷。现在应用中的分子对接软件涵盖了刚性对接、半柔性对接、柔性对接等各种对接方法，在能量优化方面则使用了人工神经网络、遗传算法、模拟退火、禁忌搜索、局部搜索等各种方法，目前的分子对接方法是研究小分子与大分子相互作用模式、生物大分子间识别、分子自组装、超分子结构等课题的常用方法之一。

分子对接方法的两大课题是分子之间的空间识别和能量识别。空间匹配是分子间发生相互作用的基础，能量匹配是分子间保持稳定结合的基础。对于几何匹配的计算，通常采用格点计算、片断生长等方法，能量计算则使用模拟退火、遗传算法等方法。

各种分子对接方法对体系均有一定的简化，根据简化的程度和方式，可以将分子对接方法分为三类。

刚性对接：刚性对接方法在计算过程中，参与对接的分子构像不发生变化，仅改变分子的空间位置与姿态，刚性对接方法的简化程度最高，计算量相对较小，适合于处理大分子之间的对接。

半柔性对接：半柔性对接方法允许对接过程中小分子构像发生一定程度的变化，但通常会固定大分子的构像，另外小分子构像的调整也可能受到一定程度的限制，如固定某些非关键部位的键长、键角等，半柔性对接方法兼顾计算量与模型的预测能力，是应用比较广泛的对接方法之一。

柔性对接：柔性对接方法在对接过程中允许研究体系的构像发生自由变化，由于变量随着体系的原子数呈几何级数增长，因此柔性对接方法的计算量非常大，消耗计算机时很多，适合精确考察分子间识别情况。

分子对接主要程序：

| DOCK

Dock是目前应用最广泛的分子对接程序之一，由Kuntz课题组开发。Dock应用半柔性对接方法，固定小分子的键长和键角，将小分子配体拆分成若干刚性片断，根据受体表面的几何性质，将小分子的刚性片断重新组合，进行构像搜索。在能量计算方面，Dock考虑了静电相互作用、范德华力等非键相互作用，在进行构像搜索的过程中搜索体系势能面。最终软件以能量评分和原子接触罚分之和作为对接结果的评价依据。

| AutoDock

Autodock是另外一个应用广泛的分子对接程序，由Olson科研组开发。AutoDock应用半柔性对接方法，允许小分子的构像发生变化，以结合自由能作为评价对接结果的依据。自从AutoDock3.0版本以后，对能量的优化采用拉马克遗传算法(LGA)，LGA将遗传算法与局部搜索方法相结合，以遗传算法迅速搜索势能面，用局部搜索方法对势能面进行精细的优化。

| FlexX

FlexX是德国国家信息技术研究中心生物信息学算法和科学计算研究室开发的分子对接程序，目前已经作为分子设计软件包BioSolveIT LeadIT的一个模块实现商业化。FlexX使用碎片生长的方法寻找最佳构像，根据对接自由能的数值选择最佳构像。FlexX程序对接速度快效率高，可以用于小分子数据库的虚拟筛选。

分子对接重要软件：

| Discovery Studio

Discovery Studio™ (简称DS), 是Accelrys公司开发的商业软件，主要基于Windows/Linux系统和个人电脑、面向生命科学领域的新一代分子建模和模拟环境。它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家，应用于蛋白质结构功能研究，以及药物发现。为科学家提供易用的蛋白质模拟、优化和药物设计工具。通过高质量的图形、多年验证的技术以及集成的环境，DS将实验数据的保存、管理与专业水准的建模、模拟工具集成在一起，为研究队伍的合作与信息共享提供平台。

| sybyl

Sybyl是Tripos公司专门为药物小分子与生物大分子科学领域研究者所设计的分子模拟商业软体。模拟的内容包括了药物小分子的建模、构象分析、三维定量构效关係研究、药效团建模、虚拟筛选、生物大分子的同源模建、活性位点分析、数据库搜索等。

随着基因技术、蛋白质化学、蛋白质纯化与鉴定技术的快速发展，近年来，蛋白质三维结构的数量正在不断的增加，大量成药与潜在成药靶标蛋白已被破解。相比之下，新药研发的速度却依旧落后。最近几年，计算机辅助药物设计中的虚拟筛选方法，已经成为可靠，相对廉价的用于先导化合物发现的一种重要技术手段。

虚拟筛选(virtual screening，VS)是指基于药物设计理论，借助计算机的技术和专业应用软件，从大量化合物中挑选出一些有苗头的化合物，进行实验活性评价的一种方法，其目的是从几十个乃至百万个分子中筛选出新的先导化合物。

从原理上来讲，虚拟筛选可以分为两类，即基于受体（Receptor-based virtual screening）的虚拟筛选和基于配体(ligand-based virtual screening)的虚拟筛选。

基于受体的虚拟筛选也称为基于结构的虚拟筛选，利用分子对接技术，基于受体的三维结构，在结合位点处自动的匹配化合物数据库中的小分子，然后对可能的结合模式运用基于分子力场的打分函数进行结合能计算，最终得到化合物能量排名。

相对于基于配体的虚拟筛选，其优势是能避免活性化合物微小的结构变化所引起的活性改变，但也存在一些不足：

1）最大的问题就是打分函数的准确性及适用性，一般考虑到计算速度，通常采用比较简单的打分函数，但简单的打分函数不能很好的考虑到较弱的相互作用；

2）基于受体的虚拟筛选需要受体结构和指定结合位点，但许多重要的靶标都没有可用的受体结构；

3）而且分子对接存在需要解决的问题：分子的柔性、熔化剂效应、打分函数等。

| 2. 基于配体的虚拟筛选

基于配体的方法是依据结构决定性质原理，这类方法有：

1）药效团模型（pharmacophore modeling），是对一系列已知有活性的化合物进行药效团研究，通过构象分析、分子叠合等方法归纳得到对化合物活性起到关键作用的一些基团的信息；

2）定量构效关系(quantitative structure activity relationship ,QSAR)，是一种借助分子的理化性质参数或结构参数，以数学和统计学手段定量研究有机小分子和生物大分子相互作用，有机小分子在生物体内吸收、分布、代谢、排泄等生理相关性质的方法；

3）结构相似性方法（structual similarity, SSIM）是通过各种描述符或指纹进行相似性匹配，从而判断化合物是否具有类似活性或治病机理。

4）三维定量构效关系(3D quantitative structure activity relationship ,3D-QSAR)是引入了药物分子三维结构信息进行定量构效关系研究的方法，这种方法间接地反映了药物分子与大分子相互作用过程中两者之间的非键相互作用特征，相对于二维定量构效关系有更加明确的物理意义和更丰富的信息量，因而1980年代以来，三维定量构效关系逐渐取代了二维定量构效关系的地位，成为基于机理的合理药物设计的主要方法之一。

应用最广泛的三维定量构效关系方法是CoMFA和CoMSIA即比较分子场方法和比较分子相似性方法，除了上述两种方法，3D-QSAR还有DG 3D-QSAR、MSA、GERM等众多方法。

CoMFA&CoMSIA

CoMFA和CoMISA是应用最广泛的合理药物设计方法之一，这种方法认为，药物分子与受体间的相互作用取决于化合物周围分子场的差别，以定量化的分子场参数作为变量，对药物活性进行回归分析便可以反应药物与生物大分子之间的相互作用模式进而有选择地设计新药。比较分子场方法将具有相同结构母环的分子在空间中叠合，使其空间取向尽量一致，然后用一个探针粒子在分子周围的空间中游走，计算探针粒子与分子之间的相互作用，并记录下空间不同坐标中相互作用的能量值，从而获得分子场数据。

不同的探针粒子可以探测分子周围不同性质的分子场，甲烷分子作为探针可以探测立体场，水分子作为探针可以探测疏水场，氢离子作为探针可以探测静电场等等，一些成熟的比较分子场程序可以提供数十种探针粒子供用户选择。探针粒子探测得到的大量分子场信息作为自变量参与对分子生理活性数据的回归分析，由于分子场信息数据量很大，属于高维化学数据，因而在回归分析过程中必须采取数据降维措施，最常用的方式是偏最小二乘回归，此外主成分分析也用于数据的分析。

统计分析的结果可以图形化地输出在分子表面，用以提示研究者如何有选择地对先导化合物进行结构改造。除了直观的图形化结果，CoMFA还能获得回归方程，以定量描述分子场与活性的关系。

CoMSIA是对CoMFA方法的改进，他改变了探针粒子与药物分子相互作用能量的计算公式，从而获得更好的分子场参数。

除了比较分子场方法，三维定量构效关系还有距离几何学三位定量构效关系(DG 3D-QSAR)、分子形状分析(MSA)、虚拟受体等方法(FR)等距离几何学三维定量构效关系严格来讲是一种介于二维和三维之间的QSAR方法。

这种方法将药物分子划分为若干功能区块定义药物分子活性位点，计算低能构象时各个活性位点之间的距离，形成距离矩阵；同时定义受体分子的结合位点，获得结合位点的距离矩阵，通过活性位点和结合位点的匹配为每个分子生成结构参数，对生理活性数据进行统计分析。分子形状分析认为药物分子的药效构象是决定药物活性的关键，比较作用机理相同的药物分子的形状，以各分子间重叠体积等数据作为结构参数进行统计分析获得构效关系模型。虚拟受体方法是DG 3D-QSAR和CoMFA方法的延伸与发展，其基本思路是采用多种探针粒子在药物分子周围建立一个虚拟的受体环境，以此研究不同药物分子之间活性与结构的相关性。其原理较之CoMFA方法更加合理，是定量构效关系研究的热点之一。

作为分子对接的重要补充手段,基于配体的虚拟筛选具有速度快,通用性好（不受靶点结构限制）的优点。药物筛选过程涉及化合物资源库、虚拟筛选结果、实体筛选化合物的选取、实体筛选模型、实体筛选数据管理等。

实体筛选包括分子水平、细胞水平、动物水平等不同层次的筛选数据管理。筛选过后的大量数据如果管理不善，必定会制约中心药物筛选的发展，也不利于后期的审计核查及数据分析。然而目前市场上的筛选软件大多不具备数据管理这一项功能，难以满足需求。

| 3. 全新药物设计

全新药物设计(De novo drug design)，又称为从头设计，也可称为三维结构生成或从头构造法。是一种根据受体分子结合位点的几何形状和化学特征,直接借助计算机自动设计出与其形状和性质相匹配的全新结构分子的方法,与分子对接(docking)合称为直接药物设计方法,都属于基于结构的药物设计方法的范畴。

不同的是,分子对接采用的已有的数据库分子与靶酶分子进行相应得匹配和评价,在对接过程中分子的化学结构始终保持不变。而全新药物设计更注重于全新的概念,根据靶点活性位点的特征利用特定基本构建单元生成配体分子,因此所产生的配体分子可能是未知、全新结构。构造的新分子具有能与受体活性部位很好地契合,从而有望成为新的先导化合物。

| 4. ADMET预测

ADMET （药物的吸收, 分布, 代谢, 排泄和毒性）药物动力学方法是当代药物设计和药物筛选中十分重要的方法。药物早期ADMET性质研究主要以人源性或人源化组织功能性蛋白质为“药靶”，体外研究技术与计算机模拟等方法相结合，研究药物与体内生物物理和生物化学屏障因素间的相互作用。早期评价药物的ADME/T性质可有效解决种属差异的问题，显著地提高药物研发的成功率，降低药物的开发成本，减少药物毒性和副作用的发生，并能指导临床合理用药。

A: Absorption: 药物从作用部位进入体循环的过程

D: Distribution: 药物吸收后通过细胞膜屏障向各组织、器官或者体液进行转运的过程

M: metabolism(Biotransformation): 药物在体内受酶系统或者肠道菌丛的作用下而发生结构转化的过程

E: Excretion: 药物以原型或者代谢产物的形式排出体外的过程

T: Toxicity: 药物对机体的毒性

四、人工智能与计算机辅助药物发现的挑战（注：本部分内容主要来源于Chem. Rev.原文）

人工智能在药物发现领域也面临了很多挑战，有些原因会导致数据质量不高，数量也不多。一方面，数据点标记的可信度很大程度上取决于实验条件，这是因为药物作用的生物系统极其复杂。不同的实验条件通常会产生不同甚至相反的结果。另一方面，我们在药物发现领域获得的数据量太少。

因此，在人工智能药物发现领域，不仅需要一场方法学革命，还需要一场数据革命，既要考虑数据的数量，又要考虑数据的质量。设想一下，如果我们有一百万个与晶体结构相结合的高质量K_d值，这或许才可以解决使用人工智能进行分子对接和评分误差的问题。然而，如何在所需的质量级上获得所需的数据仍然是一个悬而未决的问题。

显然，目前需要更好的数据共享方式，但人们没有看到这一点的好处，因为开放式数据共享在医药科学中并不常见，尽管一些大型制药公司如Pistoia联盟等曾经倡议过医药公司数据需要共享，也受到了一些欢迎支持。但目前，仍然很少有公司愿意与他人分享他们的实验数据，即使是负面的结果或废弃项目也不愿意拿出来分享。

数据质量是另一大问题，迄今为止，从技术角度来看，它已被证明具有挑战性的难题。解决这一难题的一种方法是开发能够处理相对异构或稀疏数据集的算法，目前斯坦福大学的研究人员提出过一些典型算法，他们将一种计算机视觉算法“单步学习”应用于药物发现，从而产生了一种基于稀疏数据预测药物性质的算法。同样，由施耐德集团开发的转移学习模型已被证明能够处理稀疏数据。

另一个重大挑战是提高分子表征的实用性和灵活性，以规避著名的“垃圾进，垃圾出”原则问题。最新开发的人工智能算法自动从“raw”输入表征，允许将内部分子表征重新定义为任意标准。随着处理更复杂性质的计算在合理的时间内变得可行，在分子尺度上，它们在模型构建中可能变得越来越重要。同时有必要考虑立体化学结构、构象的柔韧性、表面形状等。随着时间和资本的大量投入以及伴随着技术的进步，上述挑战在不久的将来可能会克服。

人工智能在药物再利用方面的机会尤其丰富。面对原始化学创新药物研发失败的高成本和高风险，开发对现有药物的新适应症是规避高风险的一种手段，这个迄今为止一直被忽视。传统上，药物的再利用依赖于由临床观察驱动的经验方法。目前，大量的科学文献、专利、临床试验结果和上市后授权数据可供学术和工业化学信息学家利用。将所有这些独立的数据流重新梳理，归纳，文本化，将是医药学家的一笔巨大资源财富。

下一个有希望的子领域是通过“深度学习”驱动虚拟筛选。现有的计算高通量方法与实验方法的问题是相同的，即假阳性率高。“深度学习”将能够充分利用来自受体、配体及其已知相互作用的信息，克服假阳性问题。

五、人工智能与计算机辅助药物发现总结（注：本部分内容主要来源于Chem. Rev.原文）

总结：人工智能在药物发现的多个阶段表现出巨大潜力。当然，它也不是万能的，也面临了一些挑战和问题。尽管如此，人工智能毫无疑问大大促进了创新药物的研发进程。

近日，四川大学杨胜勇课题组和瑞士苏黎世联邦理工学院Gisbert Schneider课题组在Chemical Reviews全面介绍了人工智能算法及其在药物化学中的应用。在介绍了算法的基本原理后，该综述进一步讨论了人工智能算法在基于结构和配体的虚拟筛选、从头药物设计、物化和药代动力学性质预测、老药新用及相关方面的应用。最后，作者总结了当前方法的一些挑战和局限性，以期为AI辅助药物发现和设计提供未来潜在的方向。

原文地址：

https://pubs.acs.org/doi/10.1021/acs.chemrev.8b00728

参考文献：

1. Xin Yang, Yifei Wang, Ryan Byrne, Gisbert Schneider, Shengyong Yang. Concepts of Artiﬁcial Intelligence for Computer-Assisted Drug Discovery. Chem. Rev., 2019

✔杨胜勇教授简介

杨胜勇，教授，博士生导师（图片来源于四川大学官网）

【个人简历】

教育部“长江学者奖励计划”特聘教授、国家杰出青年基金获得者、百千万人才工程国家级人选、教育部“创新团队发展计划”团队带头人。

1999年毕业于四川大学化学学院，获物理化学专业博士学位。1999年-2001年，香港科技大学化学系博士后。2002年12月-2005年10月，加拿大Calgary大学Research Scientist。2005年10月至今，四川大学华西医院生物治疗国家重点实验室工作。主要从事计算机辅助药物分子设计方法与应用，以及针对重大疾病的小分子靶向药物研究。至今已在本领域顶级或重要刊物发表SCI论文200余篇。申请专利70余项，获授权专利30余项，包括12项国际专利。研发的6个候选新药已转让到国内大型制药公司，其中两个已进入临床试验。担任Signal Transduction and Targeted Therapy期刊常务副主编及多个国际期刊的编委。以第一完成人获国家自然科学二等奖（2018）、教育部自然科学一等奖（2015）、药明康德生命化学研究学者奖（2012）等。

• 重磅：中国学者揭示武汉新型冠状病毒的进化来源	• JMC：四川省医学科学院师健友、四川大学李锐等
• JMC：上海复旦大学邵黎明、李炜，上海药物研究	• Nature 子刊：华人科学家金坚教授发现一种强效
• JMC：上海科技大学姜标、阴倩倩、杨小宝发现强	• JMC：中山大学尹胜组发现一类吉马烷倍半萜型抗
• JMC：上海药物所熊兵、缪泽鸿、王迎庆等发现一	• Cell子刊: 基于超分子纳米阀门的刺激反应药物传
• JMC: 百济神州王志伟博士等发现一种高效、高选	• Biomaterials：首都师范大学周晶课题组利用DNA

重磅：中国学者揭示武	JMC：四川省医学科学
JMC：上海复旦大学邵	Nature 子刊：华人科

网站首页

批发市场

商城

成果转化

企业管理

药学帮

人工智能与计算机辅助药物发现