JMC: 温州医科大学郑素清团队采用机器学习和遗传算法对小分子红细胞溶血毒性成果进行了虚拟预测
导 读
2019年6月24日,温州医科大学药学院郑素清团队在Journal of Medicinal Chemistry上发表题为“In-silico Prediction of Hemolytic Toxicity on the Human Erythrocytes for Small Molecules by Machine-learning and Genetic Algorithm”的文章,课题组利用遗传算法(GA)和基于ML的模型,开发了第一个基于机器学习(ML)的模型来预测小分子的人体溶血毒性。基于分子指纹的人溶血毒性优化模型,得到了具有理想溶血/非溶血性能的“最佳虚拟指纹”(OVF),并最终开发了一个免费软件,供用户预测/优化具有ML和GA I的人溶血毒性。
-------------------------------------------------------------------------------------------------------------------------------
小分子的溶血毒性作为ADMET的重要研究对象,可引起红细胞膜的溶解和血红蛋白向血浆中的泄漏,从而产生各种副作用。因此,在药物开发的早期阶段评估小分子的溶血情况是非常重要的。然而,目前还没有一个预测小分子溶血毒性的计算模型。
近日,温州医科大学郑素清团队手工整理了在人体红细胞上实验评估的小分子溶血毒性数据集,利用遗传算法(GA)和基于ML的模型,开发了第一个基于机器学习(ML)的模型来预测小分子的人体溶血毒性。基于分子指纹的人溶血毒性优化模型,得到具有理想溶血/非溶血性能的“最佳虚拟指纹”(OVF),并最终实现了一个免费软件,供用户预测/优化具有ML和GA I的人溶血毒性。
“e-Hemolytic-Classification” 软件程序界面
(软件主要功能:(1)溶血/非溶血化合物的预测;(2)数据库筛选;(3)所管理的人类溶血毒性数据集的可视化和查询;(4)模型对给定的化合物的适用范围的自动检查。(5)三维视图中重要特征的可视化;(6)三维视图中指纹的计算和可视化;(7)基于用户内部数据集的模型定制;(8)遗传算法(GA)指导的溶血毒性优化;(9)最佳虚拟指纹(OVF))“从GA进化轨迹中提取;(10)化学数据库中OVF的复合映射)
在这项工作中,郑素清团队共整理了337个溶血性和424个非溶血性小分子的数据集,这些小分子都是在人体红细胞上进行实验测量的,并且是根据各种文献手工编制的。基于这一新数据集,郑素清团队采用k-近邻算法(KNN)、支持向量机(SVM)、随机森林(RF)、梯度推进机(GBM)和扩展连通指纹(ECFP)建立了小分子溶血毒性预测的分类模型,进一步部署到开发的程序“e-hemolyticpage 4 of 53 ACS Paragon Plus environment”中,方便了药物化学家或毒理学家使用。此外,郑素清团队还充分利用遗传算法(GA)和基于机器学习的模型来优化人体小分子的溶血毒性,得到具有理想溶血/非溶血特性的“最佳虚拟指纹图谱”(OVF),并在 “E溶血”中实现。
郑淑清,博士,温州医科大学药学院副研究员, 2009年毕业于上海有机所,获得博士士学位。2009年9月至2014年先后在美国威斯康星大学-麦迪逊分校药学院和纽约州立大学石溪分校从事博士后,研究方向主要是药物化学和有机化学 。2014年9月进入温州医科大学药学院工作,主要从事有机合成和药物化学方面的研究工作。以第一作者在JMC, OL, Tetrahdron等相关专业期刊上发表十余篇论文。
原文链接:
https://pubs.acs.org/doi/10.1021/acs.jmedchem.9b00853