CDD颁发的药物发现深度学习策略第1阶段Sbir批准

CDD新闻稿徽标

CDD颁发的药物发现深度学习策略第1阶段Sbir批准

Chlingame,加利福尼亚 - 2018年11月26日 - 合作药物发现,CDD Vault Web的药物发现信息平台提供商宣布,他们荣获来自NIH NCATS的竞争性同行评审阶段1 Sbir授予,标题为:“更好地预测候选药物和焦点的药理性质的新深度学习策略发现努力“。

Collaborative Discovery,Inc。我们将首先应用这种表示来构建更强大的计算模型,可以更准确地预测属性 - 例如生物活性,ADME / TOX和药代动力学 - 穿过分子结构的文库。

最终目标是利用这种表示来产生具有更好性质组合的新化合物。这两个能力都有助于科学家在许多治疗区域广泛地加速对新药的发现。

在建立模型以预测一系列分子的药理性质时,计算化学家通常首先选择他们认为是相关的化学特征。然后,它们组装分子描述符(或指纹)的载体,其表征这些特征以表示分子,并对矢量进行回归分析。

这种方法降低了尺寸复杂性并使模型进行了贸易,但也抛出了关于分子的重要结构信息 - 一种广泛认可的临界弱点。在〜30年的稳定增量改进之后,努力加工基于人类直觉的更好描述符,不太可能产生显着的进一步收益。

近年来,许多研究团体通过申请旨在解决这些限制 深度学习 (DL)技术,但这些努力在只有少数情况下只能提高计算化学模型的预测准确性,其中大量的测定数据可用于培训模型。

在其他领域,在巨大的训练集经常可用的情况下,相反,DL模型大大提升了现有技术(例如,图像分类,语音识别和语言翻译)。

我们的创新方法是将DL应用于将分子特征的更具集中的问题应用于化学上丰富的载体。我们将编码器耦合到互补解码器,创建AutoEncoder,然后通过要求它们尝试使解码器的输出与编码器相同的解码器的输出来联合培训两个神经网络。

以这种方式自动训练AutoEncoder不需要任何测定数据(难以在DL更喜欢的规模上获得),而是仅依赖于喂食IT分子结构(这方便地策划在数百万)。

化学富含的载体是我们在编码器和解码器之间楔入的窄层,以创建信息瓶颈,强迫它变得富有化学结构信息。

我们的方法是提取该化学富含载体,并将其作为常规分子描述符的替代品来改善任何类型的现有预测模型。

与分子描述符一样,化学富含的矢量将使现有的模型进行贸易,但不牺牲结构细节,并且可以执行一次计算强烈的训练,然后应用于不同的问题。 CDD的初步测试支持我们的假设,即在这些新颖的载体中保留的更丰富的结构信息将显着提高预测性回归模型的性能和易用性。

图1. AutoEncoder的示意性架构 - 包括编码器,化学富载体和解码器 - 表示阶段1的起点。

图1. AutoEncoder的示意性架构 - 包括编码器,化学富载体和解码器 - 表示阶段1的起点。

 

图2.利用图1中的面板中提取的预训练编码器的QSAR模型的概念。

图2.利用图1中的面板中提取的预训练编码器的QSAR模型的概念。

预测药理学相关特性的计算模型在学术实验室到大型制药公司的药物发现研究中发挥着普遍的作用。

现在可以用这种性质(例如LOGP)的性质建模,即该模型更换了执行测定的需要,但许多其他关键特性(例如溶解度,Adme,PK,Herg)仍然远离这一目标。

我们预计我们提出的化学丰富的矢量将显着推进除了传统描述符和指纹可以实现的最新状态。

改进的模型将使研究人员更有效地选择铅候选人系列,探索围绕导线的化学空间更有效地产生新型知识产权,降低通过药物发现管道推进化合物的失效率,并加速整个药物发现过程。这些益处将在大多数治疗区域广泛实现。

 

第1阶段的具体目标是:

  1. 重新实施上面概述的化学性AutomoDer策略,该策略具有接受分子图的自然表示作为输入的自然表示,并且与我们目前的架构基于微笑串进行了大量的性能,这遵循一个模糊的语法。
  2. 利用化学丰富的矢量,为一般兴趣的多样性药理特性开发〜4个预测模型,并比较我们模型的性能与最佳发表的基准。

关于这一补助金

小型企业创新研究(SBIR)是能够共享生物数据的计划的一部分。奖励号码#1R43TR002527-01来自国家中心推进翻译科学的奖励 NIH记者 支持这个项目。此内容完全是作者的责任,并不一定代表国家推进翻译科学中心或国家卫生研究院的官方意见。

关于合作药物发现,Inc。

CDD( www.collaborativedRug.com.)旗舰产品“CDDVault®”,用于管理化学登记,结构 - 活动关系(SAR)和安全规模合作。 CDDVault®是一个托管数据库解决方案,可靠管理和分享生物和化学数据。它让您直观地组织化学结构和生物学研究数据,并通过易于使用的Web界面与内部或外部合作伙伴合作。 CDD Vault中的可用模块包括活动&注册,可视化,库存和eln。

在我们的资源页面上可以在线在线找到超过60个出版物和CDD专利的完整列表 //www.selacapo.net/pages/resources.

 


媒体联系方式: Barry Bunin,Ph.D.,合作药物发现, [电子邮件  protected]