Bioassay Express:发现测定(和他们一起做东西)

2016年10月4日

CDD.’S Bioassay Express软件允许您将人类可读的生物大作曲转换为机器可读,标记为上文。该技术已在3500多次进行测试“best of Pubchem”MLPCN测定。广泛共享的新洞察和模式“probe”化合物进一步验证该方法的效用。与常见的测定模板,我们’ve试图对影响生物测量的最重要参数进行良好的主观呼叫,同时保持最少数量的类别。但是,值得强调的是,底层技术可以与任何模板,术语和本体(即你的人)一起使用。我们’ve决定将这种新技术集中在生物测定上。与我们抛光的专业CDD金库平台相比,Bioassay Express仍然是一个相对较新的技术,但显然它确实有效。请发送电子邮件至弗兰克科尔([电子邮件 protected]) 如果你’d喜欢尝试使用自己的协议(在线后,在Bioassay Express,或潜在地与CDD Vault集成)使用此技术。


由Alex Clark和Barry Bunin;从最初出现的帖子中取出 化学信息学2.0

Bioassay Express:发现测定(和他们一起做东西)

生物测定表达 项目一直以实心的速度向前移动:为定位测定和检查它们,添加或改善了几个重要的新功能,并以表现出一些复杂的分析和模型建设。这是我们拥有的事实的动机 策划了很少的测定 (〜3,500)这是一个足够的理由,开始真正努力弄清楚我们实际的东西 通过这种高质量的专业注释数据。

作为任何没有关注展开故事的人的简要回顾,这生物测定表达 项目是使用纯文本来描述用于评估小分子的生物测定协议,如果你很幸运;以数字化文档格式,如果您甚至幸运。对于机器算法而言,这没有任何东西,为此目的 生物测定本体论 (BAO)发明,以方便使用语义网络术语,使这些实验与开放联系数据的世界兼容。实现这种词汇的潜力一直很慢,这就是为什么我们发明了一个用于将我们的“语法”作为额外层的模式数据结构(使用我们的 常见的测定模板 最初,与其他人跟随)。这是通过注释页面实现和部署和可供选择,并以注释页面开头,该页面旨在使相关的语义注释挑选为 尽可能快速,无痛.

为了改进和调试注释过程,我们拉动存储在存储的生物测定协议的集合子集 Pubchem.鉴于可用的信息,可用本体的状态,以及我们对如何使用它们的理解,以及我们可以提供几千人。虽然我们在这些测定中有一点剩余的质量控制(可以方便地查看),但它已经把我们放在一个良好的位置:我们有一系列机器可读注释,超出任何公开的信息关于测定。所以下一步是利用每个测定的事实 Pubchem. 也与化合物和测量有关(如 早先描述)。通过配对结构,活动和分析协议细节,我们可以开始询问一些相当有趣的问题。

询问有关数据的问题是通过混合使用Qualies的易于使用有效方法来显示结果的问题来实现最佳选择,这最近是优先级。目前有两种主要方法可以通过从一个愿望发现的概念开始来寻找分析: 搜索 and探索。这 搜索 页面提供了一种搜索与给定约束类似的测定方法的方法,并且可以以类似于执行分子结构的相似性搜索的方式使用。这 浏览 另一方面,页面更具交互式,并且允许用户定义一系列层,每个层缩小数据库,以交互方式显示结果。

在下面的示例中,为单个标准定义为 目标 分配类别包括与嵌套下的任何术语注释的所有测定 GPCR. hierarchy:

bae_find01.

bae_find02.

随着术语切换或关闭,符合条件测定列表在下面更新:

bae_find03.

此功能已有一段时间,但最近已经进行了几种修改。其中一个是额外的柱,其显示了许多化合物与每个测定相关的化合物,这是一种相当重要的细节,因为源含量倾向于包括大量高通量的主要测定,并且很多低量的吞吐量二次测定各种。这些经常适用于相当不同的研究,并且使用此界面通常可以使用适当的注释字段(测定竞选阶段),但单击左侧的复选框也可以明确地选择它们。

在符合条件测定列表下面是最尤为常用的可视化功能 - 属性网格:

bae_find04.

您可能需要点击映像并缩放一点,因为有很多信息填充到网格中。

此显示的目的是展示 什么 实际上是在结果集中选择的。与文本第一行描述的测定列表都很好,很好,但对于许多目的,必须了解实际的概述 术语 存储在每个结果中。因此,该网格将该试验结果作为列,作为列,它使用所有术语的层次结构(限于至少在至少一个结果中出现的那些,否则它会太大)。如果使用该术语,每个单元都具有全尺寸的蓝色方形 明确或者如果这个术语是一个狭窄的矩形是那个是一个狭窄的矩形。

如果一个人认为每个术语作为离散断言,那么这个视图就基本上显示了 测定指纹 对于每个结果。思考这些术语作为指纹的想法非常类似于基于结构的指纹,这是化学信息学的核心概念,其能够实现大量功能(搜索,相似度排名,聚类,贝叶斯模型,名称,但是几个)。我们已经展示了一种用于注释的指纹用途( 搜索 功能),并通过调查使用此内容作为输入构建模型的方法跟进。例如,通过混合测定来创建贝叶斯模型&结构指纹以预测活动,以及寻找预测/防预测的模式;或释放最新时尚 深度学习 试图最大限度地提高这些模型的准确性的技术。

为了促进一些更初步的探索,还有一个额外的切换,其目的不是完全不言而喻的, 询问:

bae_find05.

激活它显示了用于选择测定列表(作为查询适当的术语的术语的线符号查询,或者通过ID号的列表来实现相同的效果,这被更新为反映哪些测定方法检查)。这目前与API(目录未记录)组合,其允许以可以馈送到异国情调的建模工具的形式中远程拖出数据库的分析+化合物。

也可以通过压制来观察与所选测定相关的实际化合物 显示化合物 button:

bae_find06.

此工作流程已描述 最近贴文:它是一种有效的方法,用于查找和加入SAR数据进行感兴趣的测定,使其容易将整个东西下载为SDFILE以进行跟踪使用。

底线是,用于浏览,选择和获取我们已经策划的测定的数据的工具+沉积的分子和活性测量造成并变形并变得非常强大。我们正在积极使用这些,用于我们自己的探索,实验和合作,但它们也适用于那些有兴趣利用工具和数据的人。要了解更多,请随时致力于弗兰克科尔探索未来的可能性([电子邮件 protected])。