Bioassay Express(BAE),结构化非结构化协议数据的新工具:使用分析信息的情况

2017年8月1日

1. 소개

药物发现生物学分析方案以各种科学英语方式记录,解释了这些实验的生物学意义。因此,传统上,通过计算和“大数据”技术来提取唯一值,不能直接提取此信息。 生物测定表达(BAE) 该平台提供了两个主要的工具集,如专利的半自动标记工具和新分析和可视化工具。

以下是专利的半自动标记工具 下面描述的具体益处 新分析和可视化工具 主要用例。

2.1)元数据分析,

2.2)分析的改进,

2.3)促进合作。

2.按地区使用案例

2.1。用元数据分析圣经:激活数据挖掘

目的

  • 基于分析协议描述,标准,语义系统/计算机可读术语元数据编码
  • 标记,保护和组织对于坐在今天的科学信息的财产有用
  • 准备随后的科学分析,协作,商业收入创造活动。

好处

  • 组织的计算机分析从目前不可用的数十年的数据解锁数十年
  • 每个分析文件都是曾经的 - 永远从中获得价值

价值对比度

  • 1-2分支项目

2.1.1。历史('Heritage')分析迁移和策划

在Curlew Research的营销访谈中,大多数公司都解释了捕获对散文积压的生物降解的受控术语难以捕获,并解释了正在注册的新的或修改的断言。在某些情况下,遗留分析库超过了20,000个协议。以下是Cullo Research采访的前十名限制中的高级信息的引用。

  • “如果解释没有很好的捕获,世界上的生物血清就会消失”
  • “您可以使用更好的分析,因此您可以自信地重用数据并需要再次进行测试。”

CDD是独特的,专利的生物测定表达技术和战斗验证的服务(强大的POC,符合3500“Pubchem MLPCN分析的唯一公开字体数据资源。BAE估计 [电子邮件 protected] 문의하십시오.

2.1.2。新分析注册

九家大型制药公司采访的十九家大型制药公司,营销公司在2017年初营销公司,使用元数据利用元数据,包括在内部考试活动中的编码,包括在控制术语方面包括编码,我已经证实了迫切需要升级,但很难确定如何有效地执行此任务。同样,这里是来自大型限制的最高信息学者的报价(当然,匿名),这强调了在没有生物测定技术的帮助下显示该数据的疼痛的严重程度。

  • “如果科学家们不遵守,他们并没有威胁要发射,并注册他们的散文。”
  • “如果我们尝试了解我们正在运行的更复杂的散文,您需要更多元数据。”
  • “一致的分析元数据将不可分散,无法平行统一福利和价值观。”

2.1.3。转换为文本添加了受众(BAE 2.0计划)

“BAE 2.0”的LoadMaps,包括将模板扩展到摘要信息中的详细步骤,包括此“文本AnaTest Sease”功能开发。目标是将方法部分作为标准化表单(例如,科学出版物,在线数据存款的编码描述符或分析项目工作流程模式)。

2.2。改进分析

好处

  • 提高了新问题的机会,并执行以前没有的查询
  • Silico模型 改进 SAR活动时间和资源储蓄
  • 指定热标志,一个潜在的实验伪影(AKA'频繁),节省时间和资源。
  • 轻松检测和查找类似的分析结果,以防止不必要的分析冗余并促进重现性。

2.2.1。确保可以轻松发现所有散文

简而言之,添加到语义系统终端的分析协议允许组织的所有成员访问,使用和学习已经积累的巨大的机构知识。

2.2.2。更好的SAR模型建设

当组织使用BAE哭泣工具生成井分析集时,BAE分析和可视化工具可以使用新方法分析结构活动关系(SAR)。要搜索受众,请指定一组注释并通过减少相似性序列来搜索排名的受众列表。

本体类似性搜索模式

人们可以钻取详细信息,并通过网格(参见正确的示例)对X轴和分析属性(上尉术语)的网格(参见正确的示例)来钻取相关分析。再次,大型药物捕获中的许多人的高级科学家带来了这个重要原因:

  • “更好的决定是最多的信息。有关分析的更多信息,有关决定更多信息的信息越多。”
  • “您可以使用更多数据进行分析来执行其他问题。”

2.2.3。频繁类型分析

最近ACS编辑(ACS) 외. 乙酸盐化合物的祖先和痛苦。 ACS中央科学 2017. 3:143) 高级(80-100%)强调。初始筛选击中实验伪影。它是一个组织的担忧,即在药物发现过程中尽快确定这个工件(或“频繁的击球”),而不是在截止日期上消耗有价值的资源。 Astrazeneca发布的研究(哥们 外部。 使用生物测定本体分析高吞吐量筛选数据。 J Bio Mall屏幕 2015. 20:402) 分析添加到生物测定本体论(BAO)术语中,并证明了检测这些遗物的好处。

您可以使用BAE分析工具通过多种方法快速识别频繁类型的类型。如果延迟识别每月的频繁类型,那么这些伪像中的重要资源,而且还没有集中在最大潜力的化合物上。关于潜在节省效应的保守估计是每月储存的每月1FE的早期检测时间和谐。

2.2.4。减少冗余并提高再现性。

很多时候我们听到了“除非我这样做,除非我往往更容易重复分析,而不是在我们的数据库中找到它。拜耳报告称,只有25%的出版的临床前研究可以核实,并且公布的研究成果与公司自身结果之间的差异(prinz)之间的差异 等等。 相信:我们如何依赖于潜在药物目标发布的数据? 自然牧师药盘 2011. 10:712). Menzen报道称,科学的事实表彰可以在53个地标研究的11%确认(Begley&Ellis, 医学发展:提高临床前癌症研究的标准。 自然2012。 483:531). 최근 보고 된 복제 노력(Elife 2017; 6:E23693,在劳拉和约翰阿诺德基金会的五个癌症生物学研究(资金为2米补贴)的成立),发现2个复制,一个复制不能解释。临床前研究的未知程度是很兴趣。

改善重现性的好处是:

  1. 指定密切相关的散文之间的差异标志
  2. 协议之间的差异和差异结果的差异
  3. 改善在其他实验室中进行的实验再现性
  4. 确定分歧的根本原因

2.3。促进合作

好处

  • 两个不同的代理商的数据集(例如,内部CRO或M&只需将其他公司结合在(a)中。
  • 您可以公开携带注释数据并与个人内容进行混合。

2.3.1。外部比较

在新药物发现管道早期阶段中更加外包管道的趋势提供了与内部生成数据集成和比较这些外部数据的新挑战。十大制药高级化工园林市场研究公司表示,“现在我们最大的挑战之一,我们最大的挑战之一是内部和外部分析之间的差距。

通过BAE,研究人员可以智能有效地检索所有额外的分析。

2.3.2。合作,公共/私人研究分析

在早期药物发现中,尤其是患者(例如,结核联盟,疟疾联盟,疟疾企业(MMV),CARB-X)正在增加公私伙伴关系。这些合作需要最佳实践,这些实践在站点,国家和地区之间共享数据和资源,以增强发现和减少重复。

CDD Vault,CDD的核心产品已被用于管理这些全球联盟中的筛选数据,因此CDD被积极鼓励使用BAE采用分析捐赠。 Pubchem和Chembl等公共存储库也有兴趣使用CDD来扩展存放分析的语义记录,因此有明显的势头建筑。初始BAE采用者不仅可以将这些披露或协作数据集成到分析中,而且在这个新的“分析信息”中也发挥着主导作用。

2.3.3。合并(M.&A)

所有约束m&众所周知的挑战之一是将小规模公司的分析数据集成到更大(或等效规模)数据管理系统中。尽管有密集折旧分析数据的价值和可靠性(因此证明数百万美元的投资),但这些努力不会评估这些数据来隔离并影响整合的可行性或物流。这两家公司的科学家通常需要查找,阅读,读取和评估分析协议,并与信息学校合作以使用上下文实际理解数据。

相反,如果制药公司使用BAE进行内部分析,则建立清晰的过程以捕获重要的分析元数据。当合并/参数立即分配评论,进口化合物,阅读和注释时,您可以使用BAE使用BAE。在遗留散文的情况下,CDD可以通过提供单一策策服务来帮助您加速此过程。

我不仅可以使用bae来整合获得的数据资产,但它也可以节省组织时间,而且(工作可以在几天内完成,不在几年内几个月内)。您可以提高药物发现的价值资产。


此博客创建CDD Vault社区的成员。 CDD Vault主持全部个人和外部生物和化学数据安全管理 药物发现信息 平台。 化学登记, 结构活动,化学物质 库存, 电子包装笔记本 기능 등 핵심 기능을 제공한다.

CDD保险箱:新约束发现信息学整个项目团队将容纳。