带来Die Zukunft Von Open-Source-DatenFürDie MedikamentenentWicklung吗?

 CDD Vault见解 -logo
2018年11月12日
Die Zukunft Von开源数据&药物发现。合作药物发现(CDD),eln

开源数据的未来& Drug Discovery

基于讨论 阿什利法利 , 来自 比尔和梅琳达盖茨基金会开放式访问集团, 安德鲁湖 来自Embl-Ebi,[Chembl]的提供者, Evan Bolton. 来自 NIH的MCBI / NLM ,Pubchem的提供者,以及CDD的弗兰克科尔。

这是我们的2部分系列在开源数据中的第2部分及其对药物发现的影响。读第1部分, 为什么公开的数据很重要,如何使用它? to learn more.

广阔的开源数据是药物发现中相对较新的发展。

近几十年来已经看到了数据增加和转变研究人员寻求信息的方式。但是,这也为开发合作方法带来了新的挑战。

研究发表于此 计算机辅助分子设计杂志CHINESE 讨论将来的主要挑战是如何成为数据库和软件方法如何处理大量数据,因为它累积了高吞吐量筛选,并使用户能够绘制洞察力,启用预测和向前移动项目。

当存在如此多的数据时,突出了一个大问题,如何访问数据,并为可以从中受益的研究人员提供。

如果您在Pubchem存在之前审查,只有几个不同的资源开放和可用。

有这本书 国家癌症研究所分布式治疗计划,大约四分之一的化学结构。

在2004年之前,这个NCI数据库就是你真正可用的。

因此是什么 Maybridge系列 ,有大约80,000种化学品待售。

否则,你会订阅 可用的化学目录或者一些其他类型的付费服务,了解围绕有什么化学品,可供您购买购买。

现在,快进。

我们到了。

有大约1亿个独特的小分子可用。

您有很大的项目 - 大数据类型项目 - 您可以在其中购买几乎任何可能合成的分子。

有大型虚拟化学图书馆,你只需要询问化学品,有人会为你制作。它与过去如此不同,因此呈现出独特的挑战和潜在的好处。

据研究发表了 CheminFormatics杂志,开放数据的最重要和最直接的福利者之一将是化学算法,能够吸收大量数据,并使用它在不可通过传统出版物方法无法实现的规模上向工作化学家提供简明的见解。

然而,使这一目标实际上可以实现各种科学家将数据转化为数字形式的方式的范式转变,因为大多数当代数据输入方法都设计用于呈现人类,而不是通过机器学习算法消耗。

科学家有更多的可供选择,研究可以更快地移动。

但是,这个开源数据的未来看起来像什么?

这些公共数据存储库的社会的长期价值是什么?

我们如何使未来的开源数据更好,甚至比今天更好?

在这里,我们探索有关开源数据的未来的3个兴趣领域以及我们今天需要做些什么来确保开源数据的未来......

  • "1&quot listensymbolfürcdd拱顶elnblogbeiträge

    确保开源数据的长期值需要什么?

    它未知如何在将来访问或有用的信息。

    所以,我们如何准备确保长期 开源数据的值?或者,我们如何从今天获得的开源数据中获得最大值?

    好吧,首先有数据科学。

    数据科学需要大量信息,以便它工作,因此需要越来越多的信息可用于收集和分发此信息内容。

    还需要提供高质量的信息,这突出了策策的需求。

    内容可以基于科学策划,或作为时间的函数来策划。例如,如果您想到在20世纪80年代恢复的实验,您是否相信该实验或今天会重新运行它?

    科学不断发展,因此提供了高质量的信息,将有助于确保开源数据的价值良好进入未来。

    仍然需要充分实现的开源数据的主要价值是可能拥有之前发生的所有内容的可能性,因此它可以以比以往更快的速率更快地燃料的发现。

    这将是非常非常有帮助的 - 但是,我们需要适当的元数据。

    我们需要该过程的高质量信息。

    我们需要赋予这种发生的酶活,我们需要将其全部拉到一起。

  • "2&quot listensymbolfürcdd拱顶eln-blogbeiträge

    什么是即将到来的更改会改善数据使用情况?

    Chembl的 现在几个月的主要项目是完全的 新设计的Web界面对用户更好.

    随着接口重新设计,有许多后面的场景更改与数据设置的方式相关。

    然后,更广泛地看,有关于可以纳入ChemBl中的不同类型的数据有问题。

    例如,最近的探索正在寻找可以提取专利的生物活性数据,并将其添加到ChemBL数据库中。

    此外,由于实验平台改变了数据的类型和生成数据的规模,所存储的方式和发现的方式也会发生变化。

    然后,所有这些都会导致这些数据进入数据库中的新方法,包括AI和机器学习的应用。

    如果您想到了在Web技术周围的数据科学发生的动态景观,那么它真的是一个非常非常有趣的时间,接下来的3 - 5年将更有趣。

    在Pubchem,有一千成千上万,数十万的文学链接到一个化学物质。弄清楚如何最能概述这种大量信息,是Pubchem未来变化的重点。

    在Pubchem实施的一个近期变革来解决这是为了介绍一个 视图调用 共同发生 ,你可以找到其他化学品 通常相对于这种其他化学物质提及。

    还可以将疾病视为化学(治疗或造成)相关的疾病,以给您一些与化学相关的疾病类型。并且,类似的共同发生视图也可用于基因和蛋白质。

    这里的想法是,研究人员可以提出关于给定疾病的问题,并找出相对于Pubchem所了解的信息的信息类型。

    然后,该人将能够研究相对于这种疾病的生物活跃,与这种疾病相关的其他基因和目标,这些疾病可能治疗这种疾病或可能导致这种疾病的化学品,以及将此信息的所有文章提高。

    这个想法是将所有可用数据的织物和生态系统一起缝合在一起。

    当您开始考虑化学家,生物学家,药物发现科学家,药理学家,毒理学家和环境科学家都关心的生态系统时,下一步是将其包装在一起,然后他们可以访问和下载。

    在未来,将更多地远离分析型工具,并将更多信息转移到数据视图和符合用户希望或试图找出的预先计算的预算信息,因为它的内容太多了对于一个人来说,这不再弄清楚这一点。而且,使用数据科学类型方法可以让交互式用户更明显。

    未来看起来很积极。随着更多信息变得可用,并且提供更多元数据,每个人都赢了。这些和其他更改将允许研究人员访问该内容并使用它做更多。

    只要研究人员可以找到所需要的东西,我们都赢得了,因为我们更快,更好,更快地制作更多的发现。

  • "3&quot listensymbolfürcdd拱顶eln-blogbeiträge

    开源数据将如何使未来的药物发现比今天更好?

    一个人的开发,真正使关键差异是一种更具无缝方式,其中可以通过开放资源来可见数据。

    创建这些资源是非常耗时的过程,它将从许多领域努力,但这不是一个不可逾越的问题。

    它是一种作为技术人员的文化问题,因此预测它是可实现的,这肯定是可行的。

    另一个奇妙的发展将是一个可以告诉您的计划,每个新的文章都出现, 什么信息是新的,哪些信息旧.

    这将允许您能够确定您是否支持较旧的信息,或者您是否在某种程度上与旧信息相冲突。

    它将允许研究人员获得更好的科学状态,了解科学家在哪里同意以及他们不同意的地方。

    然后,下一步可以是一台计算机,该计算机将开始告诉您在可用数据中解决某些类型的冲突所需的实验类型。

    想象一下,如果一个AI程序可以说,“嘿,有人需要运行这个实验,因为数据的差距。”

    填补这些知识差距将使能够提前计划,并开始做出更加明智的实验,以更快地实现进展。

  • 概括

    由于技术进步和科学家能够以更快且更快的速率产生越来越多的数据,因此该数据的可访问性变得至关重要。关于维持开源数据的未来所需的问题以及如何提高数据的可用性是关键。

迪亚尔博客Wird von Mitgliedern der CDD Vault社区Verfasst。 CDD Vault Ist Eine Gehostete 药物发现信息学 Plattform,Die Sowohl私人Als Auch externe Biologische und Chemische Daten Sicher Verwaltet。 Sie Bietet Kernfunktionen Wie Chemische Registrierung, Struktur-aktivitäts-beziehung, 化学库存 Elektronische Labornotizbuch-Funktionen.

Logo der Kollaborativen MedikamentenentWicklung(CDD)金库