CDD创新:注释生物测定的新工具

2014年9月2日

CDD的信息学研究翼今年夏天一直很忙。在与...合作 生物测定本体项目 在迈阿密大学,由A资助 NIH SBIR阶段我授予,CDD已原型设计了一种用于注释生物测定数据的新工具。本文完全描述了我们的方法,刚刚在Peerj发布: 利用机器学习的混合动力和用户确认快速准确地对生物测量的语义注释.

麦克风

为什么注释重要? 完全和准确注释的数据启用要执行的“智能”搜索。可以针对复杂的想法查询注释数据而不是简单的文本搜索。例如,可以执行搜索以发现激活患有糖尿病患者的激活的化合物,这些化合物也已在通过荧光素酶的筛网鉴定的细胞生长测定或抑制剂中测试。这种创新搜索是一个关键的研究领域 吟游诗人项目.

为什么我们需要一个用于注释数据的工具?  注释生物测定数据井是一个费力的过程。每个生物测定都有几十到数百个关键信息,理想地通过注释捕获。这些概念包括以有组织的方式填充该数据的目标,仪器,物种,控制等可能需要数小时,这是繁忙的科学家的大量障碍。

CDD的Annotator工具如何帮助?  科学家们将对工具进行生物测定的描述,该工具使用自然语言处理/机器学习方法来建议注释。科学家批准了点击措施的每个注释,并可以搜索或手动选择算法查找遇到问题的注释。虽然完全自动化可能是理想的,但这种具有人体反馈的混合方法确保注释是准确的。在此工具的测试中,研究人员能够在几分钟内注释复杂的数据。

算我一个!此工具何时可用? 我们期待建设快速准确的注释 CDD保险库 为了帮助研究人员最好利用自己的私人数据以及我的公共数据数据。与此同时,我们很乐意与您合作,帮助您尽快给予您的数据。感兴趣的? 联系我们。  更多的数据注释对每个人都有好处!


此博客由CDD Vault社区成员创作。 CDD Vault是一个托管的 药物发现信息学 安全地管理私人和外部生物和化学数据的平台。它提供核心功能,包括 化学注册, 结构活动关系, 化学库存 , 和 电子实验室笔记本 capabilities!

CDD保险库 :药物发现信息学您的整个项目团队将拥抱!