▎药明康德内容团队编辑
今日,艾伦人工智能研究所(Allen Institute for AI),陈·扎克伯格倡议(Chan Zuckerburg Initiative,CZI),乔治城大学(Georgetown University)安全与新兴技术中心,微软公司,和美国国立医学图书馆(National Library of Medicine,NLM)联合宣布,推出COVID-19开放研究数据集。这一数据集包括对COVID-19,新冠病毒,以及冠状病毒研究的超过29000篇研究文献。它的独特之处在于能够被机器阅读。新闻稿指出,这是目前最为全面的可供机器阅读的冠状病毒文献收藏之一。
同时,美国白宫与这些组织一起,呼吁人工智能专家们和科技界人士开发创新文字和数据挖掘技术,帮助科学界回答与COVID-19相关的优先科学问题。
COVID-19开放研究数据集(COVID-19 Open Research Dataset,CORD-19)是微软公司,NLM,CZI,和艾伦人工智能研究所之间独特合作的结晶。CZI提供发表前的研究内容,NLM提供已发表的研究文献,微软公司提供梳理文献的工具,而艾伦人工智能研究所则将这些内容转化为可供机器阅读的形式。
这一数据集可以从艾伦研究所的Semantic Scholar网站下载(点击文末“阅读全文/Read more”即可访问这一网站)。它将每周更新,包含经同行评议的研究,以及在预印本网站(例如bioRxiv,medRxiv等)上发表的研究。
科技界人士可以通过Kaggle平台递交他们开发的文字和数据挖掘工具,以及从中获得的洞见。通过Kaggle平台,这些工具将被世界各地的研究人员开放使用。
图片来源:Pixabay
为了指导研究人员的工作方向,Kaggle平台启动了COVID-19开放研究数据集挑战赛,针对10个与COVID-19相关的科学问题向人工智能专家们和数据科学家们发出挑战。
“对研究人员来说,人工查询超过20000篇文献来获取洞见非常困难。近年来的科技进展能够在这方面提供帮助。我们希望人工智能能够被用于发现与COVID-19相关的关键性问题的答案。”Kaggle联合创始人兼首席执行官Anthony Goldbloom先生说。
参考资料:
[1] Call to Action to the Tech Community on New Machine Readable COVID-19 Dataset. Retrieved March 16,2020,from https://www.whitehouse.gov/briefings-statements/call-action-tech-community-new-machine-readable-covid-19-dataset/
[2] COVID-19 Open Research Dataset (CORD-19). Retrieved March 16,from https://pages.semanticscholar.org/coronavirus-research
注:本文旨在介绍医药健康研究进展,不是治疗方案推荐。如需获得治疗方案指导,请前往正规医院就诊。
版权说明:本文来自药明康德内容团队,欢迎个人转发至朋友圈,谢绝媒体或机构未经授权以任何形式转载至其他平台。转载授权请在「药明康德」微信公众号回复“转载”,获取转载须知。