设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

Nature将推出数据杂志开源期刊Scientific Data

2013-10-18 14:26| 发布者: joejoe0332| 查看: 2483| 评论: 0|原作者: 赵斌|来自: 科学网

摘要:   大多科研人员从参与科学研究开始,就在不断产生数据,但随之而来的问题是,许多研究人员在改换研究方向或者作为学生毕业后,大多数据也就消失了,即使 保留在实验室,也因为缺乏很好的数据管理规范而名存实亡, ...


    Nature-SD将与figshare和Dryad两个储存库合作,接受广泛的研究数据类型。figshare目前并非一个保存期刊数据的储存库, 只是一个让科研人员进行自由分享的平台。其理念是可发现(discoverable),可共享(shareable)和可引用(citable)。其中一 个特色是鼓励发布阴性数据(negative data)和图。这是非常有用的,一方面可避免其他研究者无谓地重复这些工作,另一方面这些数据可能在别人的研究中得到佐证,或者进行合理解释,也可能这 些阴性结果也被正式发表出来了,说不定还是非常有意义的重大源头发现呢。Dryad则是建立在开源DSpace软件上的一个数据储存库管理系统。其数据格 式灵活,同时也鼓励研究人员开发新的标准,通过管理确保文件和元数据的有效性。放在这个系统上的数据具有很强的可见性,数据内容可以通过人机接口进行索 引、搜索和检索。内容可以自由下载,在重用中也没有法律障碍。至少还有下面三个方面的特性,让Dryad已经为期刊投稿的工作奠定了基础:1)提供期刊选 择在同行评审期间的数据访问权限,数据与相应的出版物进行相互链接,也可在适当的时候链接到类似GenBank等专业数据存储库;2)为数据分配数字对象 标识(DOI),使得研究者在数据分享总获得专业信誉;(3)发表文章的数据是需要长期保存的,但是投稿者也许在之后的研究中发现数据处理中的问题要进行 更正,或者有新的数据需要添加到库中,如何同时更新和维护储存库中的数据文件呢?这显然不是简单地覆盖原始数据文件,因为那些数据集可能被其他文章链接, 因此更新数据应提供新版本的数据文件。过时的老版本数据之后转化为常见的文件格式,通过与“受控多备份资源保存”(CLOCKSS)的合作来保证对其内容 的访问是无限期的。目前,对DD稿件来说,整合的数据已经可以上传到figshare中,作者在提交稿件时,可将数据保存在这个存储库中。编辑和审稿人将 通过figshare网站安全地获得一定权限访问数据文件,当DD论文发表时,数据将被公开。



   与其他Nature子刊不同,Nature-SD不是一个发表新结论或假说分析的地方,编辑还会特别要求作者在文中删除所有超出DD要求之外的内容。无 疑,这将有助于DD出版能与研究类文章出版并行存在,DD只是研究类文章的补充。当然,作者也可发布还未在其他出版物中出现的数据集(称为独立DD),或 者发布在其他杂志已经出版的数据集,但需要进行更深入的描述。考虑到潜在的发表和版权冲突问题,现在出版社编辑已经同意,DD的优先出版,并不会影响作者 研究类论文的发表,但这些研究类文章应该超越对数据的描述性分析,并需要报道了更重要的科学发现。

  公开可用的科学数据分布在众多不同的存储库中,这使得我们在找一些相关数据中碰到了许多麻烦(也就是常说的“数据竖井”的问题)。DD将提供一个可搜 索的出版平台,研究人员可藉此在许多不同的数据存储库中找到高质量的数据集。DD的出版物将与自然出版集团期刊和外部出版商的相关研究出版物连结起来,让 科学家更容易在研究发现、丰富的数据描述和实际数据之间轻松驾驭探索的航船。已有的科学数据存储库在定义标准和促进数据共享中发挥着主导作用。对于许多数 据类型、模式生物、疾病,或者研究领域来说,都建立了自己的学术团体存储库。特定杂志的数据存储库并非解决开放数据共享的好方案。研究类期刊其实已经在 “补充材料”部分存储了各种范围广泛的数据集,这显然比不发布数据要好得多,但大家都认为在这些地方储存原始数据是非常可怕的。即使这些特定的存储库已经 有了完善的数据类型,Nature也希望建立figshare和Dryad这两个存储库,并称之为“后备库”,至少有两个方面的好处:(1)其他的一些存 储库可能不支持保密的同行评审,(2)其他存储库在维护而无法对外提供服务。我们注意到,之前的自然子刊其实在这方面已经有相对比较好的政策了,这些杂志 要求将数据放到标准的完善存储库中。

  总之,按照这种策略,DD就是为了在期刊研究类文章和数据存储库之间补充信息。DD将提供产生重要数据集的详细实验和过程描述,包括可让科学家评估数 据技术质量的基本信息、数据再利用的关键方法或分析流程,以及最终重利用数据解决重要的研究问题。在SD上发表的每个出版物将由描述实验关键性能的元数据 和结果数据来支持,这些元数据有助于数据挖掘,并将帮助科学家们找到和重用存储在多个数据存储库的高质量数据。

  DD最初将关注生命、生物医学和环境科学等领域的数据,可能在适当的时候扩展到更多的学科。


  参考资料:


[1] Nature 502, 142 (10 October 2013) doi:10.1038/502142a
[2] http://nature.com/scientificdata


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部