2023年11月9日,国家基因库生命大数据平台(CNGBdb)获得CoreTrustSeal全球核心可信存储库国际认证。CoreTrustSeal全球核心可信存储库国际认证是由国际科学理事会数据批准印章(Data Seal of Approval,DSA)和世界数据系统(World Data System,WDS)联合推动的全球核心可信存储库国际认证。截至目前,CNGBdb是生命科学领域国内首个通过该国际认证的数据仓储。
此前CNGBdb已获得Wiley、Oxford、Cell Press、Science系列期刊等多家国际出版机构/期刊认可,本次通过CoreTrustSeal认证表明CNGBdb的数据汇交、规范管理、可信存储、权益保护、长期保存和持续服务能力等得到国际认可,能够接收生命科学领域在国际期刊发表论文的相关科学数据,是我国生命科学领域数据中心国际化能力提升的充分体现。
CoreTrustSeal数据中心认证体系是国际科学理事会(International Scientific Coucil,简称ISC)世界数据系统(World Data System,简称WDS)于2018年推出的一套认证系统,是目前最新且最为人信赖的国际数据中心认证,致力于推广国际范围内可持续和可信赖的数据中心或数据存储库。其认证过程十分严格,从组织基础架构、数据管理、技术能力等三大维度,对数据中心的工作使命、开发与运维团队、专家团队、数据质量控制、工作流程、硬件基础、数据安全等16项要求进行评估,这些内容反映了可信赖数据存储库的核心特征。CoreTrustSeal数据中心认证系统已成为申请加入WDS正式成员(Regular Member)的必要条件。CNGBdb通过的是CoreTrustSeal 2020-2023年的核心可信存储库认证要求。
作为服务于国家战略的重大科技基础设施之一,深圳国家基因库已建成千万级样本存储能力、691万亿次/秒计算能力、Pb级数据产出能力,并在此基础上建立了综合性生命科学数据共享平台——国家基因库生命大数据平台(CNGBdb),为全球科研工作者提供生物大数据汇交管理和共享服务。
上图为国家基因库生命大数据平台(CNGBdb)
CNGBdb一直致力于稳定、可靠、持续的科学数据存储库建设,并推动科学数据的安全共享。目前CNGBdb已通过FAIRsharing认证及国际科研数据仓储目录re3data收录,支持Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science等多个国际著名出版社/系列期刊投稿发文,交到CNGBdb的数据统一进行DOI(数字对象标识符)标识。
CNGBdb的存储功能由国家基因库序列归档系统(CNSA)负责。CNSA是一个支撑全球组学研究成果汇交和管理的系统,致力于多组学数据(基因组、转录组、代谢组、单细胞和空间转录组等)的开放和共享,为全球科研人员提供更加安全、稳定、可靠、便捷的数据归档服务,促进多组学数据的再利用,推动全球生命科学的发展。
上图为国家基因库序列归档系统(CNSA)
截至目前,CNSA已归档多组学数据12607TB,支撑全球近500个科研单位的科研数据汇交和共享,支持论文发表1323篇,发表期刊367种,包括The Lancet、Science、Cell等。此外,CNSA审编团队还定期组织数据递交实战培训,解答用户在数据递交过程中遇到的常见问题,手把手教你轻松搞定数据上传。
未来,CNGBdb将继续在严格保障数据安全的前提下,持续提升数据资源建设和数据挖掘分析服务能力,为全球科研工作者提供更优质、可靠的科学数据服务,打造良好的生命科学数据生态环境。
* 部分信息来源于“中国医学科学院新闻中心”和“全国地质资料馆订阅号”公众号