2020-10-27 2277CNGBdb
2020年10月27日,国家基因库生命大数据平台(CNGBdb)在第十五届国际基因组学大会(ICG-15)上重磅发布一项全新功能——生命大数据可信计算平台CODEPLOT。
CODEPLOT是一个集可信计算环境和多元化在线分析工具于一体的生命大数据分析平台,是国内首个将数据加密、区块链、安全多方计算、基因安全容器虚拟化等最新安全策略应用于生命大数据分析利用和合作共享的平台。其正式发布将生命大数据的安全共享和利用转化带上了一个新台阶。
CODEPLOT是一个灵活、可信的计算平台,用户无需任何编程背景,也可使用该平台的计算工具进行自动化的生物信息学分析。同时,它采用区块链和多方安全计算等前沿技术,确保用户的数据安全。
大数据时代下,生命科学的研究模式已经转化为数据驱动的科学发现模式,高效利用多组学、多层次的大数据可有效促进各领域的基础研究及科研成果转化。然而,以下痛点仍然有待解决:
当前,生命大数据多分散在科研工作者手中或研究单位内部,数据孤岛化问题严重,如何打破这一局面?
数据共享有助科学发展,可是信息安全问题日益突出,如何在保障数据安全的情况下进行数据共享?
在数据驱动的科学发现模式中,数据分析必不可少,但需要交叉学科背景,非专业人员如何突破高门槛?...
为了解决生命大数据研究中的上述新挑战,CNGBdb打造了集可信计算环境和多元化在线分析工具于一体的生命大数据分析平台CODEPLOT。
CNGBdb可信计算平台CODEPLOT基于区块链和安全多方计算等技术,以数据汇交模块存储的海量数据为支撑,以灵活工作空间管理模式为核心,同时提供多元化分析工具,全面打通各科研机构之间的数据孤岛,突破数据分析门槛,提升数据利用率,促进重大科研项目合作共享及成果转化。
基于多级权限控制,利用数据存储加密、传输加密和安全多方计算等技术,使得用户能够在不公布己方数据的前提下,完成自有数据分析;以“虽彼此不可见,但可共享使用”(即“可用不可见”)的方式,完成协同分析。同时结合区块链技术,保证所有数据和计算过程均可回溯且不可篡改,为平台用户提供可信的计算环境。
提供常用的生物信息分析流程,包括单细胞聚类scanpy分析、录组差异分析edgeR 分析、HMMER基因家族分析、新冠病毒数据BLAST检索等16种分析流程。同时,支持用户使用流程管理工具WDL搭建自定义的分析流程。
采用工作空间构建计算沙箱,用户可在自己的工作空间内选择分析工具、数据集和计算模式。采用单方计算模式时,用户可单独针对自有数据进行分析,或者与平台现有的公开数据合并分析;采用多方计算模式时,用户通过共享空间方式与不同地域研究者/研究团队进行协作分析。
用户可以利用三种不同的数据集进行分析:1. 公开数据集,即平台基于CNGBdb及其他公共数据库(如NCBI、Pfam等)的数据资源建成的公共数据集,涵盖植物、动物、微生物、疾病等多个研究领域。2. 私有数据集,即用户自行上传的自有数据集。3. 授权数据集。合作伙伴可以授权对方使用自己的私有数据集,以进行联合分析。
不论你是否有生信背景,即使你与合作伙伴相隔千里,CODEPLOT都可以帮你完成数据分析并实现安全共享!
立即体验CODEPLOT
CODEPLOT由CNGBdb团队设计开发,由华大磐石提供安全相关的技术支持。如果您有任何问题和建议, 可随时联系CNGBdb@cngb.org.