全方位的基因组育种解决方案
针对基因组序列未知的动植物进行全基因组从头测序,构建物种参考基因组序列。在参考基因组的基础上,进行大规模全基因组重测序,构建基因组变异图谱,从分子水平上明确农业物种多样性中心和栽培起源驯化中心,为研究农作物驯化和性状改良奠定重要的理论基础。为研究人员能够自主便捷的进行生物信息分析,国家基因库打造了国家基因库可信计算平台(CODEPLOT)。
可信计算平台CODEPLOT
下一代测序技术的巨大进步彻底改变了研究方法,使人类健康,农业科学和大流行控制受益。CODEPLOT为生命科学领域的研究和行业提供了数据共享,工作流管理,弹性云计算资源和可信赖的协作环境的全面解决方案。在此阶段,可以使用三个独特的数据集,包括oneKP千种植物数据集,COVID-19基因组序列数据集和单细胞项目数据集,以及16个响应的自动分析工作流程,并准备在CODEPLOT平台中使用。
CODEPLOT具有三个方面的优势:
-
易操作:CODEPLOT是一个在线的生物信息平台,研究人员可在没有编程背景的下进行生物信息分析和挖掘。将Docker /容器技术,工作流描述语言(WDL)和Cromwell工作流引擎合并在一起,以提供一个高效且用户友好的框架,以在此平台中创建工作流并执行生物信息学分析。
-
高性能计算:CODEPLOT基于高度可扩展的高性能企业级Kubernetes集群和Docker容器技术,提供了企业级弹性云计算资源,以批处理模式运行并行作业。
-
安全:CODEPLOT采用了诸如数据加密,区块链和安全的多方计算之类的尖端技术,为数据共享和协作提供了高度安全和可靠的环境。简而言之,CODEPLOT是生命科学中可靠且灵活的生物信息学计算平台,旨在促进研究和行业中的组学数据的有效共享,合作和利用。
CODEPLOT是一个灵活、可信的计算平台,用户无需任何编程背景,也可使用该平台的计算工具进行自动化的生物信息学分析。让医疗人员专注他们自己的本职工作。CODEPLOT提供一个集可信计算环境和多元化在线分析工具于一体的生命大数据分析平台. 也是国内首个将数据加密、区块链、安全多方计算、基因安全容器虚拟化等最新安全策略应用于生命大数据分析利用和合作共享的平台。
我们为用户提供:
-
基于WDL(Workflow Description Language)生物信息执行工作流以及docker镜像的软件环境管理机制,实现不同研究领域的计算用户对于生物计算工作易读和易管理。同时工具在多执行平台之间易移植的特性使得工作流能够快速复现。
-
基于工作空间作为平台计算的工作单元,工作空间包含:描述,数据,工作,监控四部分。平台用户具有研究目的或生物学问题创建对应工作空间,工作空间描述便于组织记录研究过程及研究背景便于与协作分析者共享,数据表管理的数据单元清晰展示其研究数据维度,并方便用户批量分析数据表样本。
-
基于Kubernetes智能化基因计算任务调度和Spark等加速服务,并且利用容器技术的秒级并发能力,可将WGS从30小时缩短至5小时以内,对比同类竞品,使用相同样本的情况下,资源利用率大幅提升。容器应用的秒级弹性伸缩能力,在流量突增时能快速弹性扩容,保障业务的连续性和高稳定性。