Codeplot
OrthoFinder
简介

简介

基因序列之间的系统发育关系是比较生物学研究的基础。它为理解地球上生命的进化和多样性提供了框架,并能够在生物之间推断生物学知识。

OrthoFinder是一个快速,准确和全面的比较基因组学分析工具。它找到正交群(orthogroups) 和 直系同源(orthologs),推断所有正交群的根基因树,并识别这些基因树中所有的基因复制事件。它还为被分析的物种推断出一个有根的物种树,并将基因复制事件从基因树映射到物种树的分支。OrthoFinder还提供了比较基因组分析的全面统计。

image

本工作流采用 OrthoFinder 2.4.1版本,用户输入输入文件既可以得到结果。

输出工作流结果文件说明,请查看官方说明

更多信息可查看工具论文:

Emms, D.M. and Kelly, S. (2019) OrthoFinder: phylogenetic orthology inference for comparative genomics. Genome Biology 20:238

Emms, D.M. and Kelly, S. (2015) OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy. Genome Biology 16:157

联系我们

该工具由国家基因库团队提供。如有任何问题或疑虑,请联系 CNGBdb@cngb.org

脚本
输入
任务名称变量名称类型描述
* run_orthofinder fastasArray[File] 输入的fasta文件列表
* run_orthofinder.orthofinder search_threadsInt 序列搜索并行线程数默认16
* run_orthofinder.orthofinder rooted_treeFile 用户自定义的有根树
* run_orthofinder.orthofinder mcl_inflationFloat 设定MCL的膨胀系数(默认为1.5)
* run_orthofinder.orthofinder is_dnaBoolean 输入的是DNA序列
* run_orthofinder.orthofinder is_SplitParaCladeBoolean 将一个HOG根下的同源分支分裂成不同的HOGs
* run_orthofinder.orthofinder analysis_threadsInt 分析并行线程数默认1
* run_orthofinder memoryString 任务运行的内存数量,注意1.取值范围为0.25核-32核,另外还可选48核和64,CPU必须为0.25核的整数倍;2.内存取值范围>为1GB-512GB,且内存必须为1GB的整数倍3.CPU/内存配比值必须在1:2到1:8之间
* run_orthofinder cpuString 任务运行的CPU数量,注意1.取值范围为0.25核-32核,另外还可选48核和64,CPU必须为0.25核的整数倍;2.内存取值范围为1GB-512GB,且内存必须为1GB的整数倍3.CPU/内存配比值必须在1:2到1:8之间
输出
任务名称变量名称类型描述
* run_orthofinder StatisticsFile 比较基因组统计文件列表,通过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder DuplicationFile 基因复制事件文件列表文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder Gene_TreesFile 基因树形文件列表文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder OrthogroupsFile 直系同源群文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder OrthologuesFile 直系同源群文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder Orthogroup_SequencesFile 每个直系同源群fasta文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder Phylogenetic_OrthogroupsFile 系统发育树层次直系同源群文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder Resolved_Gene_TreesFile 每个正交组推导具有4个或更多序列的有根的系统发育树列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder Single_Copy_Orthologue_SequencesFile 单拷贝序列文件列表,通>过填写this.xxx将输出文件返回到对应表格xxx列
* run_orthofinder Species_TreeFile 物种树文件列表,通过填写this.xxx将输出文件返回到对应表格xxx列