CentOS部署Gemini教程(遗传变异分析工具)
wget、bash等基础工具(可通过yum install -y wget bash安装)。Miniconda用于创建独立的Python环境,避免依赖冲突。
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3编辑~/.bashrc文件,添加以下内容:
export PATH="$HOME/miniconda3/bin:$PATH"运行source ~/.bashrc使配置生效,随后执行conda init bash初始化conda。
conda create -n gemini python=3.7conda activate gemini激活后,终端提示符会显示(gemini),表示已进入该环境。
wget https://github.com/arq5x/gemini/raw/master/gemini/scripts/gemini_install.py用于存放Gemini工具及数据库文件:
mkdir {tool,data}指定工具和数据目录,完成Gemini安装:
python gemini_install.py tool data运行gemini --version,若显示版本号(如Gemini version X.Y.Z),则说明安装成功。
Gemini需依赖内置数据库(如ClinVar、dbSNP等)进行变异分析,可选择最小化安装(测试用)或全套安装(生产用)。
gemini update --dataonly --no-cdatagemini update --dataonly --extra cadd_score --extra gerp_bp注:全套数据库体积较大(约10GB+),需确保磁盘空间充足;下载过程中若中断,可使用--continue参数恢复。使用Gemini自带的测试VCF文件(包含注释信息):
wget https://raw.githubusercontent.com/arq5x/gemini/master/test/test.snpeff.vcf将测试数据导入SQLite数据库(命名为test.db),使用4线程加速:
gemini load -v test.snpeff.vcf -t snpEff --cores 4 test.db确认数据导入成功,输出结果包含变异数量、样本数等信息:
gemini stats test.dbsudo(不推荐长期使用),或调整目录权限(如chmod -R 755 $HOME/miniconda3)。gcc、python-dev),可通过yum install -y gcc python3-devel补充。gemini命令提示“command not found”,请确认已执行conda activate gemini激活环境。以上步骤完成后,即可在CentOS系统上使用Gemini工具进行遗传变异分析(如家系新生突变检测、群体遗传分析等)。