CentOS部署Gemini教程(遗传变异分析工具)
wget
、bash
等基础工具(可通过yum install -y wget bash
安装)。Miniconda用于创建独立的Python环境,避免依赖冲突。
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3
编辑~/.bashrc
文件,添加以下内容:
export PATH="$HOME/miniconda3/bin:$PATH"
运行source ~/.bashrc
使配置生效,随后执行conda init bash
初始化conda。
conda create -n gemini python=3.7
conda activate gemini
激活后,终端提示符会显示(gemini)
,表示已进入该环境。
wget https://github.com/arq5x/gemini/raw/master/gemini/scripts/gemini_install.py
用于存放Gemini工具及数据库文件:
mkdir {tool,data}
指定工具和数据目录,完成Gemini安装:
python gemini_install.py tool data
运行gemini --version
,若显示版本号(如Gemini version X.Y.Z
),则说明安装成功。
Gemini需依赖内置数据库(如ClinVar、dbSNP等)进行变异分析,可选择最小化安装(测试用)或全套安装(生产用)。
gemini update --dataonly --no-cdata
gemini update --dataonly --extra cadd_score --extra gerp_bp
注:全套数据库体积较大(约10GB+),需确保磁盘空间充足;下载过程中若中断,可使用--continue
参数恢复。
使用Gemini自带的测试VCF文件(包含注释信息):
wget https://raw.githubusercontent.com/arq5x/gemini/master/test/test.snpeff.vcf
将测试数据导入SQLite数据库(命名为test.db
),使用4线程加速:
gemini load -v test.snpeff.vcf -t snpEff --cores 4 test.db
确认数据导入成功,输出结果包含变异数量、样本数等信息:
gemini stats test.db
sudo
(不推荐长期使用),或调整目录权限(如chmod -R 755 $HOME/miniconda3
)。gcc
、python-dev
),可通过yum install -y gcc python3-devel
补充。gemini
命令提示“command not found”,请确认已执行conda activate gemini
激活环境。以上步骤完成后,即可在CentOS系统上使用Gemini工具进行遗传变异分析(如家系新生突变检测、群体遗传分析等)。