conda开源包管理系统和环境管理系统 ,包括多种语言的包安装,运行,更新,删除,最重要的是可以解决包依赖问题。在做生信分析时,感觉就是一个软件管家一样的存在,在安装生信软件等方面上十分方便。下面小结一下conda的基础操作
- 后面介绍的所有
conda
命令都可以替换为如下的mamba
命令,从而实现高速的下载等操作
1
|
conda install -c conda-forge mamba
|
1、下载、安装miniconda包#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# 开始安装,过程中根据提示回车或者yes就行了~
# source ~/.bashrc
# 配置国内镜像源,提高以后下载软件速度
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --set show_channel_urls yes
conda config --get #查看已设置的channels
# 如果想要删除某镜像源
# conda config --remove channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
|
如果出现conda命令找不到的情况,可按下法操作。不过现在安装,好像一般都会自动添加了。
1
2
3
4
5
6
7
8
9
|
cat ~/.bashrc
#此时应该没有miniconda的路径
nano ~/.bashrc #将下面一行代码输入到最后
echo ‘export PATH=“home/user/miniconda3/bin:$PATH”’ >> ~/.bashrc
#保存退出
cat ~/.bashrc
#此时应该是修改好的版本了
source ~/.bashrc
#更新一下,然后下面的操作就可以顺利进行了。
|
2、环境管理#
类似Linux系统是一个大庭院,我们专门为做一件事情(需要一系列软件)而设置的一个房间(环境),这样就会使这个大庭院干净利落很多,不会很乱。做一件事,到相应的房间(conda环境)去使用软件就行。这些软件的命令都是可以直接使用的,这就很方便了
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
#创建一个名为rna-seq的环境
conda create -n rna-seq
#进入该环境,此时可以看到命令行提示符前缀已经发生了变化
conda activate rna-seq
#退出环境
conda deactivate
#查看系统有哪些环境(房间)
conda info --envs
#删除名字为name的环境
conda remove -n name --all
#环境重命名:先复制改名,再删除旧的
conda create -n newname --clone oldname
conda remove -n oldname --all
#复制环境到新电脑
## 先进入目标环境
conda activate myconda
## 然后生成yaml文件
conda env export > myconda.yaml
## 传递该yaml文件到目标电脑,再安装即可
conda env create -f myconda.yaml
|
3、下载、管理软件#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
#搜索软件
conda search fastqc
#下载软件,
## -y 参数表自动安装
## -c 指定软件下载的channal源
conda install -c bioconda fastqc -y
#下载指定版本的软件
conda install -c bioconda fastqc=0.11.7
#查看当前环境下的所有软件
conda list
#卸载软件
conda remove fastqc -y
|
4、安装R包#
1
2
3
|
mamba install -c r r-base
mamba install -c r r-essentials
mamba install -c r r-ggplot2
|
安装r-base
之后,就可以进入R环境,使用R的命令安装包。
(1)有时R的命令安装不了的包,使用conda可以安装成功。
(2)但是conda安装包的版本往往具有滞后性
- Bioconductor的生信包:
bioconductor-package
;不区分大小写
1
|
mamba install -c r bioconductor-deseq2 bioconductor-edger
|
1
2
3
4
5
6
7
8
9
10
|
#单独创建一个rstudio环境
conda activate rstudio
#这一步会默认安装最新版的R(>4.0)
mamba install -c r r-essentials r-base
#首先会默认安装1.0版本的rstudio,会自动把r降到3.2的版本
conda install -c r rstudio
#然后再指定升级rstudio至1.1.456版本,会自动把r升到3.6的版本
conda install -c r rstudio=1.1.456
#启动rstudio界面
rstudio
|
安装rstudio时并没有使用mamba安装,因为失败了。使用conda安装,也需要等待较长时间,甚至多试几次。但最终还是可以滴。
- 关于设置R包下载镜像地址:https://www.jianshu.com/p/9940fb1864c3
20241226补:conda-pack环境迁移
官方文档 https://conda.github.io/conda-pack/
- (1) 首先在想要迁移的conda环境中安装 conda-pack
1
2
|
conda activate huggingface
conda install conda-pack
|
1
2
|
conda-pack
# huggingface.tar.gz
|
1
2
|
mkdir -p miniconda3/envs/huggingface
tar -xf huggingface.tar.gz -C miniconda3/envs/huggingface/
|
可以使用rsync命令,将数据在不同服务器之间远程同步。
1
2
3
4
5
|
rsync -avzP -e "ssh -i ./id_rsa -p 22" /home/user/file.tar.gz name@ip:/home0/user2/path/to/save
# -a:归档模式,保留文件的权限、符号链接、修改时间和其他属性。
# -v:详细模式,显示传输过程中的详细信息。
# -z:在传输过程中压缩数据以减少带宽使用。
# -P:断点续传+实时进度:
|
补充:对于R语言环境,产生类似如下的报错时,可参考这个解决方式:https://github.com/conda/conda-pack/issues/246 方法之一是在解压、激活后,使用conda-unpack
命令
1
|
cannot open /workspace/croot/r-base_1695428141831/_h_env_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_placehold_/lib/R/etc/ldpaths: No such file
|