Linux & Conda

Linux常用命令

Linux 命令大全 | 菜鸟教程

ls # 列出当前目录下所有内容 
ls -lh # 列出当前目录下所有内容及大小

pwd # 当前目录

cd # 进入某文件夹/地址
cd .. # 返回上级文件夹

wget # 下载
tar -zxvf # 解压gzip文件
tar -xf archive.tar -C /home/user/documents # 解压tar文件到指定目录

Ctrl+L # 清屏

# 重启Apache服务器
sudo systemctl restart httpd

curl

# 查看ftp站点文件列表
curl -l ftp.ncbi.nlm.nih.gov/geo/series/GSE221nnn/GSE221561/suppl/
# GSE221561_metadata_celltype.csv.gz
# filelist.txt
# GSE221561_RAW.tar

另外,GEO的ftp站点网址规律为GSE221nnn/GSE221561,其余不变。可用此规律构造出任何GEO索引号的文件下载地址。

rm

remove,删除文件或目录。

rm test.txt # 删除文件“test.txt”
rm -r homework # 删除目录(文件夹)homework
rm -f test.txt # 直接删除无需确认

scp

secure copy,基于 ssh 登陆进行安全的远程文件拷贝命令。

scp -r my_directory user@remote_host:/home/user/
# 将本地的 my_directory 目录复制到远程主机的 /home/user/ 目录下

scp -P 22 example.txt yanglab@192.168.31.244:/home/file/
# 通过22端口将本地的example.txt拷贝到远程服务器

配合tar命令,先压缩后传输:

tar -czvf archive.tar.gz /path/to/files
scp -P 22 archive.tar.gz usr@192.168.31.244:/home/file/
tar -zxvf archive.tar.gz

Jupyter Lab

在Ubuntu 22.04中安装Jupyter Lab并允许远程访问,已有conda环境。

conda create -n jupyterlab # 新建专门的环境
conda install jupyterlab # 安装Jupyter Lab
jupyter lab --generate-config # 生成配置文件
jupyter lab password # 生成密码,然后输入设定的密码

修改配置

vi ~/.jupyter/jupyter_lab_config.py

修改以下条目

# 允许远程访问
c.ServerApp.allow_remote_access = True
# 允许 root 用户
c.ServerApp.allow_root = True
# 启动时不打开浏览器
c.LabServerApp.open_browser = False
# 设置jupyter lab的ip地址
c.ServerApp.ip = '____' # 不能设置为0.0.0.0,需提前明确该主机的IP地址 

启动Jupyter Lab

jupyter lab

通过ip:port访问,默认端口为8888,如http://192.168.31.244:8888/

WSL

在 WSL中访问如下路径,就可以看到 Windows 下的文件:

/mnt/c  # C:盘
/mnt/d  # D:盘

如果要在 Windows 资源管理器访问 wsl 的文件,则在 wsl 中输入:

explorer.exe . # 注意末尾的英文句号

或者在资源管理器导航窗格中点击Linux;

或者在资源管理器地址栏输入:

\\wsl$

VHDX在Windows下的地址(引用源

C:_name\AppData\Local\Packages\CanonicalGroupLimited.Ubuntu_79rhkp1fndgsc4.vhdx

注意:直接删除VHDX文件将导致无法进入WSL。

Miniconda

安装Miniconda

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py39_23.3.1-0-Linux-x86_64.sh
bash Miniconda3-py39_23.3.1-0-Linux-x86_64.sh

将conda添加到环境变量

vim ~/.bashrc
# 按i键进入编辑模式,在文件末尾添加 export PATH="/home/usr_name/miniconda3/bin:$PATH"
# 按Esc键退出编辑模式,输入“:wq”保存并退出

添加镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --set show_channel_urls yes

查看已有环境和新建环境

conda env list
conda create -n rna python=3.9 # 环境名称为rna并且指定python版本为3.9

激活环境和退出环境

source activate [env_name]
conda info -e # 显示已创建的环境和路径
source deactivate # 退出
conda remove -n [env_name] --all # 删除环境

conda安装包

conda install fastqc # 安装单个包
conda install anndata==0.9.1 # 安装指定版本的包
conda install -c conda-forge jupyterlab # 从指定channel安装jupyterlab包
conda install -y fastqc # 在遇到Proceed问题时自动选择y
conda install fastqc multiqc trimmomatic cutadapt # 同时安装多个包,用空格隔开
# 质控 fastqc multiqc
# trimmomatic cutadapt trim-galore 
# 比对 star hisat2 bowtie2 subread bwa
# 比对包tophat官网宣称此包已处于低维护状态,不建议使用。
# 计数 htseq bedtools deeptools salmon
conda list # 查看已经安装的包

安装包时遇到requests.exceptions.HTTPError: 404 Client Error: Not Found for url错误的解决方案

conda config --remove-key channels # 删除除默认源以外的源
conda config --append channels conda-forge --append channels bioconda --append channels defaults # 添加源

SRA Toolkit

SRA官网

SRA Toolkit Github

.sra文件可用Motrix下载,用SRA Toolkit的pretch命令下载很慢且可能中途报错。

.sra文件转换为.fastq:下载.sra文件存放在bin目录下新建的SRRXXXXXX文件夹中。在bin目录下用vdb-config -i进入配置界面,将Enable Remote Access取消,然后运行fasterq-dump [SRRXXXXXX] --split-files即可。若不取消Remote Access则会从网上下载而非使用本地文件。