# 列出当前目录下所有内容
ls -lh # 列出当前目录下所有内容及大小
ls
# 当前目录
pwd
# 进入某文件夹/地址
cd # 返回上级文件夹
cd ..
# 下载
wget -zxvf # 解压gzip文件
tar -xf archive.tar -C /home/user/documents # 解压tar文件到指定目录
tar
+L # 清屏
Ctrl
# 重启Apache服务器
sudo systemctl restart httpd
Linux & Conda
Linux常用命令
curl
# 查看ftp站点文件列表
-l ftp.ncbi.nlm.nih.gov/geo/series/GSE221nnn/GSE221561/suppl/
curl # GSE221561_metadata_celltype.csv.gz
# filelist.txt
# GSE221561_RAW.tar
另外,GEO的ftp站点网址规律为GSE221nnn/GSE221561
,其余不变。可用此规律构造出任何GEO索引号的文件下载地址。
rm
remove,删除文件或目录。
# 删除文件“test.txt”
rm test.txt -r homework # 删除目录(文件夹)homework
rm -f test.txt # 直接删除无需确认 rm
scp
secure copy,基于 ssh 登陆进行安全的远程文件拷贝命令。
-r my_directory user@remote_host:/home/user/
scp # 将本地的 my_directory 目录复制到远程主机的 /home/user/ 目录下
-P 22 example.txt yanglab@192.168.31.244:/home/file/
scp # 通过22端口将本地的example.txt拷贝到远程服务器
配合tar命令,先压缩后传输:
-czvf archive.tar.gz /path/to/files
tar -P 22 archive.tar.gz usr@192.168.31.244:/home/file/
scp -zxvf archive.tar.gz tar
Jupyter Lab
在Ubuntu 22.04中安装Jupyter Lab并允许远程访问,已有conda环境。
-n jupyterlab # 新建专门的环境
conda create # 安装Jupyter Lab
conda install jupyterlab --generate-config # 生成配置文件
jupyter lab # 生成密码,然后输入设定的密码 jupyter lab password
修改配置
~/.jupyter/jupyter_lab_config.py vi
修改以下条目
# 允许远程访问
= True
c.ServerApp.allow_remote_access # 允许 root 用户
= True
c.ServerApp.allow_root # 启动时不打开浏览器
= False
c.LabServerApp.open_browser # 设置jupyter lab的ip地址
= '____' # 不能设置为0.0.0.0,需提前明确该主机的IP地址 c.ServerApp.ip
启动Jupyter Lab
jupyter lab
通过ip:port
访问,默认端口为8888,如http://192.168.31.244:8888/
。
WSL
在 WSL中访问如下路径,就可以看到 Windows 下的文件:
/mnt/c # C:盘
/mnt/d # D:盘
如果要在 Windows 资源管理器访问 wsl 的文件,则在 wsl 中输入:
# 注意末尾的英文句号 explorer.exe .
或者在资源管理器导航窗格中点击Linux;
或者在资源管理器地址栏输入:
$ \\wsl
VHDX在Windows下的地址(引用源)
C:_name\AppData\Local\Packages\CanonicalGroupLimited.Ubuntu_79rhkp1fndgsc4.vhdx
注意:直接删除VHDX文件将导致无法进入WSL。
Miniconda
安装Miniconda
://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py39_23.3.1-0-Linux-x86_64.sh
wget https-py39_23.3.1-0-Linux-x86_64.sh bash Miniconda3
将conda添加到环境变量
~/.bashrc
vim # 按i键进入编辑模式,在文件末尾添加 export PATH="/home/usr_name/miniconda3/bin:$PATH"
# 按Esc键退出编辑模式,输入“:wq”保存并退出
添加镜像源
--add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --set show_channel_urls yes conda config
查看已有环境和新建环境
conda env list-n rna python=3.9 # 环境名称为rna并且指定python版本为3.9 conda create
激活环境和退出环境
source activate [env_name]-e # 显示已创建的环境和路径
conda info # 退出
source deactivate -n [env_name] --all # 删除环境 conda remove
conda安装包
# 安装单个包
conda install fastqc ==0.9.1 # 安装指定版本的包
conda install anndata-c conda-forge jupyterlab # 从指定channel安装jupyterlab包
conda install -y fastqc # 在遇到Proceed问题时自动选择y
conda install # 同时安装多个包,用空格隔开
conda install fastqc multiqc trimmomatic cutadapt # 质控 fastqc multiqc
# trimmomatic cutadapt trim-galore
# 比对 star hisat2 bowtie2 subread bwa
# 比对包tophat官网宣称此包已处于低维护状态,不建议使用。
# 计数 htseq bedtools deeptools salmon
# 查看已经安装的包 conda list
安装包时遇到requests.exceptions.HTTPError: 404 Client Error: Not Found for url
错误的解决方案
--remove-key channels # 删除除默认源以外的源
conda config --append channels conda-forge --append channels bioconda --append channels defaults # 添加源 conda config
SRA Toolkit
SRA Toolkit Github
.sra文件可用Motrix下载,用SRA Toolkit的pretch命令下载很慢且可能中途报错。
.sra文件转换为.fastq:下载.sra文件存放在bin目录下新建的SRRXXXXXX文件夹中。在bin目录下用vdb-config -i
进入配置界面,将Enable Remote Access取消,然后运行fasterq-dump [SRRXXXXXX] --split-files
即可。若不取消Remote Access则会从网上下载而非使用本地文件。