library(clusterProfiler)
x <- c("GPX3", "GLRX", "LBP", "CRYAB", "DEFB1", "HCLS1", "SOD2", "HSPA2")
ids = bitr(x, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")
idsBiological ID Translation
clusterProfiler包的KEGG富集分析可用ID包括kegg,ncbi-geneid,ncbi-proteinid或uniprot。真核生物的kegg即Entrez ID,原核生物则为Locus Tag。蛋白质谱一般以Uniprot ID展示,但测序数据一般以Gene Symbol展示,不在KEGG支持的ID范围中,如果想用测序结果做KEGG富集分析需进行ID转换。
bitr()是专用于ID转换的函数,其OrgDB参数指定物种类型,人为org.Hs.eg.db,小鼠为org.Mm.eg.db。以人源Gene Symbol为例,将其转换为Entrez ID。
另有处理KEGG ID的专用函数bitr_kegg(),其fromType和toType均为KEGG支持ID类型的四者之一。 (似乎意义不大,毕竟目的是转换成KEGG支持的ID,而不是在KEGG支持的ID类型中互相转换。)
ids <- bitr_kegg(x, fromType='kegg', toType='ncbi-proteinid', organism='hsa')