尊龙凯时网址

在r语言中如何将ensembl id转换成gene id或者symbol -尊龙凯时网址

2023-06-05

这篇文章主要介绍了在r语言中如何将ensembl id转换成gene id或者symbol,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

annotationdbi 和 结合物种对应的注释文件,将ensembl id转换成gene id(entrezid)

在r中如何利用ensembl id获得gene id(entrezid), 又或者转换为gene symbol,以人为例:

预先安装annotationdbi 和 org.hs.eg.db

加载org.hs.eg.db

> library(org.hs.eg.db)

获取所有的ensembl id,并查看前五个id

> k=keys(org.hs.eg.db,keytype = "ensembl")
> head(k,5)
[1] "ensg00000121410" "ensg00000175899" "ensg00000256069" "ensg00000171428" "ensg00000156006"

基于提取的ensembl id,提取对应的所有gene id(entrezid),(以及symbol),并查看一下提取的内容。

> list=select(org.hs.eg.db,keys=k,columns = c("entrezid","symbol"), keytype="ensembl")
'select()' returned 1:many mapping between keys and columns
> dim(list)
[1] 29140     3
> head(list,5)
          ensembl entrezid symbol
1 ensg00000121410        1   a1bg
2 ensg00000175899        2    a2m
3 ensg00000256069        3  a2mp1
4 ensg00000171428        9   nat1
5 ensg00000156006       10   nat2

预先准备的ensembl id,如何找到他们对应的gene id(entrezid)和symbol,例如id 中的,获得的对应关系:id_list

> id
 [1] "ensg00000256069" "ensg00000127837" "ensg00000129673" "ensg00000276016" "ensg00000075624" "ensg00000204262"
 [7] "ensg00000149294" "ensg00000069943" "ensg00000173992" "ensg00000166171" "ensg00000177201"
> id_list=list[match(id,list[,"ensembl"]),]
> id_list
              ensembl entrezid symbol
3     ensg00000256069        3  a2mp1
8     ensg00000127837       14   aamp
9     ensg00000129673       15  aanat
30    ensg00000276016       29    abr
59    ensg00000075624       60   actb
1017  ensg00000204262     1290 col5a2
3856  ensg00000149294     4684  ncam1
7605  ensg00000069943     9488   pigb
8058  ensg00000173992     9973    ccs
10155 ensg00000166171    25911   dpcd
17531 ensg00000177201   127064 or2t12

感谢你能够认真阅读完这篇文章,希望小编分享的“在r语言中如何将ensembl id转换成gene id或者symbol”这篇文章对大家有帮助,同时也希望大家多多支持本站,关注本站行业资讯频道,更多相关知识等着你来学习!

网站地图