Détails de snippet

Retire le numéro de version du code Ensembl des gènes / transcrits[R]

2018-07-05 03:59:38     gdevailly     GENCODE Ensembl 

  Les codes Ensembl des gènes / transcrits viennent parfois avec un chiffre final traçant le nombre de modifications de ces annotations:

Par exemple, l'annotation de ENSG00000134046.11 a été modifié 11 fois.

Cette petit expression régulière permet de s'en débarrasser, pour faciliter les croisements de listes de gènes.
x <- c("ENSG00000134046.11", "ENSG00000229807.10")

sub("\\.[0-9]*$", "", x)
# [1] "ENSG00000134046" "ENSG00000229807"
0/5 - [ rating]