查看原文
其他

生物信息学技能面试题(第3题)-探索人类基因组注释文件

2017-02-16 jimmy 生信技能树

前面标题编号错了,所以重新发一下,欢迎大家转发这个系列,总共两百个题目,考一下你的同事,你的下属,你的老板!


注释文件一般以gtf/gff格式记录着!


每条染色体基因个数的分布?

所有基因平均有多少个转录本?

所有转录本平均有多个exon和intron?


或者其它一系列你想统计的,你想了解的!
或者其它一系列你想统计的,你想了解的!
或者其它一系列你想统计的,你想了解的!


你知道如何统计吗?需要用到哪些生信技能?


我想看到下面这样的图片


PS:有同学反映这个图比较随性,哈哈,你说的对,这就是我!


用perl和python,R,shell均可以完成!

基础作业,就是对这个文件  进行统计,普通人只需要关心第1,3列就好了。


我写过一个R完成的版本:R的bioconductor包TxDb.Hsapiens.UCSC.hg19.knownGene详解

见 : 
人类的基因组注释文件,一般是gtf/gff格式的。

参考:


微信里面无法发链接,点击阅读原文可以查看具体信息!


也可以查看历史题目:

生物信息学技能面试题(第1题)-人类基因组的外显子区域到底有多长

生物信息学技能面试题(第2题)-探索人类基因组序列



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存