查看原文
其他

当 Salmon 构建 index 秒失败时应该反思哪里

生信技能树 生信技能树 2022-06-06


既然大家感兴趣学徒培养细节,就连载一些学徒任务细节吧!
生信技能树超级VIP入场券发放(点我领取)

拿到超级VIP入场券的学徒,就可以无限制参与全部生信技能树举办的线下课程,包括LINUX,R,GEO和TCGA数据挖掘,各种NGS线下大课,所以如果你想参加3个以上线下课程还不如直接报名学徒啦。

也可以获得全部的视频资源(约4000元)开通,也可以来珠海参加一个月的任务实战训练。

下面的一个学徒作业
因为前面学徒处理人类数据airway发现了一个有趣的bug:你可能不适合做人(学徒给我的6个暴击)
所以让另外一个天资聪慧的学徒使用她的Windows电脑做一下,正好对应一下不同操作系统的差异,有趣的是salmon这样的软件,并没有Windows版本,所以无法使用conda安装在她电脑,不过还好她系统是Windows10,所以可以比较轻松的开启ubuntu子系统,也可以完成任务!

1. 下载参考转录组

关于转录组的salmon流程,需要看视频在 https://share.weiyun.com/5sh27An

参考转录组下载传送门:http://ftp.ensembl.org/pub/release-76/fasta/homo_sapiens/cdna/Homo_sapiens.GRCh38.cdna.all.fa.gz

由于 wget 下载速度太慢,用了神奇的Motrix软件分分钟成功下载到本地。

就是来自技能树推文的安利之一,推文传送门:https://mp.weixin.qq.com/s/whx-n1ktT58WHhWAUa06dw (所以下次黑粉们不要瞎留言,说老大写的教程不好!!!你的良心不会痛吗)

软件就是它👇

然后直接将 Homo_sapiens.GRCh38.cdna.all.fa.gz 拖到子系统的工作路径下。

2. Salmon 构建 index

假设已经装好了 Miniconda,按照生信技能树的教程走即可;

2.1 在小环境中安装 Salmon

conda create --name rnaseq
conda activate rnaseq
conda install -y salmon

2.2 构建 index

失败第一回
salmon index -t Homo_sapiens.GRCh38.cdna.all.fa.gz -i homo38_index

[Error reading from the FASTA/Q stream. Make sure the file is valid.]

难道是文件不完整吗,抱着这种想法甚至重新下载了1n遍。

失败第二回

看了别人构建好的 index, 里面有 .json 文件,难道是和网速有关?

开着战五渣的手机热点,依然 [Error reading from the FASTA/Q stream. Make sure the file is valid.] .

失败最终回/成功第一回
(这个时候,必须说一下,一个经验丰富的工程师帮你排查错误是多么的有帮助,大神过来简单几个命令就找出问题所在了!)

查看文件详细信息:

ls -lh

没有权限,毫无权限。

那么就来修改权限🤦‍♂️

chmod 777 Homo_sapiens.GRCh38.cdna.all.fa.gz

这是坠吼的成功信息:

salmon index -t Homo_sapiens.GRCh38.cdna.all.fa.gz -i homo38_index

所以构建 index 秒失败应该反思哪里呢

  • 文件完整性,有必要

  • 网速,阔以,么得必要

  • 文件权限,非常必要,尤其用了除 wget 以外的操作下载


全国巡讲约你

第1-11站北上广深杭,西安,郑州, 吉林,武汉,成都,港珠澳(全部结束)

一年一度的生信技能树单细胞线下培训班(已结束)

全国巡讲第12站-北京(下一站杭州)(已结束)

全国巡讲第14、15站-兰州和贵阳(生信入门课全新改版)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存