查看原文
其他

菌群生信分析,有哪些值得关注的新工具?| 热心肠日报

热心肠小伙伴们 热心肠研究院 2022-08-31

今天是第2152期日报。

西安交大:用于聚类宏基因组重叠群的新方法——MetaDecoder

Microbiome[IF:14.65]

① 聚类宏基因组重叠群是研究菌群功能的关键,但现有工具处理相似基因组时作用有限;② MetaDecoder是一种双层概率模型;③ 第一层基于GPU改进后的Dirichlet过程Gaussian混合模型,对数据进行初步聚类以降低复杂性;④ 第二层基于单拷贝标记基因的半监督k-mer频率概率模型和修正的Gaussian混合模型,对初筛数据再次聚类,该法可有效地聚类重叠群并重建菌群;⑤ 模拟或真实数据的基准测试表明其优于其他算法,可生成更完整污染更低的基因组。

MetaDecoder: a novel method for clustering metagenomic contigs
03-10, doi: 10.1186/s40168-022-01237-8

【主编评语】这是西安交通大学杨铁林、郭燕与团队在Microbiome发表的研究成果。可基于 GPU运算的 MetaDecoder,用于有效地聚类宏基因组重叠群并从菌群数据中重建菌群。在模拟数据集和真实数据集上应用 MetaDecoder 表明,它可以生成更完整且污染更低的基因组。使用 MetaDecoder,作者确定了新的高质量基因组并扩展了现有的细菌基因组集。(@刘永鑫-中科院-宏基因组)

StrainGE:追踪和描述复杂群落中低丰度菌株的工具包

Genome Biology[IF:13.583]

① StrainGE有两个关键组件:菌株基因组搜索(StrainGST;找到数据库与样本中菌株最相似的参考基因组)和菌株基因组恢复(StrainGR;与参考基因组序列比对,确定其单核苷酸变异和缺失部分);② StrainGE可用于追踪样本间共享菌株,与常用MIDAS和StrainPhlan比,在0.1X覆盖率下能识别出菌株,当测序覆盖率低至0.5X最准确;③ 用于3个临床样本数据集,StrainGE可识别其他工具无法检测到的低丰度菌株,追踪不同样本中及菌株混合物中的菌株。

StrainGE: a toolkit to track and characterize low-abundance strains in complex microbial communities
03-07, doi: 10.1186/s13059-022-02630-0

【主编评语】与人类相关的微生物群落不仅是微生物物种的混合物,还包括同一物种不同菌株的混合物,由于研究复杂群落样本中菌株水平上变异存在困难,其含义大多未被充分探讨。Genome Biology最近发表文章,作者开发了一种新的生信工具StrainGE(https://github.com/broadinstitute/StrainGE,可基于conda安装),用于从宏基因组数据集中对感兴趣的物种(或属)进行菌株水平的表征和追踪,专门用于捕捉数据稀少的低丰度菌株。在真实的宏基因组数据中,作者发现StrainGE可识别低丰度菌株,并可追踪不同样本中的菌株(包括菌株混合物中的菌株)。总之,StrainGE的开发为从宏基因组数据中识别和区分低丰度的菌株提供新的方法和见解。(@九卿臣)

使用 SameStr 进行宏基因组菌株检测:识别可通过粪便移植转移的持久核心肠道菌群

Microbiome[IF:14.65]

① SameStr 通过确定物种特异性标记基因的单核苷酸变异 (SNV) 识别宏基因组中的共享菌株;② 在模拟菌株群体、健康个体的人类粪便宏基因组以及来自接受粪便菌群移植 (FMT) 治疗的复发性艰难梭菌感染 (rCDI) 患者数据上验证 SameStr;③ 与其他工具相比,SameStr 检测次优势共享菌株的灵敏度更高,检测物种特异性菌株的特异性更高,这些菌株在不相关的样本对之间不共享;④ 存在健康成人核心肠道菌群,可通过 FMT 从供体转移到 rCDI 患者。

Metagenomic strain detection with SameStr: identification of a persisting core gut microbiota transferable by fecal transplantation
03-25, doi: 10.1186/s40168-022-01251-w

【主编评语】作者开发了 SameStr,一种生物信息学工具,其能够检测宏基因组样本中共享菌株,提供了对宏基因组序列数据中共享菌株的稳健识别,具有足够的特异性和敏感性,以检查人类粪便菌群中的菌株持久性、转移和植入。作者的研究结果确定了一个持久健康的成人核心肠道菌群,且应进一步研究以阐明菌群对慢性疾病的贡献。(@刘永鑫-中科院-宏基因组)

MetaPop:探索微生物组宏观和微观多样性的工具

Microbiome[IF:14.65]

① 多功能生物信息学工具 MetaPop,由python和R编写,可通过bioconda轻松安装,可用于分析和可视化种群间(宏观多样性)和种群内(微观多样性)水平上的微生物和病毒群落宏基因组序列数据;② 该工具补充了现有的生物信息学流程,其可以要求用户修改代码、训练、查阅详细教程,并在运行流程中各步骤提供输入开展分析;③ MetaPop有完整的文档,并由开发人员在 https://github.com/metaGmetapop/metapop 上进行维护。

MetaPop: a pipeline for macro- and microdiversity analyses and visualization of microbial and viral metagenome-derived populations
03-15, doi: 10.1186/s40168-022-01231-0

【主编评语】本研究中,作者介绍了 MetaPop,这是一种开源生物信息学流程,其提供了一个单一界面来分析和可视化宏观和微观多样性水平的微生物和病毒群落宏基因组。作者将 MetaPop 应用于接受粪便菌群转移的自闭症儿童及其神经正常同龄人的肠道病毒组,发现仅在宏观层面进行分析可能会遗漏重要的生物学差异。作者表示标准化的种群和遗传变异分析对于最大限度地进行生物学推断是非常宝贵的,而 MetaPop 提供了一个方便的工具包来探索菌群中宏观和微观多样性的双重影响。(@刘永鑫-中科院-宏基因组)

通过迭代聚类评估菌群稳定性的R包

Briefings in Bioinformatics[IF:11.622]

① 通过迭代聚类 (μSTASIS) 开发菌群稳定性评估——一种用于评估以个体为中心的菌群稳定性的多功能 R 包;② μSTASIS 针对菌群数据固有个体间变异性,通过迭代生长分区聚类从单个个体获得的纵向样本之间观察到的紧密关系和特征;③ 在该框架中实现的算法和函数可以很好地处理菌群数据的稀疏和组成性质;④ 所得指标直观且独立于 β 多样性距离方法和相关系数,可估计每个菌群样本的稳定性;⑤ 该方法在 GPL-3 许可下免费提供。

Assessment of human microbiota stability across longitudinal samples using iteratively growing-partitioned clustering
02-28, doi: 10.1093/bib/bbac055

【主编评语】作者开发了一个多功能R包-通过迭代聚类评估菌群稳定性(μSTASIS),μSTASIS 中编译的算法和流程保证了对稀疏和复合数据的正确处理,且其输出易于解释,并提供了一个情景化的、直观的度量来评估时间菌群的稳定性,并得到交叉验证的支持,μSTASIS 多功能 R 包具有多个选项,可用于可视化稳定性结果并允许与元数据集成。作者希望他们的方法能够揭示不同人群中可追踪的菌群特征的新见解,并为菌群研究提供新的视角。(@刘永鑫-中科院-宏基因组)

iMeta:青大苏晓泉组发布跨平台可交互的菌群分析平台PMS

iMeta[IF:N/A]

① Parallel-Meta Suite(PMS)是一个易用的软件包,可以在多个平台上进行快速、全面的菌群数据分析;② PMS涵盖了广泛的数据预处理和统计方法,并提供最新的可视化结果;③ PMS的整个流程通过并行计算方案进行了优化,可以快速处理数千个菌群数据;④ PMS的整体计算框架主要由C++开发,该语言与脚本语言相比,拥有更快的运行速度和更高效的内存使用方式;⑤ PMS还具有多操作系统兼容、简易安装与全自动运行等特性。

Parallel-Meta Suite: Interactive and rapid microbiome data analysis on multiple platforms
03-06, doi: 10.1002/imt2.1

【主编评语】Parallel-Meta Suite(PMS),一个用于快速和全面的菌群分析的软件套件,采用了最先进的算法,涵盖序列菌群数据物种与功能解析、统计分析、可视化等一系列流程,并具有友好的图形界面,可以满足各种用户的分析需求。PMS软件的最新版本已经在GitHub(https://github.com/qdu-bioinfo/parallel-meta-suite)和Gitee(https://gitee.com/qdu-bioinfo/parallel-meta-suite)上发布,软件包中提供了测试用的演示数据集。(@刘永鑫-中科院-宏基因组)

Nature子刊:CAMI2宏基因组分析评测第二阶段成果

Nature Methods[IF:28.547]

① 宏基因组解析的批判性评估(CAMI)旨在彻底、全面、无偏地评估宏基因组分析方法,通过构建基于复杂和真实的基准数据集向群落提供挑战;② CAMI2以1,680个微生物和599个病毒、质粒构建长/短读长数据,评估了76款工具;③ 基因组组装的性能实质性提升(部分由于使用长读长数据),但组装和分箱仍易受相关菌株干扰;④ 分类工具和分箱在更高分类级别更加稳健,但在病毒和古菌上却差强人意,临床病原体检测上也需提高可重复性。

Critical Assessment of Metagenome Interpretation: the second round of challenges
04-08, doi: 10.1038/s41592-022-01431-4

【主编评语】在过去的二十年里,宏基因组学的进步极大地增加了我们对微生物世界的了解,并加强了数据分析技术的发展,这就需要对这些方法进行公正和全面的评估,以确定该领域的最佳实践和开放挑战,本研究描述了第二轮 CAMI 挑战的结果,在其中,作者评估了程序在更大、更复杂的数据集上的性能和进展,包括长读长数据和进一步的性能指标,例如运行时间和内存使用。CAMI数据集获取地址:https://data.cami-challenge.org/participate(包括金标准、基于基准数据创建的组装基因组、NCBI分类信息和NCBI RefSeq、nt和nr的参考序列集合)。(@刘永鑫-中科院-宏基因组)

宏转录组检测工具MTD实现同时分析宿主和微生物转录组

Briefings in Bioinformatics[IF:11.622]

① 宏转录组检测器 (MTD) 使用批量和单细胞转录组数据分析和关联单个样本中的宿主和宏转录组;② 可以广泛识别和量化宿主细胞中的微生物组,包括病毒、细菌、原生动物、真菌、质粒和载体,并将微生物组与宿主转录组相关联;③ 提高我们对宿主-病原体相互作用的理解,明确地了解微生物组如何促进宿主的健康和疾病,及宿主的哪些基因和途径对微生物物种引起的特定感染很重要;④ MTD 易于安装和运行,只涉及几行简单的命令。

MTD: a unique pipeline for host and meta-transcriptome joint and integrative analyses of RNA-seq data
04-04, doi: 10.1093/bib/bbac111

【主编评语】转录组通常包含宿主和相关微生物的信息,但目前仍缺少相关软件来进一步揭示两者的表达谱及相关关系。本文作者开发了可从转录组中鉴定宏转录组的工具MTD,同时提供了宿主与微生物转录组联合分析的功能,将为探索宿主与微生物在转录组层面的互作分析提供有效的工具。(@刘永鑫-中科院-宏基因组)

浙大Nature子刊:基于机器学习和并行计算的优化代谢组学数据处理方法NOREVA

Nature Protocols[IF:13.491]

① 代谢组学通过分析生物体或样品中的不同代谢物来帮助研究生理或病理过程,典型输出是对应于测量信号强度的峰值表;② NOREVA 是一种新方法,峰表要经过许多处理工作流程,这些工作流程由组合确定序列中的3~5个定义的计算组成,根据客观性能标准判断每个工作流程的结果,分析各种基准以突出这种新开发方法的独特性;③ 该方法以R包形式实现,以方便访问并保护用户的数据隐私,执行时间可能从几分钟到几个小时不等,由数据大小决定。

Optimization of metabolomic data processing using NOREVA
2021-12-24, doi: 10.1038/s41596-021-00636-9

【主编评语】浙江大学药学院和智能创新药物研究院朱峰教授团队与阿里巴巴-浙江大学未来数字医疗联合研究中心合作在Nature Protocols代谢组分析R包NOREVA。该方法采用基于机器学习和并行计算的方法,优化代谢组学信号处理策略。该方法通过大规模扫描现有的海量信号处理流程,针对用户给定的代谢组学原始数据,可以快速地优化出性能最佳的组学数据处理流程。这一方法实现了对新药开发领域常见的“时间序列”和“多分类”代谢组学问题的数据处理,对药物靶标发现、药物代谢、药物响应与疾病发生发展的病理学机制研究有着重要的价值。(@刘永鑫-中科院-宏基因组)

感谢本期日报的创作者:WK红叶,周梦情,白蓝木,刘永鑫-中科院-宏基因组,往、昔℡


点击阅读过去10天的日报:

0422 | 眼馋某些食物,是肚子里的菌在呼唤?

0421 | 贾伟+郑晓皎等NC:节食减肥易反弹,有种肠菌很关键

0420 | 郑浩团队又连发二文:蜜蜂“菌群-肠-脑轴”再突破

0419 | 免疫细胞促进肌肉再生,菌群作用不可忽视!

0418 | 磨刀不误砍柴工!9文聚焦菌群研究方法学前沿

0417 | 警惕!人工甜味剂可促使细菌产生耐药性

0416 | 9文一览IBS研究前沿:聚焦疾病机理和干预治疗

0415 | 今日Science:肠-脑轴如何调控食欲?新机制揭晓

0414 | 傅静远等Nature突破:环境因素如何塑造肠道菌群(作者专访+专家点评)

0413 | 国内团队新巧思:用“光控”工程菌,照肚皮调大脑

点击阅读原文,查看更多热心肠日报的内容

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存