数据库和置信度选择影响微生物物种分类的准确性
发布时间:2024-08-26
点击量:
【字体:大 中 小】
题目名称:Impact of database choice and confidence score on the performance of taxonomic classification using Kraken2
作者:Yunlong Liu1, Morteza H. Ghaffari2, Tao Ma1 , Yan Tu1
刊物名称:aBIOTECH
发表年份:2024
摘要内容:
实现复杂环境中微生物物种组成的准确鉴定是一项极具挑战性的工作。Kraken2作为目前物种分类注释的首选工具之一,其参考数据库和置信度的参数选择直接影响kraken2物种注释和丰度水平,进而影响研究结果的可靠性。本研究发现使用较小的参考数据库时,随着置信度的增加,能够被分类的序列显著降低;而使用较大的数据库时,分类率受置信度的影响较小。选择较大的参考数据库,随着置信度的增加,减少了假阳性物种的出现,物种分类的准确度和F1评分都得到显著提高;召回率基本不会受到置信度的影响。但置信度得增加会显著影响物种相对丰度的波动,置信度越高,注释到物种丰度与真实丰度差异越大。所以,在使用kraken2进行物种注释时,建议使用更全面的参考数据库(standard、nt和GTDB数据库),并结合适度的置信度(0.2-0.4)来提高分类的准确性和灵敏度。

原文链接:https://doi.org/10.1007/s42994-024-00178-0