找回密码
 立即注册

QQ登录

只需一步,快速开始

  • QQ空间
  • 回复
  • 收藏

宏基因组测序病原微生物检测生物信息学分析规范化管理专家共识 ...

归去来兮 2021-9-22 11:11 AM 4105人围观 医学

摘要

宏基因组测序(mNGS)在新发突发传染病以及常规检验阴性的感染性疾病诊断中发挥了重要作用。近期,国内相继发表了多个共识阐述了临床应用及实验室规范,但生物信息分析程序及方法也是mNGS重要环节,而目前学界尚未有一致的认识。为提高临床对mNGS结果的理解,首都医科大学附属北京同仁医院检验科鲁辛辛教授、解放军总医院第一医学中心临床检验科王成彬教授作为通讯作者,根据国内外的发展现状,结合国内测序实验室常规做法,发表了专家共识,从数据库构建、下机数据比对、结果注释、平台及人员素质等方面提出了规范化要求。


常用的生物信息学名词


1、序列及读长

序列:文库在高通量测序设备上进行测序,得到的碱基序列称为序列。


读长:序列的读长是影响分析准确度的重要因素,最大读长取决于所选的测序平台。


序列数:通常在检测报告中显示的序列数为该物种属或种特异序列条数。


2、原始数据

原始数据:一次测序产生的没有经过任何过滤的全部测序结果称为原始数据。高通量测序下机的原始数据经信号转换后得到含常规碱基(A、T、C、G等)及对应碱基测序质量信息的数据,通常包括接头序列、标签序列、测序数据,以fastq格式存储。


3、可用数据

可用数据:可用数据是原始数据经过处理得到的直接用来分析的数据。原始序列数据经质量过滤,去除接头序列、标签序列后,得到的可用于比对的序列称为可用数据,包含人源及微生物序列。


4、物种相对丰度和绝对丰度

相对丰度:指注释到该物种的序列数占样本中所有微生物总序列数的百分比。


绝对丰度:指注释到该物种的序列数占总数据量的百分比。


5、基因/基因组覆盖度和平均测序深度

基因/基因组覆盖度:指测序获得的序列与某物种的参考基因/基因组进行比对,序列覆盖的区域占基因/基因组总区域的比例。


平均测序深度:将能与基因/基因组比对上的序列碱基数累加并除以基因/基因组被覆盖区域的总长,即为平均测序深度。


6、碱基质量值(quality,Q)20及Q30

邀请
来源: 原博士带你做检测 | 作者 :原博士
我有话说......