病原宏基因组检测(metagenomics next generation sequencing, mNGS)通过对临床样本中提取的总核酸进行无偏倚的鸟枪法测序,测序结果首先过滤人源序列,再和已知的微生物基因组数据库进行比对,汇报样本中的微生物属种和序列数(最佳比对或严格比对到某微生物属/种的核酸片段数)。2014年,加州大学旧金山分校(UCSF)的Charles Chiu团队首次采用高通量测序技术(NGS,Next Generation Sequencing)成功地对一位患有联合免疫缺陷综合征,由钩端螺旋体引起脑膜炎的临床患者提供病原学诊断和治疗[1],随后,针对病原微生物的metagenomic Next Generation Sequencing(mNGS)检测技术逐渐在临床广泛应用,尤其是针对免疫抑制感染患者的诊断[2]。
因为mNGS的无偏倚特性,理论上样本中所有微生物的核酸都可以检测,因此mNGS可以实现一万种以上病原微生物(细菌、病毒、真菌、寄生虫)的鉴定,具有常规靶向病原学检测(微生物培养、抗体/抗原、PCR)所不具备的广覆盖优点。但正是由于这种特点,在样本采集、运输、湿实验等过程中引入的外源微生物或其核酸的污染(exogenous microbial contamination)会对mNGS报告和解读造成干扰。即便采用规范化的全流程无菌操作(无活体微生物),外源微生物的核酸污染依然存在[3]。此外,人体开放性部位的标本(比如口咽拭子、痰液、肛周拭子等)中往往存在大量条件致病微生物的定植和共生,如何对微生物的定植和感染进行判别,从而明确责任病原体,是mNGS结果解读中需要注意的另一个重要问题[4]。本文对mNGS结果解读的相关要求作探讨。
一、常见外源微生物污染和过滤方法
外源微生物污染主要有两大来源:环境微生物和试剂工程微生物。前者主要来自样本采集、运输、湿实验流程中引入的微生物或其核酸(比如经皮穿刺,即使对穿刺部位充分消毒,但皮肤表面已死亡的微生物及其核酸依然有可能在采集过程中被引入,如表皮葡萄球菌、痤疮丙酸杆菌、棒状杆菌属等;此外,实验中使用的容器、器械和环境中可能含有多种微生物或其核酸。另一方面,试剂工程微生物主要来自湿实验过程中的各种工程酶和缓冲溶液(酶主要在细菌表达体系中生产和纯化,制备过程中不可避免会引入微生物核酸)。总体来说,无核酸(nucleic acid-free)的实验过程是极难实现的,因此外源微生物的污染无法完全避免,但可以通过多种手段进行监控和过滤,比如在实验中加入阴性对照样本,与临床样本同步进行核酸提取、建库、测序和分析,从而识别试剂工程背景微生物,建议在使用纯水或PBS缓冲液作为阴性对照的同时,采用与临床样本具有相同或相似理化性质的模拟/真实样本进行平行检测,最大程度的对实验环节中的背景微生物进行过滤。另一方面,实验室需要建立分级微生物数据库,至少应该包括:a) 人体不同部位的共生微生物数据库,比如上/下呼吸道、皮肤、生殖消化道的定植微生物(鲜有或没有致病报道);b) 人体不同部位的条件致病微生物数据库(在不同宿主中有可能定植,有可能感染);c) 绝对致病微生物数据库(健康人群中不存在定植,致病性明确)。
二、污染和定植的解读
对微生物共生和定植的解读需要考虑标本采集部位和宿主免疫状态。比如免疫正常患者的呼吸道样本中检测出非结核分枝杆菌,一般考虑定植,而长期吸烟、COPD、支气管扩张或免疫抑制患者检测出非结核杆菌,应考虑感染。同理,如果肺泡灌洗液中检出惠普尔养障体(惠普尔病的病原体),在解读报告时,应结合患者临床信息,考虑是否患有肺部基础疾病,CT影像是否符合放线菌感染(粟粒样结节、肉芽肿等),是否合并其他微生物感染(比如结核分枝杆菌)等,对惠普尔养障体的致病性进行综合评估。
三、微生物汇报阈值
mNGS汇报微生物的阈值通常基于序列数(reads)或根据测序数据量标化后的序列数(RPM,reads per million reads,相对于每百万条序列的数值)进行设定。然而,鸟枪法宏基因组测序的原理是对文库中的核酸进行无偏好性的等比例抽样(unbiased proportional sampling),最终测序的片段占文库中所有核酸片段的千分之一甚至更低,因此mNGS对样本中微生物的检测性能取决于两个因素:人源核酸含量与病原核酸含量,人源核酸含量越高,微生物的检测性能越差。人源核酸含量高的样本中,含量相同的微生物reads数或RPM会低于人源核酸含量低的样本。因此单纯通过reads数或RPM作为检出微生物的汇报阈值可能存在一定的问题。举例说明:脓肿抽液(通常人源核酸含量较高)和脑脊液(通常人源核酸含量较低)在提取建库后都测得10M reads(一千万条序列),假设两份标本中都含有金黄色葡萄球菌,序列数均为100。因为前者的人源核酸含量远大于后者,虽然金葡的序列数相同,但金葡在脓肿抽液中的实际含量要远大于脑脊液。因此,reads数或RPM不应作为mNGS汇报阈值的唯一标准。建议在不同类型样本中加入已知含量的内参定量核酸(internal quantitative reference),既可以对提取建库流程进行质控,也可以对样本中的人源和微生物核酸进行相对定量,可以使用相对定量的数值进行微生物汇报阈值的设置(同类样本中的相对定量数值可以直接比较,而序列数不可以)。
四、阳性结果的解读
对绝对致病,或致病性明确的微生物而言,阳性检出一般认为是责任病原体,比如腺病毒、冠状病毒、结核分枝杆菌、利什曼原虫等。这里需要注意的是,样本间的交叉污染可能会导致假阳性,比如建库流程中的PCR扩增,有可能造成气溶胶污染,尤其当并行测序的某个文库中含有较高丰度的微生物时,气溶胶污染会更加显著。需要在实验和生物信息分析环节对可能的交叉污染进行质控和过滤,每次实验后需要严格执行实验室清洁和通风。在建库方法的选择上,可以考虑采用无PCR扩增的建库技术(PCR-free library preparation),最大程度降低PCR气溶胶造成的影响[5]。相比之下,条件致病微生物的阳性检出并不代表致病,临床解读必须结合样本、微生物特点,以及患者信息进行综合评估,包括样本采集部位、宿主基础疾病、免疫状态、抗生素使用和耐药信息、常规病原学检测结果等。
五、阴性结果的解读
mNGS与传统的病原学检测(比如微生物培养)相比,具有覆盖广、检出率高的优势。以外周血检测为例,常规血培养的阳性率低于10%,而mNGS的阳性率一般在30-40%左右。然而,在临床怀疑感染而mNGS检测结果为阴性时,需要考虑以下因素:a) 患者症状由非感染性因素引起。以不明原因发热(FUO)为例,致病因素可以大致分为四类:感染性疾病、非感染性炎症、肿瘤和其他疾病。当mNGS结果为阴性时,需要考虑非感染性疾病的可能性;b) 送检样本不合理,未遵循靠近病灶部位取样的原则(比如肺部感染送检外周血),或检测项目选择不正确(比如RNA病毒感染,但只进行了DNA测序);c) 样本人源核酸含量过高,造成假阴性,不同样本中的人源核酸含量不一样,以肺泡灌洗液(每毫升中有核细胞数为10^5个)和外周血(每毫升中有核细胞数为(4 ~ 10)×10^6个)为例,计算其在25M reads下含不同微生物拷贝数时的检测灵敏度。结果显示,如要达到87.5%以上的灵敏度,每毫升BALF中至少需含有10个目标拷贝数,而每毫升血液中至少需含有400个目标拷贝数。(mNGS理论最低检测限计算方法:假设环境中所有核酸的长度为G,检测其中片段的大小为M,将基因组随机打断,从里面抽取一条序列,正好来至于待检片段的概率为M/G,抽取n条序列,至少有一条序列来至于待检片段的概率为1 - (1-M/G)^n。假设环境中所有的核酸由k个不同基因组大小Gk的片段组成,每个基因组在环境中的拷贝数为Ck,假定待检片段M=C0G0,环境中总核酸G=∑ Ci Gi。当样本中含有高背景人源DNA时,G≈背景基因组大小乘以背景细胞拷贝数=C1G1。检测n条序列其中包含1条以上目的片段的敏感性为:1 - (1-M/G)^n =1 - (1-C0G0/ ∑i=1,k CiGi)^n ≈ 1 - (1-C0G0 / C1G1)^n)。