推医汇

首页 > 行业动态

二代测序NGS的质量评分Q Score的意义和来源

2023-12-21 16:25:32来源:潇湘生物诊断谈
在二代测序NGS技术中,结果的质量评分Q Score是衡量测序成功的关键参数,那结果的质量评分Q Score有什么意义?它究竟是怎么得到的?本文今天介绍这些内容,供大家参考,以便更好理解NGS的结果。

1、什么是质量评分Q Score

质量评分Q-score是对碱基读取中出错概率的预测。高质量分数意味着碱基读取更可靠,不太可能出错。例如,对于质量评分为Q40的碱基读取,预测每10000个碱基读取中就有一个是不正确的。对于质量评分为Q30的碱基读取,预测每1000个碱基读取中就有一个是不正确的。下图为碱基读取质量评分与其对应的错误概率之间的关系。

 

 

2、质量评分Q Score是如何产生的?

在测序运行期间,为每个簇、每个tile和每个测序循环的每个碱基读取指定质量评分。每个碱基读取的质量评分计算有两步过程:

①对于每个碱基读取,计算多个质量预测器值。质量预测器值是簇的可观察特性,碱基读取从这些簇中提取得到。这些特性包括强度分布和信噪比,用于测量碱基读取可靠性的各个方面。从经验上来说,它们已经确定为与碱基读取的质量相关。

②质量模型,也称为质量表或Q表,列出质量预测器值的组合,并将它们与相应的质量评分相关联;这种关系是通过使用经验数据的校准过程来确定的。为了估算出新的质量评分,首先为新的碱基读取计算质量预测器值,并将其与预先校准的质量表中的值进行比较。

质量评分记录在碱基读取文件(*.bcl)中,该文件包含每个循环的碱基读取和质量评分。然后将质量评分转换为编码compact形式的FASTQ文件(*.FASTQ)。

 

3、质量表是如何被校准的?

校准是一个从经验数据中得出统计质量表的过程,其中包括在许多仪器上测序的各种表征良好的人类和非人类样本。使用Phred算法的修改版本,使用原始信号的特性和通过将reads与适当的参考对比而确定的错误率来开发和改进质量表。

 

4、为什么质量表会改变?

产生质量评分的表通常在测序平台的重要特性发生变化时更新,例如新的硬件、软件或化学版本。例如,测序化学的改进可能需要重新校准质量表,以准确地对新数据进行评分。

 

参考:illumina Technical Note: Informatics: Understanding Illumina Quality Scores