此次发现,基因起始点之后的前100个碱基对比偶然发生突变的概率高出35%。这些序列是细胞机制开始将DNA复制成RNA的起点,因此是基因组中功能最重要的区域之一,与蛋白质编码序列同等重要。这些序列极易发生突变,是整个人类基因组中功能最重要的区域之一。
研究显示,许多额外的突变发生在受孕后的最初几轮细胞分裂中,这些突变被称为镶嵌突变,即只出现在某些细胞中,而非所有细胞。这也是这些突变热点长期以来未被发现的部分原因。父母可能携带这些镶嵌突变而无症状,因为突变仅存在于某些细胞或组织中,但这些突变仍可能通过卵子或精子传递给后代。如果孩子所有细胞都携带该突变,就可能导致疾病。
团队通过对英国生物库中15万个人类基因组和7.5万个基因组的转录起始位点进行分析,并与11个独立家族研究中的镶嵌突变数据进行比较,发现了这一现象。而许多基因的起始位点发生了异常多的突变,尤其是与癌症、脑功能和肢体发育缺陷相关的基因起始点受影响最为严重。
当观察更古老、更常见的变异时,这种额外的突变现象减少,表明自然选择正在过滤掉这些有害突变。换句话说,那些基因起始位点带有突变的家族,尤其是与癌症和脑功能相关的基因,更不容易将这些突变遗传下去,经过几代人这些突变逐渐消失。
目前,遗传学家使用突变模型来判断在基因组特定区域如果没有特殊情况时,预计会出现多少突变。临床上,该基线用于确定哪些变异应被关注,哪些应被优先考虑。然而,如果模型不知道自然突变热点,就可能得出错误结论。例如,模型可能预期某个区域有10个突变,但实际上观察到50个,而正确的基线可能是80个,这一盲点正是此次突破的重点。