推医汇

首页 > 行业动态

告别序列依赖,为你的染色体“扫码”:每条染色体竟自带独一无二的“条形码”

2026-01-21 11:06:15来源:iNature
着丝粒在表观遗传上由不同的染色质指定,而它们的DNA在物种和个体之间是不同的。这种广泛的序列差异使着丝粒之间的比较分析具有挑战性。

2025年7月3日,意大利罗马大学Simona Giunta团队在Science 在线发表题为“Chromosome-specific centromeric patterns define the centeny map of the human genome”的研究论文,该研究确定了一个跨越人类基因组的染色体特异性结构模式,由一个功能相关的着丝粒DNA基序的保守间距定义。这些位点沿染色体臂的分布构成了人类的“着丝粒图谱”。

通过使用定制的基因组着丝粒分析(GCP)管道,该研究利用基序的位置、方向和组织来构建结构模型,从而实现人类染色体簇的重新分类、着丝粒扩展的检测以及结构变异和错误组装区域的鉴定。从这种模式衍生出的高分辨率图谱不仅为跨越进化和疾病的着丝粒比较分析提供了一个框架,而且为染色体注释、组装和表征提供了一个新的维度。

着丝粒由长段高度重复和快速进化的DNA组成,仍然是人类基因组中最难解决和研究的区域之一。实验研究表明,特殊的染色质,而不是潜在的DNA,支撑着着丝粒在染色体分离中的功能。事实上,着丝粒上的DNA在大小、结构和组成上在染色体和单倍型之间以及在整个种群中都是不同的。这些固有的复杂性,加上缺乏可扩展和可靠的方法来检测如此大的重复基因座,阻碍了它们在个体和物种之间的系统研究、注释和比较。

使用一系列计算方法统称为基因组着丝粒分析(GCP)管道,在最近可用的染色体水平的人类基因组组装中以碱基对分辨率定义了CENP-B盒的位置,并计算了连续盒之间的距离。该研究在着丝粒DNA重复序列中发现了一种染色体特异性的CENP-B盒模式,尽管存在潜在的序列差异,但该模式在单倍型和个体中明显保守。

研究人员将分析扩展到整个基因组,发现所有染色体中着丝粒外的CENP-B盒的保守分布。这些异着丝粒序列(ECSs)中基序的染色体特异性基因组位置、取向、分布和组织形成了一个保守的模式,研究人员将其命名为“着丝粒图”。人类染色体的着丝粒图谱可以用于基因组组装的快速注释和表征。GCP套件提供了独特的计算工具来重新分类人类染色体簇,标记着丝粒扩增的位点,识别结构变异和错误组装区域,并执行快速读取检索和注释。该研究比较了非人类灵长类动物的着丝点模式,发现连续着丝点之间的距离值是保守的,特别是在进化相关的物种中。

总之,该研究发现了埋藏在我们基因组中的祖先基因组结构。保守的染色体特异性框架能够根据保守的功能相关基序之间的距离将DNA序列简化为数值,从而产生染色体和着丝粒的不同条形码。该研究使用这些条形码生成的GCP计算模型套件不仅可以促进对进化和疾病中的着丝粒的分析,还可以用于从原始测序reads到contigs和assemblies的快速注释。此外,染色体臂上与特定表观遗传状态相关的外着丝粒位点的鉴定和表征表明,CENP-B蛋白在着丝粒之外可能具有兼职功能。总之,该研究为理解着丝粒内外模式的进化动力学和功能意义开辟了新的途径。

 

参考消息:

https://www.science.org/doi/10.1126/science.ads3484