DNA 分子编码技术是一种可控的DNA自组装技术,通过结合荧光分子标记可实现荧光检测信号的精准调控,可在有效避免荧光基团间的光谱重叠问题的同时显著提高检测或成像中的多路复用性。在常规的四通道荧光显微镜中最多只能同时实现3种标志物的鉴定分析(1个通道用于细胞核定位,另外3个色彩通道分别用于3种标志物分析),无法实现十多种标志物的有效鉴定。而 DNA 分子编码技术可大大提升多靶标同时分析的能力,结合常规的四通道荧光显微镜有望实现对几十甚至上百种靶标的同时鉴定分析,从而满足肿瘤多重标志物检测的技术需求。鉴于此,本文总结了当前空间多组学在儿童肿瘤研究中的应用及DNA编码技术用于多重分析的原理和案例,并进一步提出当前的技术瓶颈和未来的发展策略,旨在推动DNA编码技术在儿童肿瘤多重靶标精准诊断中的应用。
1、空间多组学在儿童肿瘤研究中的应用
肿瘤的空间异质性极强,在同一肿瘤内部,可能存在多种不同的肿瘤细胞克隆亚型。这些亚型会与肿瘤微环境中的免疫细胞、成纤维细胞等发生相互作用,进而在空间排列和分布上呈现出显著差异。1958年克里克提出了中心法则,1970年特明补充了中心法则,从而明确了DNA、RNA和蛋白质的关系,而以这三者为靶标的疾病诊断,恰恰成为了现代分子诊断的基石。随着精准医疗及大数据时代的到来,单个或少数几个靶标的检测已经远远无法满足临床需求,全面而综合的检测分析成为必然的选择,而组学应运而生,围绕“中心法则”的四大组学成为精准分子诊断的基石。近十年来,组学研究进一步细分,诞生了单细胞组学、功能组学、空间组学、定量组学,以及针对甲基化、糖修饰等多样化的组学研究,而他们也需要多样化的技术手段予以支撑。随着组学技术的发展及对组学数据的深刻理解,包括基因组学、转录组学、蛋白质组学、表观转录组学等在内的多组学技术手段极大拓展了有效数据量,在解决肿瘤等重大疾病精准诊断问题方面已经表现出了巨大的价值。
1.1、空间转录组在儿童肿瘤研究中的应用
空间转录组技术是结合成像、生物标记、测序及生物信息学等工具对基因表达进行空间定位的一项技术。在各类相关技术中,空间条形码方法凭借空间条形码寡核苷酸阵列来捕获组织里的RNA,使得 RNA 序列能够与其空间位置一一对应,这一方法目前应用最为直接、全面且广泛。有研究报道,多重抗误差荧光原位杂交技术(MERFISH)能够在单细胞水平上实现具备空间分辨能力的高度多重化RNA分析。MERFISH利用特定的荧光探针识别并结合RNA靶向序列,并对每一个特定的读出序列组合进行编码、顺序成像,同时还构建了一个纠错策略,提高转录检测的准确性,突破了传统多重免疫荧光原位杂交的技术局限,极大地提高了检测通量。而基于测序的空间转录组技术,涵盖数字空间分析(DSP)、10× Visium等技术。DSP运用探针原位杂交及抗原-抗体互作的方式来检测原位基因表达,能够针对单一切片中的特定区域展开研究,不仅精度高,对样本造成的损伤也较小。10× Visium作为高精度、高通量的空间转录组技术,将切片放置在空间基因表达玻片上,mRNA会被玻片上的探针结合并捕获,之后逆转录为互补DNA再进行测序,由此获取相应的位置信息。该技术精准且高效,可从完整组织中获取完整的转录组信息,并且能够与免疫组化等技术联合使用,全面揭示肿瘤的空间特征。
借助空间转录组技术,研究人员得以深入探究多种肿瘤的发病机制。举例来说,一项针对神经母细胞瘤的研究,通过生成空间转录组数据,分析了高危与低危神经母细胞瘤组织,发现桥接态和连接态主要出现在高危肿瘤中,这些状态的肿瘤细胞常与癌相关成纤维细胞和肿瘤相关巨噬细胞共定位,表明两类细胞通过近距离相互作用维持高危细胞状态,进一步说明微环境在促进神经母细胞瘤细胞可塑性和恶性进展中的关键作用。有研究报道,通过空间转录组学和单细胞转录组学等技术,发现儿童神经母细胞瘤微环境中配体分子 CD112/CD155 表达存在异质性,它们通过与γδT 细胞上受体分子 DNAM-1 相互作用,决定了 γδT 细胞的肿瘤杀伤活性,并且通过单细胞转录组学还将神经母细胞瘤浸润γδT 细胞细分为三类不同的功能亚群,发现了神经母细胞瘤中一类终末阶段且免疫功能受损的γδT 细胞,为开发新的神经母细胞瘤免疫疗法提供了理论依据。
1.2、空间蛋白组在儿童肿瘤研究中的应用
空间蛋白质组学是指大规模地对蛋白质在亚细胞尺度上进行定位和定量分析的研究,是蛋白质组学的一个重要分支,也是当前及未来最具研究价值的领域之一,在探究蛋白质组的复杂结构与功能方面(如单细胞变异、动态蛋白质易位、相互作用网络改变,以及蛋白定位改变等)扮演了不可或缺的作用。目前空间蛋白质组学的研究主要包括基于质谱的细胞器分析法和基于成像的蛋白质定位法。基于质谱的空间蛋白组技术主要包括成像质量流式细胞术和多离子术成像技术,核心原理为通过在亚细胞水平上的梯度离心等技术分离并富集目标细胞器,再利用质谱开展空间蛋白质组学分析,这种方式可以同时检测多达100种靶标蛋白,实现对蛋白质翻译信息的空间定位,目前已在肿瘤微环境中肿瘤细胞和免疫细胞的蛋白组学研究中得到应用。基于成像的蛋白质定位法中最具代表性的是由美国阿科亚生物科技公司推出的CODEX技术,其优势在于可以达到单细胞级分辨率,进而获得空间单细胞蛋白图谱,不过,受限于荧光基团数量及循环效率,能够检测的靶标数量有限,检测上限为50个。
有研究回顾性分析了 234 例患者样本,利用压力循环技术及标记定量质谱采集技术对其样本进行蛋白质组学测定,并对鉴定到的 10426 种蛋白质进行分析,发现儿童青少年甲状腺乳头状癌组中上调显著的蛋白质与主要组织相容性复合体Ⅱ类和免疫紧密相关,且CD8+T 细胞和巨噬细胞在肿瘤样本中增加,该研究团队通过 Cox 比例风险模型和随机生存森林算法,开发了5个预测模型,其中基于蛋白质特征的模型预测复发的准确率高达 88.24%,可将患者分为高或低复发风险组,为临床决策和个体化治疗提供参考。
1.3、空间代谢组在儿童肿瘤研究中的应用
空间代谢组学能够反映组织中不同代谢物的空间分布,揭示分子水平之间的相互作用网络,识别并开发有效的生物标志物。其中,质谱作为经典分析技术之一,可多重分析蛋白质天然产物和代谢衍生物。由于经典的质谱方法不能提供空间信息,因此采用不同的电离方法开发了基于质谱的成像策略,包括基质辅助激光解吸/电离质谱、解吸电喷雾电离和二次离子质谱。利用冰冻组织切片等常见病理学资源进行空间代谢组学和调控组学研究能够获取关键代谢物和代谢途径的空间分布信息。基于质谱成像技术的空间代谢组学已经广泛被用于解析肿瘤微环境中的代谢物空间异质性,且由于其能够快速、低成本处理批量样本的能力,它将有潜力成为可应用于大规模队列中免疫表型检测的下一代工具。通过对这些方法的升级和结合,可以对细胞和组织中的多种代谢物(包括小分子、脂质、肽、有机化合物和元素离子)进行检测、定量和绘制图谱,进一步提高了对复杂样品中代谢物的分离和鉴定能力,使其在空间代谢组学探究代谢物的空间分布、相互作用网络及生物标志物开发等各个环节突出应用价值。
有研究显示,采用纳米颗粒增强激光解吸/电离质谱技术对脑干胶质瘤放疗期间的代谢物进行静态和动态快照分析。基于代谢物构建的诊断模型可准确区分患者和健康对照,诊断准确率高于传统的磁共振成像影像信息等检测方法;构建的七特征预后模型能根据风险评分将患者分为高风险组和低风险组,两组患者的中位生存时间存在显著差异。此外,研究还发现代谢物的变化与肿瘤体积变化密切相关,可通过代谢物快照预测肿瘤体积的增减。另一项研究报道,通过空间代谢组学对移植胶质母细胞瘤的小鼠脑组织进行分析,发现肉豆蔻酰基肉碱、棕榈酰基肉碱和硬脂酰基肉碱等酰基肉碱在肿瘤边缘的强度明显高于肿瘤内部,而三磷酸腺苷则呈现相反的分布趋势;同时,血管内皮生长因子和血红素的区域与酰基肉碱分布的核心区域存在一定对应关系,揭示了胶质母细胞瘤内部和边缘有不同的代谢模式,有助于深入理解肿瘤代谢特征。
1.4、空间多组学在儿童肿瘤研究中的应用前景
多样化的组学研究需要多样化的技术手段支撑,目前,在基因组学和转录组学中被广泛使用的组学技术是测序技术,通量高是其优点,但灵敏度低、成本高等问题也制约着其临床的应用。在蛋白质组学和代谢组学中被广泛使用的质谱技术同样具有自己的优缺点和适用范围。从整体视角而言,空间多组学为肿瘤研究开辟了全新维度,助力研究者们深入探究肿瘤的发生、发展机制。它突破了传统一维数据的局限,升级为二维空间数据,甚至开启了三维空间探索,致力于揭示肿瘤微环境的相互作用,极大地推动了肿瘤的精准分型与精准诊疗。空间多组学技术能直观呈现肿瘤内部的空间位置,借助转录组、蛋白组等高通量分析手段,精准解析肿瘤微环境的空间排列特征,立体式地剖析肿瘤的空间异质性,全方位展现肿瘤细胞与免疫细胞的功能状态差异,以及它们相互作用的内在机制。近期,不少研究尝试将多种空间组学技术融合,以挖掘更多肿瘤奥秘,如RAVI等综合运用空间转录组学、空间代谢组学和蛋白质组学方法,对胶质母细胞瘤展开研究,成功揭示了该肿瘤的基本特征,确定了以免疫和代谢应激因素为标识的微环境,阐明了局部区域肿瘤与宿主之间的相互依赖关系。
因此,空间多组学在深入理解肿瘤发生发展机制、助力肿瘤精准诊断、指导肿瘤个性化治疗及预测肿瘤预后等方面具有广阔的应用前景。空间多组学可同时分析肿瘤细胞的基因组、转录组、蛋白质组等多层面信息,明确肿瘤细胞内基因突变、基因表达变化与蛋白质功能改变的关联,全面揭示肿瘤发生的分子机制。还能解析肿瘤微环境中不同细胞类型间的相互作用,如免疫细胞与肿瘤细胞的动态关系,了解免疫逃逸等过程的发生机制。进一步通过分析空间多组学数据,可挖掘出肿瘤特异性的分子标志物组合,提高早期肿瘤的检测灵敏度和准确性。还能依据肿瘤细胞的空间分布及分子特征,实现更精准的肿瘤分型和分期,为后续治疗方案的选择提供更精确依据。
2、DNA编码技术
DNA是生物遗传信息的载体,同时也是具有高度的序列可设计性、可编程性且易于合成的一类生物材料,在模块化构建复杂、精确的静态结构与DNA的动态、可控自组装设计等方面具有独特价值。DNA把遗传指令储存在由四种碱基组成的序列中,序列中腺嘌呤A、胸腺嘧啶T、鸟嘌呤G、胞嘧啶C沿着骨架排列。单链DNA总会自动组装成双链,而且方式可预测:A与T配对,G与C配对。含有A、T、C、G碱基的脱氧核糖核苷酸四种单体可以按照人们的设计任意连接在一起,从而形成一条序列完全可控可调的大分子链。因为这样的独特性质,运用DNA严格的碱基互补原则,通过合理的设计,可以让DNA按照预期组装成特定的形态,其拼装而成的功能材料具有分子结构精准可控、组装过程精确高效、材料功能精确可调的优势,是精准创制功能材料的理想分子体系。其高度可编程性为研究人员提供了巨大的设计空间,也为分子编码的精准控制提供了底层基础。基于上述特性,“DNA条形码之父”Paul Hebert教授受商品条形码的启发提出了DNA条形码的概念。
2.1、DNA编码的技术原理
目前,国内外诸多顶尖课题组均将目光投向DNA 分子编码技术,并发展了热力学调谐色彩编码、荧光各向异性色彩编码等多样化的DNA 编码技术,并已有部分成果在疾病标志物的多重分析等方面进行了应用探索。在各类DNA编码技术中,以杂化链式反应(HCR)和滚环扩增技术(RCA)为核心的编码原则最为广泛应用。HCR的概念最早由Dirks和Pierce教授提出,可以仅由目标分子引发若干DNA茎环结构发生级联反应产生具有切口的长链DNA片段,实现目标分子的信号放大。另一方面,RCA是一类以环状 DNA 或 RNA 作为模板的恒温扩增技术,不同的扩增方式与产物特性可赋予滚环扩增产物不同的性质。例如基于RCA发展而来的序列编码扩增子技术(SeqEA),在该技术中,RCA 扩增产物通过热力学调谐的方式被红、绿双色荧光进行编码。得益于红绿荧光比例的显著区分,SeqEA 技术在细胞内实现了对9个靶标RNA的同时原位成像。
2.2、基于DNA编码的多组学分析
发展至今,通过结合DNA条形码技术的高度可编程性,荧光编码技术在靶标多重分析领域的价值已取得广泛关注。利用DNA 编码技术的高容量,可以实现转录组RNA 的体外可视化,这对基因表达和揭示疾病机制至关重要。CAO等搭建起由多级DNA 分支组装编码的荧光纳米梯,开创了目标转录本自引发扩增编码成像策略。这一策略成功解决了外加引物引发的非特异扩增难题,打破了光谱通路的限制,得以在单细胞内同时对多种转录本进行特异性成像分析,该设计的关键在于具备核酶活性的环状探针及灵活可编程的分支条码。此外,研究团队通过对不同乳腺细胞系里多种转录本开展同时成像分析,揭示出癌症相关靶标基因和癌症进程之间可能存在的联系,且这种方法能够借助增加检测通道数量,以及增多分支条码上编码区的重复次数,进一步拓展实现超高多重的成像分析。WEI等构建了一种多重抗错组合荧光标记编码方法,称为荧光团编码纠错标记(FluoELs),能够在具有纠错能力的活细胞中实现多重miRNA成像。FluoELs包括用于编码的比例双荧光团和用于纠错定量的恒定定量单荧光团,可以准确量化和空间分辨9种与乳腺癌相关的miRNA。
在DNA完成复制、RNA完成转录后,核酸里的部分碱基会通过共价键的形式连接上甲基、羟甲基、醛基等基团。大多数情况下,这些核酸修饰并不会对经典的沃森-克里克碱基配对(A:T、A:U和C:G)产生影响,但它们能够借助多种途径,对核酸的构象、组装过程及功能加以调控,进而对基因表达产生作用,因而被称为表观遗传修饰。有研究报道,综合运用化学酶法标记技术、动态DNA纳米技术及基于微流控的单细胞技术,开创了DNA编码识别分析的新策略,构建了一系列单细胞核酸修饰扩增成像方法,实现了对单细胞核酸修饰多层次特征的准确测量。具体来说,通过特定的DNA 编码反应,将非序列靶标的特征巧妙地转变为对应的 DNA 条形码,这些条形码随即触发原位扩增反应。在此基础上,研发出 DNA编码扩增荧光原位杂交这一实验方法,从而实现了高灵敏度与高特异性的荧光成像效果。另一种方法是碱基编码扩增荧光原位杂交,该方法能够对单细胞中低丰度的核酸修饰位点进行可视化和定量分析。
此外,空间蛋白组学成像技术能够靶向多种标记物,分析亚细胞位置、细胞表型、细胞内的活性信号传导或其他过程(状态)、细胞与细胞之间的相互作用或与细胞外基质或更大规模的空间组织结构。因此,可以使用多重蛋白质成像技术研究肿瘤特征。以基于交换反应信号放大的免疫染色技术为代表,利用短链DNA 编码的抗体及具有多重重复序列的HCR串联体,通过反复的“成像-置换”循环,可对单个细胞上 3× n 个(每个循环成像3个蛋白,共成像 n 循环)蛋白进行成像分析,通过预先可编程和可调的荧光信号进行高度复杂的可视化。此外,通过简单的核酸结构设计,发展了变色荧光条形码(CCFB),实现了多重标签。基于顺序的toehold介导的链置换反应,CCFB的发射颜色可以按照预定设定的顺序改变,研究设计中只需要14个寡核苷酸就可以开发出27种不同的CCFB标记。当CCFB与抗体结合时,CCFB可用于同时检测细胞内蛋白质。
3、DNA编码技术在空间多组学分析中的挑战
空间多组学在肿瘤研究领域展现出巨大潜力,但目前其发展仍面临一系列严峻挑战。这些挑战主要涉及技术分辨率、数据解析及标准化应用等方面。(1)分辨率瓶颈:尽管有部分技术能实现亚细胞级分辨率,然而在技术层面仍存在局限,难以在细胞内部或者更精细层面提供高分辨率数据。这就可能致使在某些情况下,难以捕捉到细微的空间变化及细胞亚群间的微小差异。(2)数据处理与解析难题:空间多组学方法会产生海量数据,这对计算能力及数据分析工具提出了极高要求。数据的整合、去噪、归一化及解读等流程极为复杂,需要专业的计算生物学知识作为支撑。即便空间组学能够获取分子的空间分布信息,但要阐释这些分布与细胞功能、相互作用及生物学意义之间的关联,依旧是个棘手的问题。(3)技术标准与应用困境:当下空间多组学方法众多,却缺乏统一的标准化规范,这使得不同实验室的研究结果难以进行比较,严重制约了技术的可重复性和可比性。此外,高昂的成本及对组织类型的强依赖性,也极大地阻碍了该技术的广泛推广。展望未来,空间多组学的发展重点将聚焦于攻克上述挑战,以此提升技术的可靠性、准确性和实用性。通过充分整合空间位置、多组学信息及临床治疗信息,完整呈现肿瘤发生发展的动态进程,精准挖掘肿瘤治疗的潜在靶点,为肿瘤个体化精准诊疗开辟全新路径。
另一方面,尽管DNA 编码技术已被成功应用于单细胞空间组学分析,但其核心理念在操作性等方面仍有广阔的提升空间。其一,该技术的实验操作较为繁琐,需要进行多轮成像。由于荧光分子间的光谱重叠这一固有限制,单轮成像通常只能区分3~5种靶标。其二,多次成像不仅耗时,还容易导致细胞结构变形和信号失真,从而影响空间信息的准确性。因此,仍需要突破性的理念与技术以更好地实现对单细胞空间组学的分析。此外,需要考虑对肿瘤标记物的选择、抗体的验证、细胞分割的范围、选择细胞表型的意义、识别与临床相关的空间特征等因素。如果同时需要包含标记细胞外和细胞内的生物标志物,甚至可以绘制整个信号通路之间的关系。由于缺乏对肿瘤组织进行单细胞和深层表型分析的可靠方法,还需要对DNA编码技术进行更深入的研究与探讨,尤其是对于人类样本的分析。在未来期待单细胞分辨、多重靶标和多模态成像综合应用,可以让研究者们更深入的了解肿瘤发生、发展的机制,为提供更多的潜在诊疗方法提供有力参考。
4、小结
本文综述了空间多组学及DNA编码技术在儿童肿瘤研究中的应用。空间多组学方法作为近年来生命科学领域的革命性技术,突破了传统组学研究中 “脱离组织空间背景” 的局限,能够在肿瘤组织的天然微环境中,以亚细胞级别的超高分辨率同步解析基因、RNA、蛋白质、代谢物等多种分子分析物的空间分布特征与动态互作关系。这种技术特性使其特别适用于儿童肿瘤研究,因为儿童肿瘤多为胚胎源性肿瘤,其细胞异质性极强,且肿瘤细胞与周围微环境(如神经细胞、免疫细胞、血管内皮细胞)的空间关联直接影响疾病进展与治疗响应。与此同时,DNA 编码技术的引入为儿童肿瘤的多重靶标分析提供了强大工具。该技术通过为每一种检测探针(如抗体、核酸探针)赋予独特的 DNA 序列标签,实现了对成百上千种生物分子的同步检测,而这一优势在儿童肿瘤研究中尤为关键,因为儿童肿瘤样本往往体积微小(如穿刺活检组织),且罕见亚型众多,传统单靶标检测难以充分挖掘样本中的生物学信息。
未来可以进一步在成像通量、成像分辨率、图像智能识别等方面进行更深入的研究。具体来说,在成像通量方面,通过采用不同的编码策略可以提高现有成像技术的多路复用能力。理论上,大致可以分为两类。一种简单的策略是增加荧光基团的类型,另一种策略是开发更多发夹HCR介导的荧光编码,突破现有的2位或4位编码的限制,进一步可提升至6位、8位编码等,从而提升成像通量。在成像分辨率方面,未来在硬件设施上,可以采用超分辨激光共聚焦显微镜等分辨率更高、成像效果更好的仪器设备对空间组学靶标进行荧光成像,以获得清晰的高质量图像。在技术手段上,将随机光学重建显微技术等技术手段与常规的激光共聚焦显微镜结合使用,并对荧光标记分子进行相应的调整,从而达到对单细胞空间组学进行超分辨成像分析的目的,改善成像结果质量。在图像智能识别方面,未来可以进一步引入机器视觉技术和无监督学习图像技术,实现荧光图像的智能识别、智能划分与智能颜色分类,提高数据分析效率与准确度。
综上所述,空间多组学技术通过保留组织空间背景与提升分辨率,揭示了儿童肿瘤复杂的分子空间网络;而DNA 编码技术则通过突破多重检测的瓶颈,实现了对微量样本中多维度生物信息的高效捕捉。两者的协同应用,不仅推动了儿童肿瘤发病机制的深入解析,更为精准分型、预后评估及靶向治疗策略的开发奠定了重要基础。