立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 1631|回复: 0

[分享] Nature 年度技术 生命科学下个风口:空间多组学技术(上)

[复制链接]
发表于 2025-1-18 12:09 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×



一、概述:空间多组学日益成为研究热点和方向


组学目前主要是指基因组(Genomics)、转录组(Transcriptomics)、蛋白质组(Proteomics)与代谢组(Metabonoics)。与单细胞蛋白质组学主要是细胞的分群分析不同,空间多组学的特点是更加强调空间xyz轴的位置分布以及分析具有共同特点的一组生物体(组织形态相同或细胞类型相同)。

近几年,空间组学(Spatial omics)的热度与日俱增。可以说,空间多组学技术已“引爆”科研界。自2020年,该技术被NatureMethods评为年度技术方法之后,在2021年大量科学先后报道了该技术在不同领域重大突破和发现。近日,又上榜《Nature》2022值得年度关注的七大榜单技术。同时,在国内外空间组学会议频率增加、新技术与新仪器应运而生、文章发表逐年递增。

2021年利用空间转录组技术发文章呈井喷式增长,其中正式发表文章40余篇,而空间转录组学为特色的预印本bioRxiv搜索“空间转录组学(spatialtranscriptomics)”一词,获得了500余条结果,其中80余条是在2021年提交的,2021年是空间转录组技术应用好文发表突飞猛进的一年。





图表1 2016年-2021年空间转录组文章发表趋势和影响因子分布


通过检索空间转录组发表文章的数据分析来看,该技术在2021年中得到广泛应用,并且文章影响因子主要集中在10~20分区间,其占比高达39%,其次在30分以上占比达到30%,由此可见空间转录组前沿技术的应用极大提升了文章的质量和档次。





图表2 空间转录组不同组织应用发表文献统计


当今时代,肿瘤及其他疾病依然对人类健康造成重大威胁。随着空间多组学技术时代的到来,基于外周血、大块组织活检的生物标志物发现将不能满足转化医学及临床研究的需求。新冠疫情暴露出人类对于各类疾病,如感染在致病机理以及组织器官损伤机理的理解比较有限,如何建立快速有效的组织空间生物标志物发现以及药物筛选平台,如何与临床病理学相结合是未来研究的主要方向。

基于上面数据,不难看出来前期研究,脑组织空间基因表达探索最为广泛,还有心脏组织、肝组织前列腺组织;空间多组学必将是未来多个医学领域的研究热点和方向。

二、技术进展

随着各领域研究的迅猛发展,空间转录组学进步最大,次之为三维基因组学。以下将分别介绍其技术进展。

(一)空间转录组技术进展

生物学研究的重要目标,是理解正常和病理状态下细胞的特点和功能。近十几年,转录组技术飞速发展,如今可从全基因组尺度对基因表达进行定量测量,极大地推进了对细胞功能的理解。

转录组技术的发展主要经历了三个阶段:

第一个阶段是对大量混合细胞进行转录组测序(bulk transcriptome)

第二个阶段是对单细胞进行转录组测序(single cell transcriptome),该方法将对细胞基因表达的认识推进到单细胞的层面,目前已在新细胞类型的发现,揭示细胞异质性等方面展现出优势。但是,目前的单细胞转录组测序方法仍存在一定局限性,由于单细胞悬液的获得需要对组织进行酶解,悬液中的单细胞失去了组织空间位置信息。

近年来,转录组研究开始进入空间转录组(spatial transcriptome)阶段,该技术可以同时获得细胞的空间位置信息和基因表达数据,推进了对组织原位细胞真实基因表达的研究,为组织细胞功能、微环境互作、发育过程谱系追踪、疾病病理学等多个领域提供了重要的研究手段。





图表3 3种不同的转录组技术

几十年来,在空间水平研究组织基因表达的技术层出不穷。根据原理不同,可以分为4类:基于原位杂交的空间转录组技术、基于高通量测序的空间转录技术、基于原位测序的空间转录组技术和基于活细胞标记的空间转录组技术。





图表4 空间转录组方法的细胞和基因的分辨率

1. 基于原位杂交的空间转录组技术

随着技术的发展,使用荧光标记的探针与预定的靶RNA杂交,荧光体系可进行定性、定量或相对定位分析,这一技术称为荧光原位杂交(fluorescencein situ hybridization, FISH)。

2012 年,Eric Lubeck 等通过结合超分辨显微镜(super-resolution microscopy,SRM)和组合标记,识别单个 mRNA 上不同荧光寡核苷酸探针的空间排序,大幅提高了检测的转录本数量。

虽然,组合标记smFISH 增加了可识别的转录本数量,但是,还无法检测全基因组的转录本。2014 年,Eric Lubeck等开发了顺序杂交技术。原则上,4 种荧光染料和 8 个杂交回合可以检测一个细胞中的所有转录本。这种方法的好处在于即使只有 2 种荧光染料,也可以通过多次杂交使得检测规模迅速扩大。但是,如果想要将这种方法的应用范围扩大到整个转录组,价格较昂贵。除此以外,检测误差也呈指数增长。





图表5 基于原位杂交的空间转录组技术原理

2015年,美国哈佛大学华裔生物物理学家庄小威教授基于smFISH技术,研发出单分子成像技术(multiplexedError-robust fluorescence in situ hybridization, MERFISH),MERFISH采用经过四轮杂交,4个荧光成像通道(Alexa Fluor、Cy5、AlexaFluor和ATTO),能够在细胞中分析数百至数千个RNA。虽然MERFISH解决了耗时的缺点,减少了杂交后的背景荧光干扰,但还是存在多轮杂交后背景影响荧光的现象。MERFISH也在不断升级,其检测效率明显提高。

2. 基于高通量测序(NGS)的空间转录组技术

(1)LCM-RNAseq 技术

1996 年,Emmert 等开发了激光捕获显微切割技术(laser capture microdissection,LCM),该技术可以在保留空间位置信息的前提下,可视化地从切片中快速且准确地捕获目标细胞,已广泛用于生物学研究中。该技术原理是将组织切片贴在特殊薄膜覆盖的玻璃载玻片上,组织切片经过染色后,在显微镜下可视化地进行特定细胞的选择、激光切割和分选,收集组织中特定的细胞样品。2016 年,Peng等通过整合与优化LCM 和单细胞 RNA-seq 技术,构建了一种能解析少量细胞转录组信息,同时保留细胞原有位置信息的方法。

(2)HDST 和 Slide-Seq

2019年Stahl 等提出了高分辨空间转录组(High-definition spatial transcriptomics,HDST)测序方法,通过在载玻片表面雕刻 2.05 μm 的大量小孔,将直径为 2μm 的硅胶磁珠分配到这些孔里,通过在磁珠表面连接带有特定 barcode 序列以及多种 UMI 和 poly-dT 的寡核苷酸链,来捕获对应位置细胞的 mRNA 进行反转录,并进行文库构建和转录组测序。

同一时期,Macosko等发明了类似的 Slide-Seq 方法。在Slide-seq中,首先在涂有橡胶的玻璃盖玻片表面填充一层10 μm的特异性条形码微珠(beads)。与其他高通量scRNA-seq方法中使用的微珠类似,每个微珠上条形码是随机分布的。因此,先对每个微珠上寡核苷酸条形码进行识别,再进行混合测序。为解决这一问题,Slide-seq后续利用SOLiD化学技术(sequencing by oligonucleotide ligation and detection)来读取每个柱子上不同条形码。先识别每个10 μm捕获点(spot)中特异性空间标识符,再行RNA-seq,因此寡核苷酸捕获的mRNAs可以映射回它们的原始空间坐标。

这两种方法通过结合测序数据和图像处理,都可以将基因表达情况可视化地比对到原始的组织切片中,得到非常直观的结果,通量大且分辨率高。但其存在一定比例的磁珠会同时比对到两种细胞类型的情况,且磁珠的捕获效率仍然有待提高。

(3)10x Genomics Visium 空间转录组测序技术

2016年,瑞典皇家理工学院Joakim Lundeberg在Science上发文,利用基因芯片技术将位置信息保留在芯片上,再利用二代测序技术对组织中RNA进行测序,从而生成组织切片上完整的基因表达图像。2018年底,10X Genomics宣布收购Spatial Transcriptomics,并于2019年11月发布Visium空间基因表达解决方案。

Visium 空间转录组技术,结合显微成像技术和 RNA 测序技术,将染色后的组织切片与不同空间位置细胞的 mRNA 表达数据相结合。利用 Visium 技术,可以从整个组织切片获得高通量的转录组数据,通过此技术研究正常和疾病组织的细胞组成及其与基因表达的关系,可用于发现新的组织生物标志物。





图表6 Visium FF/FFPE空间转录组mRNA捕获原理比较


3. 基于原位测序的空间转录组技术

原位测序技术可以直接在组织中检测细胞中的基因型,并能够发现局部微环境对基因表达的影响。2013年,Ke等发表了锁式探针原位测序的分析方法(in situ sequencing, ISS),锁式探针属于单链DNA分子,能够结合到cDNA分子上。

ISS 技术中,锁式探针(padlock probe)可能会产生大量的探针特定偏差,而且 ISS 技术通常仅限于有明确注释基因的检测。针对这些问题,2015 年,Lee 等开发了荧光原位测序(fluorescence in situ sequencing,FISSEQ)技术,利用随机六聚体引物在固定细胞中逆转录 RNA,通过 cDNA 的环化以非靶向方式生成测序文库。进一步提高了原位测序技术的检测通量,能获得全基因组范围的基因表达图谱,包括基因表达,RNA 剪接和转录后修饰等,同时保留了空间位置信息。

FISSEQ 技术的优势在于,对于功能重要的转录本,其富集程度是单细胞 RNA-seq 的十倍以上。FISSEQ方法的局限性在于获得的基因数远少于 RNA-seq,每个细胞仅获得约 200 个 mRNA 片段,而单细胞RNA-seq则约为 40,000 个 mRNA 片段。该方法测序深度低,无法提供单个细胞内 RNA 的完整信息,会丢失低丰度的转录本。





图表7 荧光原位测序的滚环扩增原理

4. 基于活细胞标记的空间转录组技术

上述几类空间转录组技术,需要对组织进行切片,而组织一旦切片,就无法获得完整单细胞的基因表达信息,当前的捕获方法难以从单个细胞中分离出 mRNA 而不损害相邻组织. 2014 年,Ditte Lovatt 等开发了一种新的空间转录组方法——TIVA(transcriptome in vivo analysis),第一次非破坏性地从活细胞中捕获 mRNA。

TIVA 方法与 RNA-seq 的结合能获得具有空间信息的完整单细胞基因表达信息,而不是某个切片或者部分单细胞的基因表达信息,为研究复杂的组织微环境对完整单细胞转录组的影响提供了一种可靠途径。但是,该方法目前不适用于大量细胞的分析,且因其只能穿透活细胞,对已处理过的组织样品(例如固定后或冰冻后的组织样品)不适用。

为了将scRNA-seq 数据与空间维度和实时表型分析联系起来,Matthew F. Krummel 课题组开发了一种ZipSeq,它利用照明模式和光笼寡核苷酸将 DNA 编码 (Zipcode)标记到完整组织的活细胞上, 进一步揭示单细胞转录组数据的空间定位背景信息。ZipSeq 技术适用于人体组织并允许一次定义多个区域,但空间分辨率低限制了该技术的应用范围。





图表8 空间转录组技术比较

目前的各类空间转录组技术,都存在各自的优缺点,这些空间转录组的方法将不断克服各自的不足,包括防止 RNA 的降解,提高检测的通量和效率,降低成本,获取完整空间单细胞转录组不断加深对组织细胞真实特性的理解。

(二)三维基因组技术进展

基因组是生命体完整的遗传信息。尽管提到核酸链的结构,绝大多数人的第一反应是“双螺旋”模型,但是,基因组的物理结构,却远比双螺旋复杂——核酸链会在蛋白质的辅助下,形成更加高级的结构。这也催生了基因组学中一门子学科的诞生:三维基因组学。

随着基因组学的发展,科学家们对基因组的研究从一维 (基因序列)、二维 (不同序列的相互作用) 层面,逐渐深入到三维 (染色质的空间构象)层面。真核生物的基因组通过线性 DNA 多层级地折叠成为染色质,以特定的三维空间构象存在于细胞核内。染色质的三维结构影响着基因的表达调控、DNA的复制及重组。

可以从三个维度来认识基因组:

一维基因组是指基因组的序列及其注释等内容;

二维基因组是指染色质DNA分子序列结构以及细胞内分子和元件的坐标序列;

三维基因组是在一维基因组信息和二维基因组信息的基础上研究所有核内染色质空间结构及各种调控元件的交互作用。三维基因组学是多学科、多技术融合催生的新产物。

染色质在细胞核内的三维层级结构单元由大到小依次为:

①染色体疆域是基因组普遍存在的结构域,每条染色体在细胞核中独立占据且被限制在互不重叠的区域;

②染色质区室是由基因组空间结构上两种表观状态不同的A 和 B 区室( chromatin compartment)组成;

③拓扑关联结构域是细胞核内稳定存在的空间结构单元,作为基因组折叠的功能单元正确指导远距调控基因的转录调控;

④染色质互作环通常由启动子与远端增强子或调控元件远距互作形成,它是直接调控基因表达的最精细的结构和功能单元,也是三维基因组学研究的热点。





图表9 染色质高级结构示意图

1.染色体疆域

染色质在细胞核内并不是随机分布的,不同染色质占据不同的空间。研究发现,在活细胞的间期,细胞核内的染色质组织占据了一块特定的不重合区域,并称此区域为染色质疆域(Chromosome territory,CT)。

CT 在细胞核的定位与基因密度相关,低基因密度的染色质倾向于朝核外围定位,而高基因密度的染色质则占据细胞核中更中心的位置,还有研究发现在不同的细胞复制时期和不同的基因类型中,CT 所占据的位置不同。在关于 DNA 损伤修复过程中 CT变化研究中发现,DNA 损伤诱导了大规模的 CT 区域重新定位,其中包括部分 CT 从核内部向外部转移,但这是一个可逆的过程,在修复结束后,CT 会重新占据与未受损细胞类似的位置,这些研究进一步证明了 CT在细胞核中存在的稳定性。

2.染色体区室

当把染色质进行放大时,可以观察到在染色质内部仍然存在着相互间隔的“区块”,相邻“区块”间的互作模式各不相同,线性距离较远的“区块”也可以发生相互作用。2009年提出了染色质三维空间的另一个重要特征,即染色质区室(chromatincompartment),并将这些区块划分为区室A和区室B两类。区室A和B的特征与各自基因组表观特征呈现高度相关。

3. 拓扑关联结构域

随着测序精度的提升,研究人员发现区室内部 1Mb 左右的 DNA 组成了更小的空间结构,称为拓扑关联结构域(topologically associating domain, TAD),TAD内一般包含 8~10 个基因,其内部的 DNA 元件之间形成了较为紧密的相互作用,而 TAD 间的染色质相互作用较少。相邻 TAD 边界上结合有染色质结构蛋白,如CTCF 蛋白(CCCTC binding factor, CTCF)和黏连蛋白的蛋白复合体,这些蛋白起到组织染色质结构并隔离两个相邻的 TAD 之间互作的功能。

TADs 参与调控 DNA 复制、转录和表观遗传修饰,因此,TAD 边界的破坏会对基因表达产生较大规模的影响,甚至导致疾病的发生。通过技术分析TADs的变化是否与表观遗传修饰相关,结合RNA-seq 技术对相关基因的表达量进行统计,有助于解释不同样本间空间结构的差异与表观遗传修饰及转录调控之间的关系。

4. 染色质环

TAD 内部包含染色质环((Chromatin loop,CL),通常由启动子和增强子 (远端) 相互作用形成,是直接调控基因表达的基础功能单元。在 1 kb 的分辨率下,发现了目前直接调控基因表达最精细的结构和功能单元:一种简单染色质纤维折叠形成的环状结构——染色质环。该研究首次列出了上万个人类基因组上的 CL。这些 CL 通常连接着基因的启动子和增强子,与基因激活相关,具有跨细胞类型和跨物种的保守性。

CL 的形成与启动子、增强子、CTCF 结合位点以及长距离互作密切相关。由于增强子总是通过CL 长距离地控制非临近基因,所以对增强子靶基因的定义也是探究 CL 影响基因表达机制的研究重点。





图表10 三维基因组结构示意图

2002年,Dekker 等提出了染色质构象捕获(Chromosome conformation capture,3C)技术,该技术可以捕获两个线性距离较远的基因位点之间的染色质相互作用,并分析染色质的物理特性。该技术的提出标志着三维基因组的研究进入到了一个“新时代”。

为了满足科学探索过程中对于更高的分辨率与通量的需求,3C 技术的衍生技术以及其他测序技术在近十几年飞速发展。主要包括:

①环状染色质构象捕获技术(Circular chromatinconformation capture technology,4C)可以测定一对多的染色质交互作用;

② 染色质构象捕碳拷贝技术(conformationcapture carboncopy technology ,5C)用测定多个基因组位点之间的互作用;

③高通量染色质构象捕获(High-throughput chromosome conformation capture,Hi-C)的技术及其衍生技术,利用高通量测序技术并结合生物信息学分析方法,研究全基因组范围内DNA序列在空间位置上任意两位点间互作关系;

④CHIA-PET技术,将3C与染色质免疫沉淀(ChIP)相结合,在更高的分辨率基础上将染色质三维结构与蛋白质关联,从而确定转录因子结合位点和识别染色质交互作用;

⑤染色质开放性测序技术 (Assay for transposase accessible chromatin with high-throughputsequencing,ATAC-seq),可利用 DNA 转座酶结合高通量测序的技术。





图表11 三维基因组技术发展图

1.3C技术

3C技术基本原理是先将细胞核用甲醛固定,甲醛的交联作用首先将细胞核内互作的DNA与蛋白质的全基因组信息固定下来;再通过限制性内切酶切割以及DNA连接酶进行邻近连接;最后通过荧光定量PCR验证预期的基因组互作是否发生。但是3C技术只能测定特定的点到点之间的染色质交互作用。





图表12 3C技术过程

2.4C技术

4C 技术与 3C 技术相比省略了 PCR 步骤,直接用限制酶切割染色质的目标 DNA 并环化,然后利用反向 PCR 技术对目标染色质位点接触的所有 DNA 序列进行扩增,最后利用微阵列分析或下一代测序技术(NGS)分析某一特定 DNA 序列与其他接触位点DNA 序列的相互作用。该技术可以在全基因组范围内检测与靶向基因座接触的 DNA 基因座,许多线性距离较远的染色质间的相互作用也可通过形成染色质接触而被检测出来。

3.5C技术

5C 技术通过常规 3C 技术产生 3C 文库后,通过LMA (Ligation-mediatedamplification) 进行扩增,在多重 PCR 反应中与单链寡核苷酸探针相连接,进一步创建形成 5C 文库,最后使用多路复用引物和 NGS,同时测定多个 DNA 序列间的相互作用。该技术既可以在微阵列上进行,也可在高通量测序中开展,还可建立目标基因组区域的接触频率矩阵。

4.Hi-C技术

Hi-C技术技术是 3C 技术的一个高通量版本,能够检测所有目标基因组位点的所有相互作用。它的研究对象为整个细胞,通过捕获细胞内染色质全部 DNA 的相互作用模式,从而研究整个染色质 DNA 在空间位置上的关系,还可以进一步得到分辨率较高的染色质三维结构信息。

Hi-C 技术改变了 3C 技术中创立模板的过程,在连接目标 DNA 末端之前,用生物素标记的脱氧核苷酸填充 DNA 的限制性末端。在 DNA 末端连接之后,将其纯化并剪切,然后富集被亲和素标记的连接头部分进行分析。最后得到整个基因组 DNA 片段之间的相互作用频率矩阵,其分辨率与限制性位点的密度以及测序深度相关。

虽然Hi-C技术能够捕获全基因组范围内的染色质相互作用,但因其没有特异性,所以如仅针对特定的基因组位点和基因座进行研究则过于昂贵,一般该技术都会与其他测序技术联合应用来达到研究特定相互作用的目的。

5.ChIA-PET

为了研究转录因子与转录调控的结合,研究者们开发了 ChIP芯片分析和 ChIP 测序技术(ChIP-seq),以及全基因组双末端标记测序系统(Paired-end-tag,PET)[11]。随后 Wei 等结合 ChIP和PET两种技术的优势,开发出了 ChIP-PET 用于基因组层面蛋白结合位点的研究。为了进一步研究远端的基因组区域在调控生命进程中发挥的作用,2009 年新加坡基因组研究院的研究人员开发出了一种整合了染色质邻近式连接、ChIP、PET 以及NGS 等技术,用来研究基因组范围内染色质远程交互的新兴技术——“配对末端标签测序分析染色质相互作用”,即 ChIA-PET 技术。

该技术首先用超声波将甲醛交联的 DNA-蛋白质复合物片段化,然后利用 ChIP 富集所需的 DNA-蛋白复合物片段,在片段末端加上包含 MmeⅠ位点的生物素化寡核苷酸 linker,再经过连接、消化、固定化等PET 序列步骤,最后,利用 NGS 技术对目标 DNA进行测序。

6. ATAC-seq

ATAC-seq技术是一种创新的表观遗传学研究技术,能够测得开放区域染色质的 DNA 序列。该技术的原理是利用转座酶 Tn5获取开放性染色质,然后对 Tn5 酶捕获到的 DNA序列标签进行 PCR,再通过高通量测序及生物信息学分析来挖掘相关基因信息。与传统方法相比,ATAC-seq 所需细胞量少,操作简单,测序信号更好,可以在全基因组范围内检测染色质的开放状态。

原文地址:https://zhuanlan.zhihu.com/p/485134950
楼主热帖
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表