立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索

液体活检新突破:cfMeDIP-seq技术揭示癌症检测新路径

2026-5-2 11:04| 编辑: 沙糖桔| 查看: 117| 评论: 0|来源: 小桔灯网|作者:动力彩虹

摘要: 这是首次提供了覆盖广泛癌种、经过统一标准化处理的大规模cfMeDIP-seq公共资源库。

前言

肿瘤在发生过程中,会向血液中释放携带其遗传和表观遗传学特征的游离DNA片段,这些片段构成了液体活检的基础。DNA甲基化,尤其是在CpG岛的异常高甲基化,是癌症的经典标志之一。cfMeDIP-seq技术通过免疫沉淀富集甲基化片段并进行高通量测序,已展现出超灵敏的癌症检测和分型能力。同时,cfDNA的‌片段组学特征,包括片段长度分布、末端基序、‌核小体足迹等特征,这些片段组学的分析也被证明在癌症检测和分类方面是有效的。两种方法在癌症液体活检领域都极具前景,但长期以来,各个研究小组独立生成的数据集,因分析流程和科学目标不同,很难进行统一比较和深入挖掘。领域内缺乏一个大规模、标准化处理、同时整合了甲基化和片段组学信息的泛癌种cfDNA数据资源。


近日,来自加拿大玛格丽特公主癌症中心等多家研究机构合作在杂志Nature cancer上共同发表了一篇题为“A pan-cancer compendium of 1,294 plasma cell-free DNA methylomes and fragmentomes enabling multicancer detection”的文章。该研究构建了一个包含‌1294个样本‌,涵盖了11种癌症类型、Li-Fraumeni综合征患者和健康对照,系统性地整合并分析了迄今为止最大规模的多癌种血浆cfDNA甲基化和片段组学数据。该研究系统性验证了在单次cfMeDIP-seq检测中‌同时获取甲基化和片段组学‌信息的可行性,并证明两者的整合能够显著提升癌症检测与分类能力。这项工作为未来的癌症早期、无创诊断和监测铺平了道路。

图片来源:Nature cancer





主要内容



构建标准化的泛癌cfDNA数据集

作者收集了一个全面的数据集,包括来自癌症遗传学与表观遗传学(TCGE)项目中九个不同研究的总计1074个血浆cfMeDIP-seq数据。该数据集涵盖了来自健康对照者(n = 153)以及被诊断出患有 11 种不同癌症类型(n = 753)的患者以及‌Li-Fraumeni综合征‌携带者(n=168,细分为幸存者、未发癌者和阳性者)的液体活检结果(下图a、b)。


为了避免技术和生物学混杂因素的影响,作者对所有 cfMeDIP-seq 数据均采用标准化流程(MEDIPIPE)进行了统一处理。作者排除了批次效应、年龄和性别的影响,并去除了外周血白细胞的背景信号,从而聚焦于真正由肿瘤或疾病状态引起的甲基化差异区域(DMR)。


cfMeDIP-seq数据集的收集、整理和质量控制。图片来源:Nature cancer




泛癌及癌症特异性 cfDNA 甲基化特征

为了建立泛癌 cfDNA 甲基化特征,作者首先通过比较双端测序(PE)和单端测序(SE)研究中的癌症样本与健康样本,各筛选出了24301个和19289个高甲基化差异甲基化区域(hyper-DMRs),以及196个和38个低甲基化差异甲基化区域(hypo-DMRs)。高甲基化和低甲基化差异甲基化区域均在 CpG 岛、岛岸区域和启动子中富集。高甲基化差异甲基化区域还富集在增强子中,而低甲基化差异甲基化区域的增强子富集情况则存在差异。


PE 和 SE 研究中有14202个共有的高甲基化差异区域,这些区域构成了癌症的共同甲基化模式(图c)。这些区域约99.8%出现于多种癌症中(图d),表明它们代表着癌症的共同表观遗传改变。功能富集分析显示,这些区域富集在与癌症发生发展密切相关的‌DNA结合转录因子活性、离子通道活性以及神经活性配体-受体相互作用‌等通路中。


研究还识别了每种癌症类型独有的高/低甲基化区域(图g、h)。结果显示,前列腺癌和葡萄膜黑色素瘤拥有最多的癌种特异高甲基化DMRs,而头颈癌和脑癌则拥有最多的特异低甲基化DMRs。这些特征富集于不同的生物学通路。这些结果突显了不同癌症类型中 cfDNA 甲基化的异质性。


泛癌及癌症特异性 cfDNA 甲基化特征。图片来源:Nature cancer




不同癌症中甲基化 cfDNA 的片段组学特征

研究发现,不同癌症来源的cfDNA片段,其物理特征也呈现独特模式。除了头颈癌和脑癌,其他癌种的短片段比例均显著高于健康对照(图a)。‌核小体足迹分析结果显示,与健康样本相比,AML和前列腺癌样本中更可能出现在核小体核心位置附近的切割,这可能反映了肿瘤细胞的染色质可及性发生了改变(图b)。


接下来,作者分析了每个片段 5' 端四核苷酸序列的出现频率(图c)。结果显示,不同癌种的cfDNA末端偏爱不同的四核苷酸序列。例如,头颈癌富集A/T丰富的末端,而肺癌则偏爱C/G丰富的末端。已知与DNASE1L3酶切割活性相关的基序,在肺癌和前列腺癌中显著缺失,这与这些肿瘤中DNASE1L3基因表达下调的现象一致。


总之,分析表明,不同癌症类型中甲基化游离 DNA 片段的片段组学特征存在显著差异,这凸显了片段组学分析作为区分癌症样本与健康样本的生物标志物的潜在价值。


泛癌种 cfDNA 片段组学特征概述。图片来源:Nature cancer




整合cfDNA甲基化与片段组学特征可大幅提升泛癌检测性能

作者基于cfDNA的甲基化和片段组学特征(5'端模式、片段比例、插入大小和核小体指标)训练了分类器,并系统评估并比较了不同特征组合在癌症检测中的效能。结果显示,‌甲基化特征‌本身展现了优异的癌症识别能力,平均曲线下面积(mAUC)高达0.986。‌片段组学特征,特别是5’端基序和片段比率单独也能实现0.93左右的AUC。将甲基化、5’端基序和片段比率这三种最佳特征‌整合‌后,mAUC提高至0.974(图a)。


在独立验证数据集中评估这些模型的泛化能力时,结果显示,片段比例与甲基化的结合达到了最高的 mAUC 值为0.954,而仅片段比例和甲基化单独使用时,mAUC值分别为 0.848 和 0.674(图c)。作者还在SE 数据集中验证了模型,结果是可重复的,进一步证明了将甲基化与片段组学特征相结合的附加价值。


总之,这些结果证实,将甲基化和片段组学特征(特别是来自游离 DNA 的片段比例和 5' 端模式)结合起来,能够提高分类性能。


基于cfDNA甲基化和片段组学特征的癌症检测。图片来源:Nature cancer




基于 cfDNA 甲基化和片段组学特征的癌症分类

作者还为每种癌症类型研究构建了区分特定癌症类型的模型。在前列腺癌(0.972)、肺癌(0.968)和脑癌(0.968)中实现了最高的 mAUC 值(图a),这表明这些癌症尤其容易区分。将片段组学分析与甲基化分析相结合,使平均曲线下面积(mAUC)增加了 0.003,平均灵敏度提高了 3.6%,在所有模型中均如此(图a、b)。


同样,癌症亚型的鉴别,如区分IDH野生型与突变型胶质瘤、原发性前列腺癌与转移性去势抵抗性前列腺癌,整合特征模型的表现明显优于仅使用甲基化特征的模型,在八个亚型比较中的平均AUC提**0.159,敏感性在 95%特异性的条件下提高了 25.5%。


基于 cfDNA 甲基化和片段组学特征的癌症分类。图片来源:Nature cancer




总结与讨论

作者构建了一个包含‌1294个样本‌(涵盖11种癌症类型、Li-Fraumeni综合征患者和健康对照)的cfDNA甲基化和片段组学综合数据库。这是首次提供了覆盖广泛癌种、经过统一标准化处理的大规模cfMeDIP-seq公共资源库。该研究还系统性验证了在单次cfMeDIP-seq检测中‌同时获取甲基化和片段组学‌信息的可行性,并证明两者的整合能够显著提升癌症检测与分类能力。这项工作为未来的癌症早期、无创诊断和监测铺平了道路。


这项研究也存在一定的局限性。cfMeDIP-seq技术得到的片段组学特征反映的是‌甲基化区域‌的片段化模式,可能与全基因组范围的片段特征存在差异。其次,队列中某些癌种的样本量仍然有限,需要更大规模的独立前瞻性队列进一步验证。尽管基于片段比率和5’端基序的特征显示出强大的判别力,但其生物学机制以及与肿瘤微环境的关联仍需深入研究。不同样本处理和建库流程对片段特征的影响也需要标准化的评估。


声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 洽谈合作
返回顶部