公司新闻

FFPE 样本的融合基因检测:DNA or RNA?

浏览量:4358 / 发布时间:2022-05-05


背景

染色体重排导致的基因融合事件广泛存在于多种肿瘤。由于基因融合产物是肿瘤发生的常见驱动因素,因此,其可作为治疗中潜在的预后和治疗靶标,例如:慢性髓细胞白血病中的 BCR-ABL1、肺癌中的 EML4-ALK、前列腺癌中的 TMPRSS2-ERG 等基因融合[1-4]

在 DNA 水平上,融合断点位置通常发生在较长的内含子区域,且融合的断裂点也各异;而在 RNA 水平上,融合基因表现为前后两个基因外显子之间的衔接,融合点相对固定;因此,在 RNA 水平上检测相对高效、精准(详情请见 RNAseq融合基因分析示例软文。但是,许多肿瘤组织以福尔马林固定石蜡包埋 (FFPE) 的形式保存,会导致提取的 DNA 和 RNA 发生显著断裂和化学修饰。由于 FFPE 样本中 RNA 相较 DNA 更易被降解,基于 RNA-seq 的基因融合检测并不适合用于个体患者的常规临床检测。根据已知融合基因和位点去设计特定杂交探针,采用靶向捕获测序可获得远高于 WGS 的测序深度,从而可以更敏感的检测出融合基因。在 FFPE 组织上使用基于 DNA 和 RNA 的捕获测序是可行的,但同时也高度依赖于 DNA 和 RNA 的完整度[5]

本文中,我们主要分享纳昂达融合基因 DNA 检测方案应用于标准品和真实样本的示例。


实验设计

样本来源

融合基因标准品为菁良肿瘤结构变异 5% gDNA 标准品,含有 CD74-ROS1 和 EML4-ALK 两个 5% 突变频率变异 (GW-OGTM001为突变型,GW-OGTM005 为野生型),投入量为 50 ng。真实样本为匿名结直肠癌 FFPE 样本,投入量为 100 ng。


捕获测序

不同样本投入量的 DNA 利用 NadPrep® DNA 通用型文库构建试剂盒构建预文库,再分别进行捕获测序。捕获 Panel 分别为:NanOnco Plus Panel v2.0 (y以下简称为 Onco V2),靶向实体瘤研究中被广泛关注的 565 个基因的全部编码区和融合相关的内含子等区域;OncoFu Panel v2.1-Tech Access (以下简称为OncoFu),靶向融合基因常见融合区域,共涉及 38 个常见融合基因,捕获区域约为 0.5 Mb;NanOnCT Panel v1.0,靶向实体瘤研究中被着重关注的 69 个基因,覆盖基因组约 375 kb 区域。

备注:OncoFu 为 Onco V2 的子集。

表 1. 建库和杂交捕获试剂信息表

表1


分析方法

本次融合分析使用的软件为 Genefuse[6]、Factera[7] 和 Delly[8],具体软件信息见表 2。Factera 和 Delly 都是依靠发现比对 BAM 文件中的不一致匹配的 Read Pairs,然后通过找到断点来定位基因融合。这种通过比对基因组图谱检测融合的算法,优点是可以扫描所有潜在的基因融合,并能够检测到新的融合基因。而它的缺点则是过度依赖比对中不一致的 Read Pairs,容易造成假阳性的结果,尤其是肿瘤样本融合变异丰度较低的时候。Genefuse 软件则跳过比对环节而直接对 FASTQ 文件的 Read 进行基因组坐标匹配,针对性检测目前临床常见和 COSMIC 数据库中的融合基因,而它的劣势则是无法检测到新的融合基因。

Factera 的结果为 Proper pair support 支持断点的数量,用户可根据结果中不一致匹配的 Read Pairs、深度和断点信息综合鉴定,或修改软件源代码用于获取更多潜在融合基因结果。Delly 的结果为 vcf 文件中 RV (high-quality variant junction reads) 的数量,也提供类似 Factera 的中间文件结果和自定义设置,用于用户辅助判断。Genefuse 软件的分析结果为 Total Reads 中支持断点的 Read 数量,用户可以自行排序和过滤,进行进一步的综合融合鉴定。对于结果中低丰度的热点融合变异,例如仅有 1-2 条的 read 支持数,可进一步通过 PCR 扩增和一代测序进行验证。为便于对比,本文中统称上述软件结果为融合断点支持数。

表 2. 分析软件列表

表2


融合基因标准品的检测

肿瘤结构变异 5% gDNA 标准品中含有 2 个突变频率均为 5% 的融合突变:CD74-ROS1 和 EML4-ALK。Onco V2 和 Onco Fu 靶向区域均覆盖了 CD74、ROS1 以及 ALK 的融合断点相关内含子区域,但都未覆盖 EML 的融合断点相关区域。两款捕获 Panel 在 Illumina 和 MGI 测序平台的上的捕获中靶率均 >85%,均一性指标 0.2 倍平均深度的覆盖率均达到 99% 以上,平均测序深度均 >1,000x,可用于融合分析 (图 1)。 


向下滑动查看


1A
1B
1C

 图 1融合基因标准品靶向捕获表现。

A. 比对率和中靶率;B. 靶区域覆盖度;C. GC 偏好性。


为验证 Panel 融合检测的性能,我们首先评估了不同测序深度下融合事件的检出情况。将 OncoFu 的双平台测序结果分别降采集 10 Mb、5 Mb、2.5 Mb 和 1.25 Mb 的 Read Pairs,不同软件分析的结果显示,融合断点支持数随着测序量的降低而减少,且支持数与测序量呈显著线性关系 (R2接近1)。当测序量为 1.25 Mb 的 Read Pairs 时,OncoFu 的平均覆盖深度约为 600X,且融合变异丰度基本都在 5% 上下 (图 2)。这一深度也是常规临检样本测序的深度下限,如果降低测序量,可能会引起融合检测准确率的不稳定。

2A_EML4-ALK
2B_CD74-ROS1

左右滑动查看更多

 图 2. OncoFu 不同测序量下融合检测结果。

A. EML4-ALK; B. CD74-ROS1。


其次,我们评估了相同的测序量下,不同投入量对融合断点支持数的影响。利用菁良 gDNA 野生型标准品 (GW-OGTM005) 的 Onco V2 的捕获数据跟结构变异 5% gDNA 标准品进行不同比例进行混合,最终形成理论突变丰度 5%、2.5%、1.25% 和 0.625%,总量为 10 Mb Read Pairs 且平均深度约为 800X 的混比数据。然后使用三款软件对不同数据量的融合检测进行分析,结果显示融合断点支持数随着变异丰度的降低而减少,且融合断点支持数跟测序量呈线性关系 (图3)。融合检测结果上可以看出,Genefuse 软件的检测灵敏度是最高的,接近 0.5% 的变异丰度下依然能够很好检出融合基因。而 Factera 和 Delly 则在 2.5% 的变异丰度的检测能力尚可。而对于 1.25% 和 0.625% 的检测能力较差。

另外从这次检测也可以看出,仅有ALK基因覆盖探针设计的 EML4-ALK 与双端均覆盖探针设计的 CD74-ROS1 的检出率非常接近,侧面说明,对常见热点融合仅覆盖设计单个融合基因伴侣也是可行的检测方式。

3A_EML4-ALK
3B_CD74-ROS1

左右滑动查看更多

图 3. Onco V2 不同融合变异丰度下融合检测结果。

A. EML4-ALK; B. CD74-ROS1。


真实样本的融合检测表现

一例真实结直肠癌 FFPE 配对样本的数据经过质控后分别进行了 Genefuse、Factera 和 Delly 三款软件的分析和综合判定后,成功检测出 MDM2-SLC35E3 的融合事件 (表 3)。

表 3. 真实样本融合检测结果

表3

Factera 和 Delly 软件在双平台的数据中均发现了该融合事件,且断点支持的 Read 数量非常可观。从 IGV 的截图中可以看出,虽然捕获 Panel 并没有靶向基因 SLC35E3 的捕获探针,但是依然通过 MDM2 的捕获探针抓取到足够多融合片段 (图 4)。Genefuse 因无法对新生融合事件进行鉴定,从而未检出该融合事件。

向下滑动查看


4A_Illumina_MDM2
4B_Illumina_SLC35E3
4C_MGI_MDM2
4D_MGI_SLC35E3

图 4. 真实样本融合事件 IGV 截图 (左边截图为所有捕获 read,右边截图为 clip read)。

A. MDM2 (Illumina 平台); B. SLC35E3 (Illumina 平台); C. MDM2 (MGI 平台); D. SLC35E3 (MGI 平台)。

为了进一步验证该融合事件的真实性,我们根据断点位置设计引物并进行PCR 扩增,再分别进行电泳和一代测序验证。电泳图显示,除对照外,Tumor 样本的 A-F/B-R 引物组合有条带,属于融合片段的扩增产物 (图 5A & B)。从扩增产物一代测序的 BLAST 结果来看,融合片段确实来自 MDM2 和 SLC35E3 基因,从而证实该融合事件的真实性 (图 5C)。

向下滑动查看


5A
5B

5C


▶ 图 5. 融合事件真实性验证。

A. 融合事件引物设计示意图和 PCR 扩增组合方式 (“√”表示 PCR 扩增后琼脂糖凝胶电泳理论上应有条带,“?表示需要在实际检测后才能得出结论);B. 电泳条带展示图;C. Sanger 测序和 Blast 结果展示。


结束语


在 DNA 水平上,基因融合的断点位置通常发生在较长的内含子区域。而传统的 PCR 法只能用于检测已知热点融合,相比之下,采用靶向捕获可以更高通量检测更多融合位点。但从 DNA 水平的融合基因检测存在以下调整:1)内含子长度较长需要全部覆盖才能准确找到融合断点;2)内含子内常见的重复区域高,GC 含量不利于探针的捕获;3)内含子内大量重复区域不利于精准找到融合断点。

针对以上 DNA 层面的融合检测的挑战,纳昂达进行了多方面的探索和研究。在基于多年捕获探针设计的经验积累和上百万条探针的实践应用,纳昂达在 DNA 融合片段捕获探针设计上进行不断的优化和改进。本文通过使用不同类型的融合检测软件对纳昂达的多款捕获产品在标准品和真实样本上的数据进行了分析和总结。从标准品的分析结果可以看出,在测序量满足分析需求的前提下,融合变异的丰度会大大影响融合软件的检出效率。目前来看针对临检常见的热点融合,Genefuse 软件的灵敏度最高,可以检出丰度在 1% 左右的融合事件。而对于探索研究的实验需求,Factera 和 Delly 更加合适进行融合事件分析,结果一般应进行 PCR 扩增和 Sanger 测序验证新发的融合事件。

欲了解更多详情,欢迎联系当地销售或400 8717 699 & support@njnad.com。


订购信息




产品名称

规格

货号

文库构建模块

NadPrep® DNA Library Preparation Module (for MGI), 96 rxn

NadPrep® DNA Library Preparation Kit (for Illumina®), E96

1002212

1002103

杂交试剂 

NadPrep® Hybrid Capture Reagents, 96 rxn

1005101

通用封闭

NadPrep® NanoBlockers (for Illumina®), 96 rxn

NadPrep® NanoBlockers (for MGI, DI), 96 rxn

1006102

1006208

Panel

NanOnco Plus Panel v2.0, 96 rxn

OncoFu Panel v2.1-Tech Access, 96 rxn

NanOnCT Panel v1.0, 96 rxn

1001111E

1001508

1001901


关于纳昂达科技

纳昂达科技秉承“ Nano Trans More ”的核心理念和“靶向精准,用心服务诊断”的奋斗宗旨,致力于为科研院校、医疗机构、临检单位、产业公司、测序服务商等提供专业化和高质量的靶向测序产品与闭环解决方案。

纳昂达科技已通过高新技术企业、江苏省科技型中小企业认定,并拥有> 2,000平米的高通量测序研发中心和> 4,000平米的GMP级别(YY/T0287-2017idt ISO13485:2016)体外诊断试剂生产基地,建立了从市场调研、产品设计、生产制造到售后服务完整的质量管理体系。

纳昂达专注于精准靶向试剂和配套自动化仪器的开发、生产、销售和服务,目前拥有MGI和Illumina双测序平台多款NadPrep®文库构建试剂盒和全套液相杂交相关产品。明星产品包括NGS全流程自动化工作站、肿瘤全外显子panel、泛实体瘤和血液肿瘤panel以及呼吸道病毒panel等,并提供全面完善的双平台捕获探针定制化服务。纳昂达科技的靶向捕获产品拥有与国际同行业媲美的高质量水准,获得了客户一致的信赖。

纳昂达的销售网络覆盖全国并已外延至海外地区。纳昂达将与客户共成长,对客户的需求全力以赴,为全球用户提供靶向测序解决方案和IVD试剂原料。


微信图片_20220316165635

微信号|nanodigmbiotech

扫码关注我们


参考文献

[1] Seo J S, Ju Y S, Lee W C, et al. The transcriptional landscape and mutational profile of lung adenocarcinoma[J]. Genome research, 2012, 22(11): 2109-2119.

[2] Benayed R, Offin M, Mullaney K, et al. High yield of RNA sequencing for targetable kinase fusions in lung adenocarcinomas with no mitogenic driver alteration detected by DNA sequencing and low tumor mutation burden[J]. Clinical Cancer Research, 2019, 25(15): 4712-4722.

[3] Davies K D, Lomboy A, Lawrence C A, et al. DNA-based versus RNA-based detection of MET exon 14 skipping events in lung cancer[J]. Journal of Thoracic Oncology, 2019, 14(4): 737-741.

[4] Beaubier N, Bontrager M, Huether R, et al. Integrated genomic profiling expands clinical options for patients with cancer[J]. Nature biotechnology, 2019, 37(11): 1351-1360.

[5] Kohsaka S, Tatsuno K, Ueno T, et al. Comprehensive assay for the molecular profiling of cancer by target enrichment from formalin‐fixed paraffin‐embedded specimens[J]. Cancer science, 2019, 110(4): 1464-1479.

[6] Chen S, Liu M, Huang T, et al. GeneFuse: detection and visualization of target gene fusions from DNA sequencing data[J]. International journal of biological sciences, 2018, 14(8): 843.

[7] Newman A M, Bratman S V, Stehr H, et al. FACTERA: a practical method for the discovery of genomic rearrangements at breakpoint resolution[J]. Bioinformatics, 2014, 30(23): 3390-3393.

[8] Rausch T, Zichner T, Schlattl A, et al. DELLY: structural variant discovery by integrated paired-end and split-read analysis[J]. Bioinformatics, 2012, 28(18): i333-i339.