基因检测产品的诞⽣之初:膀胱癌尿液sWGS检测
# 基因检测产品的诞⽣之初 #
膀胱癌是指发⽣在膀胱黏膜上的恶性肿瘤,是泌尿系统最常见的恶性肿瘤之⼀。在我国,其发病率位居泌尿⽣殖系肿瘤⾸位,2020年全球膀胱癌新发病例573,278例,死亡病例212,536例,分别占癌症发病和死亡总数的3.0%和2.1%,其中男性膀胱癌的发病率(9.5/10万)和死亡率(3.3/10万)均为⼥性(1.7/10万和0.47/10万)的3~4倍(Sung et al., CA CANCER J CLIN, 2021)。
通过早筛早诊可以明显地提⾼膀胱癌肿瘤患者的⽣存时间和⽣存质量。早期膀胱癌的主要以膀胱根治术为主,术后根据病理类型和免疫组化结果进⾏卡介苗膀胱灌注或者化疗等,晚期膀胱癌主要以保守为主。据统计,70%的膀胱癌患者后会发⽣复发,所以需要进⾏长期的周期性复发监控,⼈均终⾝费⽤很⾼(膀胱癌在欧美是⼈均经济负担最⾼的肿瘤),所以可及的膀胱癌的早筛早诊和复发监控技术⼗分重要。
尿液是膀胱癌液体活检的好材料。在癌症患者的体内,肿瘤细胞通过凋亡、坏死或者主动释放了DNA到体液中形成细胞游离DNA(cell free DNA ,cfDNA),这种cfDNA称为循环肿瘤DNA(circulating tumor DNA, ctDNA)。由于膀胱特殊的⽣理结构,尿液与病灶直接接触;容易获得,⽆需医疗⼈员,可实现居家检测;患者不会产⽣不适感;获取量不受限制,因此尿液成为膀胱癌液体活检的好材料。
膀胱癌诊断的⾦标准是膀胱镜检查,另外还有传统的细胞遗传学技术如尿脱落细胞学检查和UroVysion荧光原位杂交(FISH) ,但其灵敏度和特异性等性能指标难以满⾜临床诊断的需要,尤其对低级别膀胱癌检测灵敏度较差,更⽆法实现膀胱癌的早期筛查。基于此,仁东医学⾃主开发了⼀种简单、经济、可靠的膀胱癌尿液sWGS(shallow whole genome sequencing,低深度全基因组测序)检测技术,该技术可以对膀胱癌待检者尿液中的cfDNA进⾏低深度全基因组测序以评估膀胱健康状态,转化产品将⽤于泌尿系统肿瘤的早筛和监测。
remember the time mv>turn all the lights on
What?什么是低深度全基因组测序
基因组领域中的研究者通常都趋向于获得更多的测序数据,⽐如全基因组测序平均测序深度⼀般为30X;全外显⼦组测序平均测序深度⼀般为100-200X;⽽为了检测低频突变使⽤超⾼深度测序技术的测序深度从⼏千到⼏万乘不等。不同的是,低深度全基因组测序(sWGS也称为shallow Whole Genome Sequencing 或low-coverage Whole Genome Sequencing)只需要0.1 - 3X 的测序深度,低深度全基因组测序技术最初在产前诊断中应⽤,它可以灵敏检出胎⼉的染⾊体异常。sWGS可以在极低深度的情况下仍然准确检测拷贝数变异(Copy Number Variation,CNV),其优势在于样本量低、周期短、成本低、精度⾼,是⼀种相对更便宜的⾼通量测序技术。
简单的民谣吉他谱图1. sWGS测序分析流程图
Why?为什么使⽤低深度全基因组测序
肿瘤早筛是肿瘤研究领域的热点,如果采⽤常规的影像学、单核苷酸突变等检测技术常常⼒有不逮,这是因为在癌变发
肿瘤早筛是肿瘤研究领域的热点,如果采⽤常规的影像学、单核苷酸突变等检测技术常常⼒有不逮,这是因为在癌变发⽣的早期肿瘤细胞的数⽬极低。随着肿瘤细胞的凋亡,少量的ctDNA会被释放到患者外周⾎或体液中。所以通过对外周⾎或者体液中的cfDNA进⾏全基因组的扫描来检测染⾊体结构异常在技术路径上具备可⾏性。sWGS 可⽤于临床相关的结构变异,例如致癌扩增、抑癌基因缺失和染⾊体不稳定性。
⽬前国内外已有许多研究团队进⾏基于sWGS的肿瘤检测算法和肿瘤分⼦标记物的开发:
sWGS的应⽤案例1
图2. 多组学维度HCCseek模型原理⽰意图
北京⼤学深圳医院团队对⼊组的76例初诊的肝细胞癌(hepatocellular carcinoma, HCC)患者和247例健
康受试者进⾏了⼀项名为HCCseek的检测。采⽤cfDNA sWGS检测技术, 选取了两个癌症特异性地貌特征- 基因拷贝数畸变和⽚段⼤⼩,同时,结合肝癌特异性肿瘤标志物AFP,通过机器学习构建多组学多维度算法模型HCCseek,⽤于计算受检者罹患肝癌概率值PHCC。检测灵敏度为75.0%,特异度为98.0%,准确度为92.6%,AUC为0.954,在I期HCC的灵敏度为58.6%[1]。
sWGS的应⽤案例2
小米铃声
图3. 研究概况图
美国国家癌症研究所和华盛顿⼤学医学院的联合研究团队对23名PN(良性丛状神经纤维瘤)患者、14名尚未接受的MPNST(恶性周围神经鞘瘤)患者和16名健康个体采集的⾎液样本,利⽤cfDN
A⽚段组学和超低深度全基因组测序(ultra-low-pass whole genome sequencing ,ULP-WGS)技术将MPNST与良性PN前体区分开来,预处理准确率达86%。同时,研究结果显⽰,利⽤ULP-WGS进⾏cfDNA⽚段分析有潜⼒成为监测反应的⽣物标志物检测⽅法,并作为MPNST早期检测的筛选分析[2]。
sWGS的应⽤案例3
图4. 研究设计流程图
北京基因组研究所和北京⼤学第⼀医院研究团队通过对95名⽆癌个体和65名尿路上⽪癌(UC)患者、58名肾癌患者和45名前列腺癌患者的尿液cfDNA进⾏sWGS,评估了拷贝数改变(copy number aberrations ,CNA)。研究者使⽤⽀持向量机开发了基于CNA特征的诊断分类器来检测UC(UCdetector)。该模型在⼀个独⽴队列(52名患者)中得到进⼀步验证。来⾃90例上尿路上⽪癌(UTUC)肿瘤标本的基因组测序数据和来⾃癌症基因组图谱的410例膀胱尿路上⽪癌(UCBs)的CNA数据⽤于验证分类器。研究者将32例UC患者尿沉渣基因组测序数据与cfDNA进⾏⽐较,为了监测效果,研究者还收集了7名后患者的cfDNA。尿液cfDNA是⽐尿沉渣更敏感的替代品。UCdetector检测UC的中位临床敏感性为86.5%,特异性为94.7%,同时,UCdetector在独⽴验证数据集中表现良好。值得注意的
是,UCdetector选择的CNA特征是UTUC和UCB的特异性标记。此外,cfDNA中CNA的变化与效果⼀致。同时,在70.1%的患者中,同样的策略可以将泌尿⽣殖系统癌症定位到起源组织[3]。
How?仁东医学怎么做膀胱癌尿液sWGS
图5. 仁东医学膀胱癌尿液sWGS测序分析流程图
国内外研究者推出了许多基于sWGS检测CNV的软件,主流的分析策略是read-depth(RD)。RD的原理基于read覆盖深度和拷贝数的相关性,即缺失区域测序深度相对低,插⼊区域测序深度相对⾼。采⽤滑窗的⽅式进⾏测序深度分布统计,测序对⾼GC含量区域具有偏好,统计时对每个窗⼝内的测序深度进⾏校正,利⽤校正之后的RD值,对邻近的bin 进⾏聚类,获得CNV拷贝数。
低深度全基因组测序(sWGS)得到的覆盖深度呈现出来的是⼀个泊松分布——因为基因组上任意⼀个位点被测到的⼏率都是很低的,与baseline(背景库)进⾏⽐较得出gain或者lost的结论。
软件检测CNV主要包括三步:1.数据标准化, 2.分段(segmentation), 3.bin 聚类。
数据标准化:建⽴健康⼈的尿液cfDNA深度基线;根据参考基因组的已知特征(重复序列、GC 含量、可映射性和多态性等)校正。
分段:对于RD的软件算法,bin size的设定⼗分关键。由于cfDNA的断裂⽅式,释放到体液或⾎液中的cfDNA并不是均匀覆盖基因组。我们发现对于低深度全基因组测序数据,bin size越⼤噪⾳越少,但是对短⽚段CNV不敏感。
bin 聚类:使⽤HMM等算法对邻近的bin进⾏聚类,聚为⼀类的bin具有相同的CNV拷贝数。
尿液“CNV-burden算法模型”的开发
仁东医学⾃成⽴以来,坚持扎根泌尿垂直瘤种,凭借多年来在⽣命组学与⼤数据信息技术领域的深厚技术与资源积累,在膀胱癌早筛早诊技术领域中开展了基因检测产品的研发。⾯对早期⽆症状膀胱癌患者的尿液中的ctDNA浓度低、易降解、早期诊断产品灵敏度不⾼等多项挑战时,仁东医学湿实验研发团队迎难⽽上,对提取建库技术不断优化,终于实现了测序DNA input量低⾄1ng,测序深度低⾄0.1X均可以稳定检出的可喜成果。
走向复兴伴奏与此同时,仁东医学算法开发团队提出了⼀种基于尿液cfDNA低深度全基因组测序预测膀胱癌的机器学习模型。该模型在⼀组独⽴数据验证中,其灵敏度、特异性和AUC均取得了不错的结果,对及时、准确地诊断早期⽆症状膀胱癌具有重要科学意义和临床价值,该模型还能够准确提⽰膀胱癌患者术后的进展情况。待检者只需寄送⼀份50ml的晨间尿液样本⾄仁东医学实验室,5个⼯作⽇即可获得检测结果。总之,该技术所体现⽆创、便捷的特点,可作为膀胱癌的早期检测筛查⼯具,未来我们也将通过进⼀步实验证实其诊断效果,加快进⼊临床成果转化,为更多患者带来福⾳。
下期预告
下期预告
金晨2017年怎么了2022年2⽉23⽇(下周三)早上8点钟,“仁东医学六周年全新企划”第⼗三期,也是我们《报告解读系列:怎样看懂⼀份基因检测报告》的第三课,由仁东医学遗传咨询部来和⼤家谈谈《怎么看懂⼀份基因检测报告:遗传性变异解读规则》。敬请关注!
参考⽂献
[1] Meng, Zuowei, et al. "Noninvasive Detection of Hepatocellular Carcinoma with Circulating Tumor DNA Features and α-Fetoprotein." The Journal of Molecular Diagnostics 23.9 (2021): 1174-1184.
[2] Szymanski, Jeffrey J., et al. "Cell-free DNA ultra-low-pass whole genome sequencing distinguishes malignant peripheral nerve sheath tumor (MPNST) from its benign precursor lesion." medRxiv (2021).
[3] Ge, Guangzhe, et al. "Urothelial carcinoma detection based on copy number profiles of urinary cell-free DNA by shallow whole-genome sequencing." Clinical chemistry 66.1 (2020): 188-198.