串联重复(Tandem repeats, TRs)是在整个人类基因组中常见的遗传突变,其长度从2个碱基对(bp)到超过100 bp不等。目前已知有超过70种疾病与T星空体育官方入口 星空体育官网Rs动态突变相关。TRs的分子特征包括重复数动态变化、高GC含量以及复杂的序列组成,这对于依赖PCR的传统RP-PCR和AL-PCR有极大的挑战。此外,重复区两侧微小变异可能会导致假阴/假阳的产生。Southern blot技术由于分辨率低、缺少具体序列信息、过程繁杂、DNA样本量需求大以及通量低等因素,限制了其在临床中的广泛应用。近年来,高通量测序(NGS)在遗传病诊断领域取得了显著进展,但由于其对GC含量的偏好性和短读长的限制,阻碍了其在临床诊断中的广泛应用。长读长测序(LRS)的出现为TRs的研究提供了新的机遇,尤其是在处理GC含量丰富和复杂序列方面。本研究旨在开发一个基于长读长测序以评估与疾病相关的已知TRs的panel,并探讨其临床应用价值。
本研究纳入了108个疑似动态突变疾病的样本,包括来自Coriell Institute的19个基因组DNA样本()和福建医科大学附属第一医院的89个临床样本。
为了实现对动态突变疾病的全面、精准和高效的基因筛查和诊断,课题组基于三代单分子长读长的高准确性优势,开发了dmTGS新技术(图1)。该技术能够高通量检测已知动态突变疾病中串联重复的扩增情况。既能精确检测重复数,又能准确提示具体序列信息。
dmTGS可准确地检测异常扩增等位基因(图2,绿框),相比于传统的分子技术如RP-PCR、AL-PCR和Sanger测序(图2,红框),提供了更精准的重复单元计数。这种精确度对于诊断一些疾病的正常和致病范围的重复数非常接近时至关重要,如AR(正常范围9-36,致病范围38-68)、HTT(正常范围6-35,致病范围36-250)和ATXN1(正常范围6-38,致病范围39-88)等。dmTGS可准确检测重复单元数目,其未来在临床中的广泛应用或将重新定义某些疾病的现有致病阈值,帮助临床确定某些动态突变疾病的空白阈值。
研究表明,FMR1 基因中CGG重复单元内AGG的插入会增加遗传稳定性,ATXN1、ATXN2、DMPK 和HTT 的中断序列有类似的作用。然而,目前的临床分子技术仅检测序列的扩增范围,无法精确重复序列具体信息,因此许多基因中插入其他序列的作用尚未完全理解。未来,dmTGS检测可以识别更多基因中的中断基序,并阐明它们对疾病发生、进展、预后和生殖的生物学影响。此外,dmTGS还可以检测到FMR1 中低水平的体细胞嵌合CGG扩增(图3),其对于前突变和完全突变的分析灵敏度分别为1%和5%,与RP-PCR相当。
可变数目串联重复序列(variable number tandem repeat, VNTR)表现出高度的多态性。目前已报道与疾病相关的基因有 PLIN4、EIF4A3、PRNP、CACNA1C、ABCA7 和WDR7,这类串联重复的检测对于传统方法是一个极大的挑战,如PLIN4 为99bp重复序列异常扩增,先前的研究仅通过PCR扩增跑胶大致确定扩增次数。而dmTGS能够提供详细的碱基序列信息(图4),这为研究PLIN4 肌病或其他VNTR重复单元多态性的分子机制及其对临床的影响提供最核心的数据来源。
为了进一步评估dmTGS的临床效用,本研究对57名临床高度疑似动态突变相关肌肉疾病的患者进行了检测,其中52例检测到异常扩增:1例GIPC1 基因GGC异常重复扩增导致的眼咽远端肌病2型、1 例NOTCH2NLC 基因GGC异常重复扩增导致的眼咽远端肌病3型、2例NUTM2B-AS1/LOC642361 基因GGC异常重复扩增导致的眼咽肌病伴脑白质病1型、48例DMPK 基因CTG异常重复扩增导致的强直性肌营养不良1型(DM1);5例疑似DM1患者结果为阴性,这与常规分子方法的结果一致,推测可能是由于其他未知基因导致。
在DMPK的阳性病例中,14.5%的DM1患者携带CCG中断,这明显高于先前报道的3%-5%。此外,检出了1例患者在传统分子方法漏检的情况,具体如下:
临床体征:神经系统检查显示面部肌肉萎缩,斧头脸、鹅颈外观,口齿不清,颈部屈肌肌力2级,上肢远端肌力4级。叩击性肌强直阳性。肌酸激酶水平正常。肌电图显示肌源性改变,大量强直电位。临床高度怀疑肌强直性营养不良症。
传统分子方法在面对GC富集区域、极长重复或由多样基序组成的重复序列时会遇到极大的挑战。本项目组开发了一种全面、精准、快速检测动态突变疾病的分子技术dmTGS,在与其它临床分子检测的并行比较中,该方法展示出了更优的效能和临床适用性。
