我们猫就单纯多了,想吃的时候就吃,想睡的时候就睡,生气的时候大发脾气,伤心的时候嚎啕大哭。日记这种无聊的东西是绝对不会结构变异(SV)这一术语涉及了一系列基因变异,包括拷贝数变异 (CNV)、重复、易位和倒位 。许多研究都将结构变异体与常见和罕见的人类疾病联系在一起,表型包括了认知功能障碍、肥胖症和癌症易感性以及其它病症。因此,结构变异也已经成为日趋重要的研究领域。写的,也没有什么写的必要。

图 1 常见结构变异体示意图
染色体复杂结构变异(cxSV)包含多个结构变体的基因组重排,它们对人类基因组变异有很大影响,并可能导致孟德尔疾病。最近的研究表明,染色体复杂结构变异(cxSV)——包括三个或更多断裂点位点,比先前的了解更加富集和多样化,在发育障碍样本中平均检测到14个cxSV41。
高通量基因组技术的出现使cxSV的鉴定成为可能。然而,即使对于现代测序和微阵列平台,详细的断裂点分析仍然具有挑战性。纳米孔测序的读长长度等于DNA或RNA片段长度,已取得超过2Mb的超长读长。显然,这种长读长序列更可能跨越重复DNA和SVs的整个区域,能够提供一个更完整的遗传变异视角。此外,随着研究人员寻找新型疾病关联,单倍型定相(确定DNA片段的染色体源)越来越受关注,定相还可以解析复合杂合性,即特定基因或区域的两个等位基因具有不同的变异。
研究案例:解析染色体复杂结构变异
“长读长全基因组测序是研究重复区域断裂点分析的最佳技术。”
英国剑桥大学的Alba Sanchis-Juan及其同事正在研究cxSV与孟德尔疾病的关系。他们使用短读长测序技术筛查了来自神经发育或视网膜疾病患者的1342份样本,以确定与临床重要、疾病相关基因重叠的cxSV。在鉴定出的四个样本中,除一个样本外,其他所有样本均可以通过结合短读长测序、Sanger测序和微阵列分析来解析变异的性质。未解析样本的数据来自一位患有胎儿心动过缓(低心率)的女性新生儿,该数据表明cxSV结构存在两种选择性模式,其中基因CDKL5的一或两个断裂拷贝与早期婴儿癫痫性脑病相关(图2)。
为了表征cxSV的真实性质和可能的致病性,研究小组转向纳米孔技术提供的长读长测序功能。使用纳米孔低通全基因组测序方法,所有断裂点的覆盖度至少达到了4X,平均读长长度为8kb。长读长可以确定异常位点的定相,从而确定了父系遗传。定相后的读长也确定了CDKL5基因完整断裂拷贝的存在,这为拟议的模式提供了支撑证据(图2)。此外,纳米孔测序证实了由于DNA的重复性,而无法使用Sanger测序阐明的所有新断裂点位点,导致无法设计特异性引物。随后的基因表达分析表明, CDKL5的两个等位基因均在样本中表达,表明该变异可能是良性的。

图2使用纳米孔测序精确解析新生儿样本中的cxSV。短读长测序技术检测到一个与CDKL5重叠的“重复—倒位—重复”事件,但无法在cxSV结构和形成的两个模式之间进行解析。长纳米孔测序读长允许准确的定相和断裂点解析,从而确认存在一个完整的和一个断裂的CDKL5 拷贝,并支持拟议的模型1。蓝色 = 重复;绿色 = 倒位。图片改编自Sanchis-Juan等人。
文章来源:新技术
IEEE Spectrum
《科技纵览》
官方微信公众平台
往期推荐

