新生哺乳动物染色质的单分子可及性景观研究-星空体育官方网站

新生哺乳动物染色质的单分子可及性景观研究

发布：2026-03-15 20:06:46 浏览：次

　　DNA复制过程中，染色质结构经历精确的解离与重建，这一过程对表观遗传信息的传递至关重要。传统研究方法在解析新生染色质结构时存在明显局限：基于微球菌核酸酶(MNase)或转座酶(Tn5)的技术具有破坏性，且短读长测序无法保留单分子水平上蛋白质-DNA相互作用的连续性信息。2025年1月发表在《Cell》的这项研究通过开发复制感知单分子可及性图谱(RASAM)技术，首次在单分子分辨率下系统描绘了哺乳动物新生染色质纤维的全基因组结构特征。该技术整合了BrdU标记、腺嘌呤甲基转移酶足迹分析和PacBio长读长测序，实现了对复制状态与染色质可及性的同步检测。研究揭示了新生染色质普遍存在一种超可及性状态，该状态由组蛋白分子伴侣CAF-1和序列特异性转录因子CTCF等调控，在复制后数小时内逐步成熟为稳态结构。这一发现为理解表观遗传继承机制提供了全新的单分子视角。

新生哺乳动物染色质的单分子可及性景观研究(图1)

　　RASAM方法的核心创新在于利用PacBio测序仪的动力学特征直接检测BrdU掺入。研究团队首先构建了卷积神经网络(CNN)模型，通过分析聚合酶在500bp双链DNA瓦片上的脉冲间隔时间(IPD)和一热编码序列，预测BrdU的存在。训练数据包含PCR扩增产物、鼠源和人源基因组DNA样本，覆盖纯dTTP、纯BrdUTP及混合条件。验证结果显示，该模型对保留样本的分类准确率达0.934(AUC值)，在未标记对照中假阳性率仅为0.21%-0.32%，且分类稳定性不受AT含量影响，仅在CCS读段数和读长极端情况下略有波动。

　　技术流程上，研究者在K562细胞和E14小鼠胚胎干细胞(mESC)中进行不同时间(5分钟至24小时)的BrdU标记，随后用高活性非特异性腺嘌呤甲基转移酶EcoGII对核小体保护的DNA进行甲基化修饰。HiFi PacBio测序可同时捕获BrdU掺入信号和m^6dA修饰模式。通过比较标记与未标记细胞的读长分布，证实BrdU掺入不影响测序仪的延续性；而甲基化酶保护足迹大小分布在两类分子间高度一致，均富集单核小体尺寸(约150bp)片段。LC-MS质谱分析进一步验证了BrdU掺入量的时间依赖性，K562细胞在24小时标记后BrdU浓度达2.088mM，显著高于mESC的0.509mM，这与流式细胞术显示的K562更高S期比例(29.0% vs 4.4%)相符。这些严格验证确立了RASAM作为非破坏性、单分子水平研究新生染色质的可靠平台。

　　应用RASAM技术，研究获得了总计106.2Gb数据，涵盖K562细胞4个时间点(10分钟、2/6/24小时)和mESC 6个时间点(5/10分钟、1/6/12/24小时)的重复样本。通过计算BrdU阳性分子与未标记分子的单分子平均可及性比值(可及性倍数变化)，发现早期标记(10分钟)的新生染色质显示出显著升高的可及性：K562细胞达37.6%，mESC达23.2%。这一效应在生物学重复中高度可重复，且持续至复制后6小时，在接近完整细胞周期(24小时)时才回落至稳态水平。脉冲追踪实验证实，1小时BrdU标记后追踪12小时，可及性差异从初始的27.8%降至5.5%，表明超可及性是一个逐步解决的动态过程。

　　足迹大小分布分析揭示了超可及性的结构基础。在K562细胞10分钟标记样品中，稳态核小体保护DNA中位数为135±26.7bp，而新生核小体仅保护115±26.7bp；mESC中相应数值为122±26.8bp vs 109±26.8bp。这种缩短的足迹提示新生核小体存在未完全包裹状态。更重要的是，新生染色质显著富集亚核小体尺寸的颗粒(20-100bp)，以及介于单核小体和双核小体之间的欠包裹中间态。这些特征在H3K4me3标记的活跃启动子、H3K27me3标记的抑制性区域，乃至重复序列(主/次卫星DNA、端粒、rDNA)等通常难以测绘的基因组区域均一致存在，说明超可及性是新生染色质的普遍属性，而非局限于特定表观遗传域或复制时间区域。

　　为解析核小体排列规律，研究者对每条纤维首个1kb区域进行自相关分析(图3A)。自相关函数可量化核小体间距的周期性与规则性，通过Leiden聚类算法将单分子划分为不同纤维类型。在K562和mESC中分别鉴定出7种和5种纤维类型，包括规则间距型(核小体重复长度NRL 176-213bp)和不规则型(IR1-IR3)。令人惊讶的是，即使在复制后10分钟，66.5%的K562和69.0%的mESC新生纤维已呈现规则间距排列，表明核小体快速有序沉积。

　　然而，富集分析揭示了时序动态差异。K562中NRL178、IR2和IR3纤维在10分钟显著富集(优势比OR=1.27-1.55，q1E-19)；mESC中长NRL213和不规则IR纤维同样早期富集(NRL213 OR=1.10，q=1.06E-3；IR OR=1.17，q=2.56E-14)。脉冲追踪数据进一步证实，长NRL和不规则纤维在早期时间点富集，随追踪时间延长而减少。这意味着新生染色质虽然能快速建立规则阵列，但更倾向于形成间距更宽、排列更不规则的结构，且这种偏好性在复制后1-6小时内逐步消退。

　　序列约束性分析显示，不规则新生纤维的可及性模式与AT二核苷酸含量的相关性显著高于稳态纤维(K562: p=1.54E-12; mESC: p=1.12E-14)，而规则纤维则无此差异。这表明在未经历完整重塑前，新生核小体定位更受DNA序列偏好性约束，暗示ATP依赖的重塑酶在成熟过程中逐步消除序列偏倚，实现更精确的染色质结构重编程。

　　复制偶联的组蛋白沉积主要由CAF-1分子伴侣介导。研究利用Chaf1a(p150亚基)携带dTAG降解决定子的mESC系，通过dTAGV-1配体处理实现急性降解。Western blot确认处理3小时后蛋白水平下降约80%。RASAM分析显示，CAF-1缺失导致新生纤维可及性进一步升高，15分钟和1小时标记样品的倍数变化分别增加1.3倍和1.5倍，而10分钟时差异不显著(图4B)。这可能反映CAF-1缺失减缓复制叉延伸(BrdU掺入率下降)，延迟了结构异常的表现。

　　从纤维类型看，CAF-1降解后，新生染色质中短NRL178和NRL194纤维比例急剧下降(OR=0.23和0.19, q1E-100)，不规则IR1和IR2纤维相应增加(OR=3.37和3.53)。这种变化在稳态纤维中幅度较小。足迹分布分析显示，CAF-1缺失减少了新生纤维中大于单核小体的双核小体尺寸片段比例(图4C箭头)，提示CAF-1促进相邻核小体的紧密排列。这些数据共同表明，CAF-1通过在新合成DNA上快速沉积H3-H4四聚体，填充单分子间隙，从而抑制超可及性并建立规则的核小体阵列。

　　超可及性的全基因组特征在转录因子结合位点呈现异质性。研究者计算了150bp窗口内BrdU阳性/阴性纤维的可及性比值，发现CTCF、NRF1、REST和SOX2等ChIP-seq验证的结合位点，其新生染色质可及性显著低于随机motif匹配序列(图5A, S6A-B)。相反，高表达基因的转录起始位点(TSS)未显示显著差异(图S6C)，提示存在调控特异性。

　　可视化分析显示，CTCF位点在稳态下呈现特征性核小体相位排列，motif中心出现由CTCF结合导致的可及性凹陷(图5E)。新生染色质在10-15分钟时该凹陷变浅，表明CTCF占位率降低，motif可及性下降。Leiden聚类将CTCF相关分子分为可及型(A)和核小体占据型(NO)，富集分析显示A状态在早期时间点显著减少(10分钟OR=0.776, q=3.92E-2)，1小时后才恢复稳态水平(图5G)。这表明CTCF与新生核小体存在竞争性结合，复制后CTCF需要1小时以上才能完全重新占据其靶位点。

　　与此不同，高表达TSS区域在新生染色质中迅速重建核小体缺失区(NFR)和+1核小体的精确定位(图5F)。聚类分析显示，A与NO状态在所有时间点均匀分布(OR≈1, q0.05)，说明转录活跃区域的开放染色质结构在复制后10分钟内即已重建。这种快速恢复可能依赖于转录重启和基础转录机器的招募，而CTCF等绝缘子元件则经历更缓慢的再平衡过程。

　　为验证CTCF是否直接支配超可及性，研究在CTCF-AID可降解细胞系中进行RASAM分析(图6A)。6小时生长素(auxin)处理导致CTCF蛋白水平下降95%(图S8A)。尽管稳态纤维的模式未受影响(图6B上图)，但CTCF缺失使新生纤维在CTCF motif处的可及性差异从1.08倍提升至1.28-1.35倍(15-60分钟，图6C)。这种增强效应在6小时标记后消失(图S8C-D)，表明CTCF结合直接抑制局部超可及性。

　　机制上，CTCF可能通过两种途径发挥作用：其一，作为空间位阻物理性阻止CAF-1或其他组蛋白沉积因子占据motif序列；其二，招募ISWI家族重塑酶(如SNF2H)建立侧翼核小体阵列，从而锁定染色质结构。当CTCF缺失时，新生核小体可随意占据motif，导致纤维呈现规则性下降、可及性升高。该结果不仅证实CTCF是染色质结构的关键继承者，更揭示了序列特异性因子在复制后染色质调谐中的主动调控作用。

　　综合上述发现，研究者提出染色质纤维复制的层级调谐模型(图7)。复制叉通过后，CAF-1在数分钟内沉积组蛋白，建立基础的规则核小体阵列。然而，这些新生纤维由欠包裹的核小体和亚核小体颗粒组成，构成次优调控底物。转录活动可快速重启，在TSS重建NFR，但绝缘子元件(如CTCF位点)处的稳态因子结合需要更长时间(1小时)才能完全恢复。此间，其他调控因子(重塑酶、甲基转移酶、拓扑异构酶)逐步修饰染色质，最终完成成熟。

　　该模型解决了几个关键问题：首先，超可及性提供了表观遗传信息传递的时间窗口，允许细胞核查并修正错误沉积的组蛋白；其次，调控元件的异质性成熟速率确保了转录程序优先重建，而染色质结构域的精细划分则在后续步骤中完成；最后，CTCF等因子的竞争性结合防止了其在新生染色质上的异常占位，避免绝缘子功能的暂时性紊乱导致基因表达失控。

　　研究坦率指出RASAM的若干局限。其一，未对BrdU阳性分子进行富集，依赖深度测序捕获足量新生纤维，尽管Cs2SO4密度梯度离心可提升5倍富集效率，但尚未成为标准流程。其二，活细胞标记可能存在时间模糊性，即BrdU掺入时间不完全等于复制后时间，轻度固定或可提升精度。其三，CNN模型目前仅能进行500bp瓦片级别的预测，无法达到单碱基或单链分辨率，未来需整合更多训练数据提升灵敏度。此外，研究未直接区分前导链和后随链的染星空体育登录入口星空体育在线官网色质组装差异，而近期工作表明CAF-1在两条链上的沉积机制可能存在不同。

　　这项研究通过技术创新实现了对哺乳动物复制后染色质单分子结构的首次全景式观测，揭示了新生染色质超可及性这一普遍存在的过渡态。数据明确显示，CAF-1介导的组蛋白沉积和CTCF等序列特异性因子的竞争性结合，共同塑造了染色质纤维的层级成熟路径。该工作不仅验证了早期生化观察的生理意义，更将染色质复制研究推进到单分子分辨率，为理解发育、疾病中表观遗传信息维持机制开辟了新途径。未来结合更多因子降解、更高时间分辨率以及不同细胞类型的比较研究，将有望揭示更精细的染色质继承密码。

星空平台（中国）官方网站