Lei Zhang's Paper Has Been Published in Nature Communications
在真核细胞中,蛋白质与核酸等生物大分子通过相分离形成生物分子凝聚物,在基因表达调控、胞内信号传导等重要生命活动中发挥精准的时空调控作用。近年来,越来越多具有特殊结构的凝聚物被报道,如“珍珠链”结构、“俄罗斯套娃”式嵌套结构、内部具有生物分子低密度腔室的空洞结构等。这些不同的结构对应独特的形成机制与生物学功能。其中,球壳凝聚物作为结构最为特殊的凝聚物类型,其形成机制一直是生物物理领域的研究重点与难点。
近日,北京大学北京国际数学研究中心/定量生物学中心张磊课题组与定量生物学中心齐志课题组、钱珑课题组、中国科学院过程工程研究所夏宇飞课题组在FET融合致癌蛋白形成球壳凝聚物的研究中取得突破性进展。他们发现FET家族融合致癌蛋白FUS-ERG可与含GGAA微卫星序列的双链DNA(dsDNA)形成独特的球壳共凝聚物,并通过体外生化实验、超分辨成像与数学建模相结合的方法,揭示了其“嵌套不对称相分离”的形成机制”。更具独创性的是,研究人员基于FUS-ERG-dsDNA球壳共凝聚物的结构特性,开发出独特的DNA操控技术,成功实现DNA信息的精准删除及层级分选,为DNA存储领域提供了全新技术路径。相关论文“Deciphering the molecular mechanisms of FET fusion oncoprotein–DNA hollow co-condensates”已发表于Nature Communications。

FUS-ERG是FUS/EWS/TAF15(FET)家族中一种典型的融合致癌蛋白,由FUS的低复杂度结构域(LCD)、RGG结构域与ETS家族转录因子ERG的DNA结合结构域(DBD)融合而成,可特异性识别基因组中的GGAA微卫星重复序列。体外液滴实验发现,FUS-ERG可以与随机序列的25-bp dsDNA形成内部均质的液滴型凝聚物;但当dsDNA中存在GGAA重复序列时,两者可自发组装成球壳共凝聚物,蛋白与dsDNA共同富集于球壳结构的壳层区域(图1)。

图1. FUS-ERG与GGAA dsDNA形成球壳共凝聚物
球壳型凝聚物具有一层特殊的内表面。研究团队通过向体系中加入RNA探针,探究FUS-ERG-dsDNA球壳共凝聚物内表面的生物物理性质,研究团队向体系中加入了RNA探针,发现RNA能高效穿透壳层并富集在腔体内,但无法渗透进入实心均质的凝聚物中(图2)。
为此,研究团队提出“嵌套不对称相分离”假说:FUS-ERG存在“闭合态”与“开放态”两种构象。在闭合态中,LCD与ERG结构域通过分子间相互作用紧密结合,RGG基序被埋藏;当GGAA dsDNA特异性地结合到ERG的DBD后,触发构象转变为开放态,RGG基序得以暴露。这些开放态的蛋白-DNA复合物向凝聚物内部扩散,暴露的亲水性RGG基序在内部积累形成亲水性内表面,而外部表面则由闭合态蛋白与缓冲液的相互作用维持稳定,最终形成内外表面不对称的中空结构(图2)。

图2. 嵌套不对称相分离驱动FUS-ERG-dsDNA球壳共凝聚物的形成
为从物理机制层面定量解析球壳共凝聚物的形成过程,团队开发了一个整合了分子信息的介观尺度相场模型。该模型巧妙地将蛋白-DNA复合物的浓度、疏水/亲水特性等关键分子信息转化为数学语言,成功模拟了从初始的DNA表面吸附到最终形成稳定球壳结构的完整动态过程。该模型不仅精确复现了球壳结构的形成,其预测的dsDNA在壳层上“内高外低”的不对称分布也与STED超分辨成像数据定量一致。同时,通过调整代表“结合亲和力”或“疏水性”的参数,模型能够分别再现使用低亲和力DNA或蛋白突变体时无法形成球壳结构的实验结果,从理论上验证了“嵌套不对称相分离”假说的物理基础。此外,该模型还成功区分了本研究中发现的“不对称”球壳结构与文献报道的“对称”囊泡结构,并成功预测了凝聚物对不同亲和力DNA的选择性排斥行为,该预测也为后续实验所证实,充分展示了模型的解释力与预测能力(图3)。

图3. 介观尺度的分子信息相场模型可复现并区分两种球壳凝聚物的形成机制
在DNA存储中,数据被编码到短DNA文库中,每个短DNA片段都带有独特的条形码序列,为后期的选择性随机访问提供索引。当前DNA存储领域面临的核心挑战之一是信息分子的特异性删除与动态调控,传统的磁珠技术操作步骤繁琐,并且容易造成非靶标DNA片段的损失,难以满足高密度存储文库的动态管理需求的缺陷。研究团队借助FUS-Gal4和FUS-ERG仅识别各自特异DNA序列的特性,将FUS-Gal4和FUS-ERG两种蛋白投入至混合了大量随机序列的DNA文库中,发现UAS dsDNA和GGAA dsDNA的删除效率接近100%,随机序列DNA的删除率仅为约20%;与之相对,无法形成球壳结构的9YS突变体融合蛋白虽然也能删除目标序列,但对随机序列DNA的删除率高达70%(图4)。这一结果证实球壳结构是实现高特异性删除的关键,可有效减少非特异删除造成的信息损失。更振奋的是,团队实现了DNA存储的动态层级数据选择:将GGAA和UAS序列作为多级信息单元条形码,先加入FUS-ERG形成球壳凝聚物,实现第一层级信息选择;之后向体系中加入FUS-Gal4,FUS-Gal4可完全剔除FUS-ERG并形成新的球壳凝聚物(图4),实现对DNA文件的第二层级选择。

图4. 基于FET融合蛋白-dsDNA球壳共凝聚物的DNA信息操控应用
该研究通过生物物理化学、数学建模与信息科学的深度交叉,实现了基础理论与应用技术层面的双重突破。在基础研究领域,首次阐明了FET融合致癌蛋白与dsDNA形成球壳共凝聚物的“嵌套不对称相分离”机制,为理解多组分凝聚物的结构多样性提供了新的理论框架,为相关疾病的治疗提供了全新思路。在应用技术领域,基于球壳共凝聚物开发的DNA操控技术具有显著优势:一是“微创”操作,能将对非目标DNA文库的破坏控制到较低水平,最大限度地保持了文库完整性;二是“可编程”识别,通过替换不同DBD可实现对任意目标序列的特异性识别;三是“动态”调控,利用不同DBD-DNA的结合实现信息单元的原位动态切换。这些特性使其在DNA存储、分子计算等领域展现出巨大的应用潜力。
北京大学定量生物学中心齐志教授、北京国际数学研究中心/定量生物学中心张磊教授、定量生物学中心钱珑副研究员、中国科学院过程工程研究所夏宇飞研究员为本文共同通讯作者。北京大学定量生物学中心博士后左琳彧、博士生郭骐瑞、博士后李承为本文共同第一作者。北大-清华生命科学联合中心张珂诚博士、北京大学定量生物学中心博士后陈岩草、博士生姜百翼、北大-清华生命科学联合中心陈知行研究员为本研究做出重要贡献。
文章链接:https://www.nature.com/articles/s41467-025-65069-4
