开运官网app Cell | 别再只问“致不致病”: 1140万张细胞图像再行界说变异功能解读

团结个基因变异,为什么有时指向肿瘤风险,有时却攀扯神经发育?为什么一个看似“无益”的突变,并不总所以团结种样子碎裂细胞?
5月12日,《Cell》的连络报谈“Image-based, pooled phenotyping reveals multidimensional, disease-specific variant effects”,给出了一个很值得想考的谜底:变异的影响不是一条直线,而是一派多维空间。
这项连络竖立了变异原位测序(variant in situ sequencing, VIS-seq),把大鸿沟变异筛选(multiplexed variant assay)和细胞成像(cell imaging)接在全部。它不是只问“这个变异是否致病”,而是追问:它让卵白变少了吗?跑错方位了吗?活性变了吗?细胞结构随之改变了吗?

别急着判“好”或“坏”:变异果真改变的是一组表型
传统功能执行常把变异压缩成一个读数:细胞长得快不快,卵白品貌(protein abundance)高不高,敷陈基因强不彊。这类读数高效,但也容易丢掉关节细节。一个突变可能同期影响卵白折叠、亚细胞定位(subcellular localization)、酶活性、细胞形态,致使不同细胞类型中的判辨也不一致。
VIS-seq的中枢,是给每个抒发特定卵白变异的细胞配上可在显微镜下读出的“条形码”。连络东谈主员把变异文库整合进细胞,再通过环状RNA条码(circular RNA barcode)进行原位测序(in situ sequencing),同期对细胞进行多通谈染色和成像。这么,每个细胞齐有两类信息:它抒发哪个变异,以及它在显微镜下呈现何如的分子和形描摹态。
这个工夫上的关节改变并不仅仅“能拍照”。环状RNA条码让读数大幅晋升:与线性构件比拟,每个细胞的读数增多约13倍;在非千里默细胞中增多约5倍。93%的抒发环状RNA条码细胞领有至少两个测序读数,而线性RNA条码在56%的全部细胞中惟有0或1个读数。抒发框还处治了指令多颖异细胞(induced pluripotent stem cells, iPS cells)极端分化细胞中常见的转基因千里默问题:在iPS细胞传代14天后仍保管抒发,在分化的心肌细胞中56天后仍可检测到抒发。
最终,连络东谈主员从约1140万张细胞图像中,赢得了接近3000个LMNA和PTEN变异的高维形态谱(morphological profile)。这意味着,变异不再仅仅数据库里一转“pathogenic”或“benign”的标签,而是细胞里一组可量化、可比较、可跟踪的变化。
LMNA:核膜变形背后,不唯有“卵白蚁合”这一种故事
LMNA编码核纤层卵白A(lamin A),它位于核膜内侧,参与保管细胞核口头、机械认知性和基因调控。LMNA变异可导致一组被称为核纤层卵白病(laminopathies)的疾病,包括肌病、心肌病、脂肪养分不良和早衰相干表型。但恒久以来,一个难点是:团结个结构域中的不同变异,为什么会形成不同细胞效力?
连络东谈主员聚焦LMNA中央杆状结构域(rod domain)178—273位氨基酸,这是致病变异热门区域。他们构建了跨越1700个带mEGFP标签的LMNA同义、错义和移码变异,在LMNA敲除的U2OS细胞中抒发,并成像约1000万个固定细胞。经由条形码判读和质料终了,最终赢得1767个变异、约660万个细胞的图像和特征数据。每个细胞被索要1077个可重叠形态特征,经由筛选后形成332个用于建模和聚类的特征;另有407个“掷中特征”用于阐述变异效应。
数据最初考证了轨范的可靠性。形态影响分数(morphological impact score)在重叠执行中的相干性达到Pearson r = 0.88,区别度分数(distinguishability score)达到r = 0.92。关于已知会导致lamin A蚁合的14个变异,区别度分数识别蚁合对照的AUC达到0.99;关于ClinVar中的致病或可能致病变异,AUC达到1。换句话说,仅凭无偏的细胞图像特征,VIS-seq就能把很多已知额外变异从雷同野生型的布景均分出来。
更特意旨真理的是,LMNA变异并莫得落在一条节略的“毁伤进程轴”上。连络东谈主员将变异分红10个形态簇。76个同义变异中的90%落在接近野生型的簇中,同期也有519个错义变异判辨较和睦。相悖,已知蚁合变异全部出咫尺第8、9、10簇;这些簇还包含380个错义变异,占错义变异的24%。它们共同秉性是核内和核鸿沟lamin A品貌镌汰、颗粒度升高,并奉陪核圆度下落,辅导卵白从核鸿沟转机到蚁合体,减弱了保管核形态的才调。
但故事并未止于“蚁合”。第2、3、4簇包含454个错义变异,占28%,主要判辨为核内或核鸿沟lamin A品貌镌汰,其中第3簇有大小不一的蚁合,第4簇则更像是低品貌但不显然蚁合。最出东谈主预感的是第1簇:292个错义变异,占18%,反而让细胞核圆度显耀增多,同期核里面lamin A品貌升高。这辅导其中部分变异可能不是节略失功能(loss of function),而更接近赢得功能(gain of function)或改变拼装情状。
一个关节数字很值得温煦:44%的被分析错义变异扰动了核圆度,而惟有20%改变了lamin A核颗粒度。也便是说,要是只盯着“有莫得蚁合”,会漏掉卓越一部分果真影响细胞结构的变异。
一段连结区,揭开lamin A拼装的结构逻辑
VIS-seq还把形态变化拉回到卵白结构。LMNA杆状结构域包括两个α螺旋卷曲螺旋亚结构域(coiled-coil subdomains),即coil 1B和coil 2A,中间由linker 12连结。结构模子中,linker 12究竟更像认知螺旋,如故柔性连结区,一直存在考虑。
这项连络的变异图谱给出了功能层面的陈迹。linker 12位置的错义变异热烈富集于第1簇,开运体育中国app官方手机版也便是“核圆度升高、lamin A品貌保留”的表型;而coil位置的变异更容易落入蚁合相干簇或低品貌簇。对脯氨酸替换(proline substitution)的分析也扶直这少许:19个linker 12位置中有17个被归入linker组,占89%;而α螺旋组位置全部位于coil亚结构域。
更细的结构分析炫夸,不同战役界靠近应不同细胞效力。67%的二聚体朝向位置(dimer-facing positions)属于品貌明锐组,而100%的多聚体朝向位置(multimer-facing positions)属于蚁合明锐组。换句话说,碎裂二聚体界面更可能让卵白品貌下落;碎裂多聚体界面更可能带来蚁合和核圆度下落。这不是节略的“越不认知越致病”,而是结构被扰动的位置决定了细胞读出的类型。
PTEN:团结个基因,为什么能连到肿瘤,也能连到神经发育?
第二个主角是PTEN(phosphatase and tensin homolog)。PTEN是脂质和卵白磷酸酶,负向调控PI3K-AKT-mTOR通路。胚系PTEN变异与PTEN错构瘤肿瘤概括征(PTEN hamartoma tumor syndrome, PHTS)相干,也可见于自闭症谱系阻碍(autism spectrum disorder, ASD)、大头无理和发育冉冉(developmental delay, DD);体细胞PTEN突变则常见于肿瘤。
连络东谈主员在PTEN敲除iPS细胞及NGN2指令的神经样细胞(NGN2-induced neuron-like cells)均分析了1228个PTEN催化结构域变异。数据鸿沟很大:iPS细胞跨越280万个,神经样细胞跨越200万个。iPS细胞最终形成1174个特征中位数或地球转移距离(earth mover’s distance, EMD)构成的形态谱,神经样细胞形成1036个对应特征。
这里最进击的三个“路标特征”(landmark features)分别是:PTEN品貌,由mEGFP-PTEN强度反应;脂质磷酸酶活性,由pAKT强度反应;核质定位,由DAPI-PTEN像素相干性反应。VIS-seq测得的PTEN活性与既往酵母相宜度执行高度相干,在iPS细胞中r = -0.84,在神经样细胞中r = -0.86;PTEN品貌与既往东谈主源细胞品貌执行相干,在两类细胞均分别为r = 0.78和0.77。这证实新轨范不是脱离已有体系,而是在已有单维读数之上增多了空间和细胞形态信息。
但细胞类型各别很快出现。43%的变异在iPS细胞中改变PTEN品貌,而在神经样细胞中这一比例为52%;核质定位受扰动的比例则相悖,iPS细胞为67%,神经样细胞为48%。这辅导团结个PTEN变异在不同细胞布景下可能清晰不同瑕疵。
更关节的是定位。连络东谈主员用模子扣除了品貌和活性对DAPI-PTEN相干性的影响,得到错定位分数(mislocalization score)。收尾炫夸,在膜衔尾相干位置163、164以及底物特异性相干位置167、168,43个被分析变异中有72%出现较高错定位分数,但pAKT水平仍接近野生型;而相邻的活性明锐位置165、166、170、171中,这一比例惟有27%。这证实有些PTEN变异并不显然碎裂AKT通路读数,却会把卵白推向额外审定位。
ASD不是“低配版PHTS”:定位信息改变了判断样子
临床相干分析进一步证实,多维表型为什么进击。连络东谈主员整理了5个可能良性(likely benign, LB)和62个致病或可能致病(pathogenic/likely pathogenic, P/LP)PTEN错义变异,又纳入66个来自541名PHTS或ASD/DD先证者的胚系变异,以及22个COSMIC数据库中的肿瘤体细胞变异。在这些临床相干变异中,31个只关联ASD/DD、PHTS或体细胞肿瘤中的一种表型,41个关联多个临床表型。
要是只看总体毁伤,ASD/DD相干变异的形态影响分数低于PHTS或肿瘤相干变异;这与往日把ASD/DD相干PTEN变异知道为低功能型(hypomorphic)的不雅点部分一致。但VIS-seq炫夸,它们并不仅仅“毁伤较轻”。ASD/DD相干变异在iPS细胞中更显然地额外干预细胞核,而PHTS和肿瘤相干变异莫得判辨出雷同模式。DAPI-PTEN相干性是ASD/DD相干变异中效应最大的掷中特征;PHTS相干变异更强地扰动pAKT通谈特征。
当连络东谈主员用三个路标特征测验线性扶直向量分类器(support vector classifier, SVC)来区别gnomAD对照、PHTS相干变异和ASD/DD相干变异时,iPS细胞数据的五折交叉考证宏平均AUC达到0.92。比拟之下,酵母相宜度执手脚0.76,东谈主源细胞品貌执手脚0.62;AlphaMissense和EVE等模子在这一三分类任务中约为0.76。这个差距提醒咱们:关于疾病特异性阐述,知谈“变异有多坏”时时不够,还要知谈“它以哪种样子坏”。
咱们是否低估了变异的复杂性?
该连络的价值,不是某一个AUC,也不是某一个变异簇,而是它改变了看待变异的坐标系。LMNA的例子证实,蚁合、低品貌、核形态改变不错由不同结构扰动旅途产生;PTEN的例子证实,肿瘤风险和神经发育相干表型可能对应不同分子—细胞表型组合,而不是团结条“致病强度轴”上的不同刻度。
这也阐述了为什么现存模子在某些任务上会遭受鸿沟。AlphaMissense、EVE和REVEL等轨范在总体变异效应瞻望上很有价值,但在该连络中,它们与LMNA形态影响分数的相干性惟有Spearman ρ = 0.27-0.35;与PTEN形态影响分数的相干性较高,为0.69-0.84。进一步看单个表型,模子对lamin A蚁合、核圆度、PTEN品貌和PTEN定位的相干性齐有限。原因并不难知道:保守性和结构信息能匡助判断“可能无益”,但偶然能判断“细胞里具体那儿出了问题”。
诚然,VIS-seq也不是极度。连络使用外源抒发系统,存在抒发量相干伪影风险;荧光卵白和会可能改变卵白认知性或功能,N端标签对lamin A尤其需要严慎。轨范本钱约为每个细胞0.001好意思元,但手动原位测序耗时显然:12 bp条码至少需要3天;要是对一个约8000个错义变异的典型东谈主类卵白作念双重叠平铺执行,约需4周。形态特征的生物学阐述也仍需要东谈主工判断和后续考证。
即便如斯,VIS-seq也曾建议了一个更高条件:将来的变异阐述,不应只输出一个“致病概率”,还应尽可能给出表型旅途。一个变异让卵白减少、错位、失活、蚁合,如故改变细胞结构?它在iPS细胞、神经细胞、心肌细胞中是否相易?它更接近肿瘤相干机制,如故神经发育相干机制?
当这些问题被放到显微镜下,基因变异不再仅仅序列中的一个字母变化,而是一连串从分子到细胞的事件。果真进击的也许不是把每个变异尽快塞进“良性”或“致病”的格子里,而是看清它在细胞中走向了哪条旅途。
参考文件
开云体育官方网站 - KAIYUNPendyala S, Partington K, Bradley N, McEwen AE, Straub G, Kim HJ, Fayer S, Holmes DL, Sitko KA, Garge RK, Wang ZR, Wheelock MK, Vandi AJ, Powell RL, Friedman CE, McDermot E, Kishore N, Roth FP, Rubin AF, Yang KC, Starita LM, Noble WS开运官网app, Fowler DM. Image-based, pooled phenotyping reveals multidimensional, disease-specific variant effects. Cell. 2026 May 12:S0092-8674(26)00466-6. doi: 10.1016/j.cell.2026.04.031. Epub ahead of print. PMID: 42127894.