2020年2月science advances杂志一篇研究报道了中国科学技术大学生命科学与医学部生命科学学院薛天教授课题组与瞿昆教授课题组利用atac-seq等多组学技术分析了发育中的人视网膜及hipsc诱导的视网膜类器官(retinal organoids, ros)的染色质可及性和转录调控动态过程。研究结果发现ros在很大程度上可以模拟人类视网膜生成,从中也发现了人和小鼠视网膜发育过程中不同的染色质特征,并进一步重建了调控人与ro视网膜发生的转录调控网络。
研究背景
视网膜由多种类型的神经元(光感受器、水平细胞、双极细胞、无长突细胞和视网膜神经节细胞)及从视网膜祖细胞(rpcs)分化的单一类型的神经胶质细胞(műller细胞)组成,视网膜是研究cns中神经发生调控一个很好的系统。在破译啮齿类动物视网膜神经发生的复杂分子机制方面已经取得了巨大的进展。相比之下,关于人类视网膜发生的分子机制的知识仍然匮乏。人类视网膜研究的最新进展为发育中的人类视网膜提供了有价值的基因表达和表观遗传信息。然而,转录调控网络的分析可以深入了解相互作用的转录因子(tfs)的调控,但在人类视网膜发育过程中仍知之甚少。
转座酶可接近的染色质高通量测序技术(atac-seq)已成为一种灵敏且可靠的方法,可用于开放染色质检测、核小体位点定位和tf占据的分析。此外,atac-seq也适用于发育过程中转录调控网络的构建,因为将已知的tf模体(motif)与atac-seq的染色质可及性数据整合可以预测全基因组范围内的调控网络。因此,系统的atac-seq分析将是解读人类视网膜发育过程中表观遗传特征和转录调控网络的有力工具。
染色质可及性的动态在调节人类发育中起着重要的作用,包括细胞命运的决定、细胞分化和疾病的发生。最近的研究表明,在小鼠的命运决定过程中,视杆和视锥光感受器显示出明显不同的染色质可及性,这表明细胞表观基因组状态对视网膜神经发生至关重要。在本研究中,研究人员使用atac-seq和rna-seq,探索人类视网膜和ros在长期视网膜发育过程中的染色质可及性和转录变化。
主要研究结果
一、发育中的人视网膜和ros染色质可及性图谱
为了确定发育中的人视网膜和ros的染色质可及性,收集了妊娠第6周——25周9个时间点的发育中的人视网膜样本(gw6, gw10, gw11, gw12, gw14, gw15, gw20, gw24, gw25; 其中gw11, gw15, gw20, gw24, gw25各2个生物学重复; gw6, gw10, gw12, gw14各1个生物学重复,这些妊娠周期横跨了人视网膜发育的关键阶段),并收集了0周——30周hipsc诱导的ros(w0, w2, w4, w6, w10, w15, w23, w30,各2个生物学重复)用于atac-seq分析(图1a)。同时对w0, w2, w6, w10, w15和w23 ros(n = 1)进行rna-seq,而发育中的人视网膜rna-seq数据由先前的研究获得。对发育中的人视网膜和ros中rcvrn和nr2e3进行染色,作为rpcs向光感受器分化的标记(图1b、c)。数据显示,rcvrn蛋白分别在人视网膜gw14和ros w10时开始表达,一直持续到gw25和w30。与rcvrn类似,视杆光感受器标志物nr2e3分别在gw20和w15时显现。光感受器标志物的相近的表达趋势表明,ro培养表现出渐进的视网膜神经发生,就像在人类视网膜中发现的一样。
图1a-d发育中的人视网膜和ro的染色质可及性图谱
对atac-seq peak信号强度的相关性分析发现人视网膜和ros间染色质可及性的相似性(图1d)。样本的重复高度聚集在一起,证实了实验高的重复性。除了w0(未分化hipscs),整个的视网膜发育过程可以分成3个时期,即早期(gw6; w2 to w6),中期(gw10 to gw14; w10 to w15)和末期(gw15 to gw25; w23 to w30),表明人视网膜和ros的发育在染色质可及性上是相关的(图1d)。主成分分析(pca)显示,人视网膜和ros的发育轨迹在时间上呈二维相关(图1e)。
进一步研究染色质可及性是否与基因表达变化相关。作为阳性对照,发现在rcvrn基因推断的启动子和增强子位点atac-seq和dhs-seq信号富集的增加,与该阶段基因表达一致(图1f、g)。此外,对ros发育过程中rcvrn表达水平进行qrt-pcr定量,结果验证了atac-seq数据中rcvrn表达的富集与染色质动态之间的一致性(图1h)。总体而言,这些数据表明ro分化在很大程度上能反映人类视网膜的发育过程。基于发育中的人视网膜和ros的染色质可及性,本研究建立了人视网膜和ros之间的时间相关性图谱。
图1e-h 发育中的人视网膜和ro的染色质可及性图谱
二、染色质可及性反映了人视网膜和ros的发育变化
为了阐明表观基因组动态是如何控制人类视网膜发育的,对人类视网膜和ros在不同发育时间点的atac-seq信号进行了两两比较。在基因组中发现了10563个差异的dna可接近位点(来自人类视网膜的8805个和来自ros的10160个),并通过无监督的层次聚类确定了5种不同的调控元件簇(c1到c5,图2a)。为了理解这些显著差peaks的功能,应用了great v3.0.0进行go富集分析。go分析显示c4中的peaks主要富集在神经系统发育,包括神经发生(p < 1 × 10–60)和神经元分化(p < 1 × 10–42,图2b),表明其在视网膜神经发生中的关键作用。c5中的peaks在人视网膜和ros发育开始阶段并不具有可及性,而是在发育末期逐渐形成(gw15 to gw25, w10 to w30)。c5组包括2624个peaks,富集在光刺激的感觉(p < 1 × 10–8)、视觉感知(p < 1 × 10–7)和光感受器细胞分化(p < 1 × 10–6),这表示人视网膜功能的成熟,特别是光感受器(图2c)。因此,这三个功能组(另一个功能组包括c1和c2)的go条目代表了视网膜形成的顺序性,而染色质可及性的分类为定义视网膜和ro发育过程中关键发育事件的时间提供了可能性。
为了进一步比较视网膜发育过程中的人类视网膜和ro转录组,对来自人类视网膜的3235个差异表达基因(degs)进行了开放式动态时间规整(oe-dtw)分析(图2d)。结果观察到人类视网膜(gw7至gw20)和ros (w0至w23)之间存在紧密的时间相关性,这证实了人类视网膜和ros在基因表达变化上具有相当多的相似性。接下来分析不同簇(c1到c5)中的染色质特征是否与相应的基因表达相关。研究选择每个簇的前1000个峰,然后应用great依据atac-seq峰和相关的基因表达值获得一个基因列表。结合视网膜发育过程中的atac-seq与rna-seq数据,那些在临近位点获得染色质可及性的基因其表达水平也明显增加,而基因位点附近失去了染色质可及性的基因则表现出表达的降低(图2e-h),表明表观遗传和rna分析之间具有高度的相关性。
图2 发育中的人视网膜和ro的表观遗传特征及表达谱
三、发现潜在的tfs参与人视网膜发育
从c4和c5 atac-seq峰中富集的tfs分别被发现是神经元和感光细胞分化的关键调控因子(图3a、b)。例如,cluster c4中富集了vsx2、smad2和neurod1,它们对视网膜神经发生具有重要作用。c5富含otx2、crx和nr2e3,它们是光感受器分化的关键调控因子。rpc分化和细胞命运决定需要otx2。crx是光感受器生存和分化的关键调控因子。nr2e3是nrl参与啮齿动物视杆细胞和视锥细胞光感受器分化的直接靶点。因此,atac-seq数据预测的tfs与视网膜形成和分化高度相关。
由于c4和c5 peaks与视网膜发育的中期和后期有关,这对神经发生和光传导非常重要,因此重点研究了c4和c5,以寻找以前未知的神经发生调控因子。仅使用motif分析预测tf的一个注意事项是tfs或tf家族可以共享相同的motif;因此,通过整合atac-seq数据的motif富集分析和rna-seq数据的基因表达分析,以更好地预测c4和c5可接近位点上tf的占据情况。在每个时间点,在同一张图中绘制表达值和motif富集分数(图3 c),数据显示许多已知的光感受器发育tfs呈高表达,其motifs富集在中、晚期(gw10到gw20,w10到w23),包括crx、otx2、ascl1和nr2e1。
为了进一步完善对视网膜发育潜在调控因子的预测,对atac-seq数据进行了tf印记分析,该分析为基因组dna上tf候选因子直接占据提供了证据。dna序列直接被dna结合蛋白所占据,在atac-seq文库构建期间不受转座酶的影响,因此,产生的序列印记能够显示在其结合位点存在dna结合蛋白,类似于dna酶消化的印记。研究绘制了两种已知的调节因子ascl1和crx的印记,观察到他们在人类视网膜和ro发育的晚期比早期具有更深的印记,在motif侧翼具有更高的dna可及性(图3d)。值得注意的是,nfib和thra在晚期印记更深,更易接近,表明这两个tfs的motif不仅富集在阶段特异性的peaks,而且更可能物理性结合到染色质可接近的位点,说明他们是人视网膜和ro发育的可能的功能调控因子。总的来说,正交印迹结果与motif富集结果一致,这表明nfib和thra是潜在的先前未被识别的视网膜发育调节因子。
图3 发育中的人视网膜和ro的tf占据
四、nfib和thra调控视网膜发生相关基因的表达
由于ros在基因表达和染色质可及性方面与人类视网膜相似,该研究以ros为模型,探讨nfib和thra在视网膜发育中的潜在作用。首先建立了一种电穿孔的方法来有效地过表达或敲降ros中的靶基因。ros中明亮的视网膜神经上皮的外层被切成直径约500μm的小块,放入比色皿中进行电穿孔(图4a)。收集电穿孔后第10天的ro样品进行qrt-pcr或rna-seq分析(图4b)。研究crx、nfib和thra三个基因在视网膜发育中的作用。作为阳性对照,并测试该电穿孔系统,crx在约w14的ros中被敲降,在w7周被过表达。因此这些结果表明本研究建立了一个可靠的ros基因操作系统。接下来,nfib或thra敲降的特异性短发夹rna (shrna)载体在~w14经电穿孔进ros,这是nfib和thra表达的时间点。通过qrt-pcr或rna-seq分析发现了nfib和thra的表达显著降低(图4c)。为了验证这两种tfs的功能性敲低,接下来分析了nfib和arntl的已知靶点,thra潜在靶点ezh2的表达水平。结果显示,由于nfib和thra的缺失,ezh2和arntl的表达量分别显著下降(图4c)。值得注意的是,发现在nfib和thra的敲低下,一些光感受器相关的基因(crx、rho和gnat1)被下调,这表明nfib和thra可能参与了光感受器分化的调控(图4c、d)。nfib在胎儿大脑皮层神经祖细胞和胶质细胞中高度表达,是胎儿大脑皮层神经元和胶质细胞分化所必需的。考虑到中枢神经系统的神经发生调节是保守的,选择nfib进行进一步的功能研究。nfib敲低(nfib_kd) ros的rna-seq显示许多下调的视网膜发生基因,包括gnat1、nr2e3和gngt2(图4d)。go分析nfib_kd rna-seq下调和上调基因强烈表明nfib对视网膜发育是需要的,特别是对光感受器分化(图4e、f)。此外,进一步利用免疫组织化学检测nfib_kd对w14和15间高表达的光感受器相关蛋白rcvrn的影响 (图4g)。rcvrn相对强度的定量结果表明,nfib_kd降低了rcvrn的蛋白表达(图4h)。同样地,rcvrn阳性细胞在nfib_kd ros中的比例也相应降低(图4i)。总之,这些数据表明nfib和thra参与了人类视网膜和ro的发育过程。可能是nfib和thra影响了rpc到光感受器和műller细胞的自我更新和分化能力。然而,这一假设还需要进一步研究。
图4 nfib和thra对于视网膜分化是必需的
五、人视网膜发育期间tf调控网络预测
tfs通常通过相互间的交互作用来调节基因的转录。为了建立富集的tfs的潜在联系,本研究重建了人视网膜和ro发育过程中tf调节网络的全局图像。首先,使用homer v4.8来识别与c1到c5 peaks相结合的富集的tfs (p < 1 × 10–20)。将tfs之间的连接(边)定义为:如果tf-x的motif位于tf-y的启动子上,则tf-x调节tf-y,从而画箭头由tf-x指向tf-y。在这里,只考虑在这个时间点明确表达的tfs。这条规则的基础上,分别构建了早、中、晚期人类视网膜(gw6, gw10, gw20)和ros(w6, w10和w23)转录调控网络(图5a、b)。调控网络在不同的时间点呈高度动态变化。nfib和thra也富集在晚期tf网络中并与其他tfs相联系,参与到视网膜发育(图5a、b)。为了更好地呈现tfs在网络中的重要性,定义网络中每个节点的连接分数为边数乘以其表达的sd值(图5c、d)。例如,tfs具有靠前的连接分数,如vsx2、nr2e3和crx,作为众所周知的视网膜发育调控因子。从人类视网膜和ros的tf网络在早期和晚期发育的时间点上呈高度相关(图5e)。然而,tf网络在中期相关性相对较低,这可能是由于人类视网膜和ros之间存在不同的c4染色质可及性(图2a)。
图5 发育中的人视网膜和ro的动态转录调控网络
六、人和小鼠视网膜发育中不同的组蛋白修饰
对人atac-seq或小鼠dhs-seq数据联合aldiri等人研究的视网膜发育的chip-seq数据进行分析。11个染色质隐马尔可夫模型(chromhmm)状态被复制用于系统地注释从c1到c5 (c3除外)以及从mc2到mc5区域视网膜形成过程中的表观遗传状态(图6a、b)。状态1具有活跃的表观遗传标记,状态2和3主要是增强子,状态4是二价启动子。状态5被定义为polii结合,状态6和7与基因体一致(h3k36me3)。状态8是启动子或增强子外的一个多梳抑制的染色质(h3k27me3)。状态9为空染色质,状态10为h3k9me3抑制的染色质。状态11由绝缘体蛋白ccctc-结合因子(ctcf)所标记。
二价修饰(状态4)在人类视网膜神经发生中特异性地标记c4峰区,而在小鼠mc4中没有。为了清楚地展示人类和小鼠视网膜发育过程中不同组蛋白修饰的动态变化,研究计算了每个cluster组蛋白修饰的信号(图6c、d)。h3k4me3和h3k27me3的组蛋白修饰信号在c4开放区域富集。然而,在小鼠mc4中没有这种显著的双价修饰。这些数据表明,在视网膜神经发生过程中,h3k4me3和h3k27me3的二价修饰在人和小鼠之间是有区别的,这表明,由于这些组蛋白修饰在基因组上的协同作用,发育中的人类视网膜比小鼠具有更专门的表观遗传调控。
接下来,根据峰区不同组蛋白修饰的富集情况,将c4分为两亚组,即二价亚组(h3k4me3和h3k27me3)和仅有h3k4me3 (h3k4me3-only)的亚组(图6e)。go分析发现,二价亚组与器官发育、神经元生成和发育过程显著相关,提示二价性在神经发生中起重要作用。只有h3k4me3的亚组富含磷酸化和鸟苷三磷酸酶(gtpase)介导的信号转导,参与一般的生物学过程。正如预期的那样,研究观察到h3k4me3-only富集在疯狂表达的基因pdk2,其功能上作为机械传导刺激增加细胞内钙对流体流动的反应,而二价h3k4me3和h3k27me3结构域在发育基因bmp8b上被检测到。h3k4me1是神经发生的关键修饰之一。与此一致,c4二价亚群的h3k4me1信号多于c4 h3k4me3-only亚群(图6f),进一步证实了c4二价亚群在神经发生中的关键作用。利用motif分析,预测了利用双价域调控motif的tfs(图6g)。已知的发育性tfs (otx2/crx)和增殖性tfs (c-myc)在二价亚群中富集,它们对视网膜神经发生的各种调控至关重要。由于已经确定了nfib和thra在视网膜发育中的作用,进一步研究了它们的染色质区域周围的组蛋白修饰(图6h)。与预期一样,nfib和thra被h3k4me3和h3k27me3双价修饰,进一步证实这些因素与视网膜神经发生有关。总之,c4中的二价组蛋白修饰与人类视网膜神经发生高度相关,但在小鼠中相对较弱或缺失。
图6 人、鼠视网膜发育的交叉表观遗传学分析
总结
总之,本研究提供了全面的伴随人类视网膜和ro发育的染色质图谱,建立了人类视网膜和ro发育之间的时间和分子相关性的综合资源,发现了tfs对人类视网膜发育的影响,并重建了转录调控网络和信号通路,极大地拓展了我们对人类视网膜发育的认识,为下一步的研究提供了路线图。