技术支持
Support
哪些关键转录因子在调控多能干细胞到生殖细胞的分化?染色质可及性研究来揭秘
2021-08-23 下载

 

研究背景和待解决的科学问题

 

人原始生殖细胞样细胞(human primordial germ cell-like cell, hPGCLC)体外诱导分化为研究人原始生殖细胞(human primordial germ cell, hPGC)发育提供了研究模型,但是人多能干细胞(human pluripotent stem cells, hPSC)如何分化成hPGCLC的分子机制目前尚未研究透彻。因此,作者利用ATAC-seqRNA-seq共同揭示hPGCLC分化过程中染色质可及性和转录组水平的动态变化。

本文需要解决的问题是:hPGCLC诱导分化的过程中,染色质可及性和转录组水平发生了哪些变化,又存在哪些转录因子调控?

hPGC的形成是建立人类生殖细胞系和传递遗传信息的关键。近期在体外诱导hPSC分化成hPGCLC的实验方法上有重大突破,但生殖细胞和体细胞谱系分支的调控网路尚不清楚,这使得建立稳定的hPGCLC细胞系以及进一步使它们成熟仍然具有挑战性。

在哺乳动物中,原始生殖细胞(PGC)是通过WNTBMP信号通路之间复杂的相互作用从早期胚胎细胞中被分化出来的。有报道表明,BLIMP1(PRDM1)TFAP2CPRDM14这些转录因子在PGC决定过程中起着全局调控的作用。除此之外,SOX家族的转录因子在这个过程中也具有重要作用,其中SOX15hPGC中表达水平很高,暗示其可能扮演关键调控角色。近期的一项研究报道了SOX15参与维持hPGCLC细胞身份的过程,但是SOX15是如何调控hPGCLC的诱导分化还不清楚。为了研究hPGCLC诱导分化过程中的调控机制,作者开展了研究。

 

研究内容

  1. hPGCLC诱导分化过程中染色质可及性和基因调控的动态变化情况

首先,作者将人胚胎干细胞(human embryonic stem cell, hESC)诱导分化成hPGCLC,并在分化过程中设置时序性ATAC-seqRNA-seq的样本(见下图)。其中分化中间形态主要是EpCAM+/INTEGRINa6+细胞(DP)和EpCAM-/INTEGRINa6-细胞(N)。其中DP细胞上调表达PGC marker基因TFAP2CSOX17,而N细胞上调表达体细胞基因例如HOXA1等。

 

 

PCA分析可以清楚地看到hESC分化成hPGCLC的轨迹。

 

 

接着作者将分化过程中ATAC-seq鉴定到的染色质可及性动态变化进行统计和总结(见下图),将染色质可及性分为:

  1. 分化过程中一直开放的区域(PO);
  2. hESC开放但在分化过程中关闭的区域(OC);
  3. hESC关闭但在分化过程中开放的区域(CO)。

 

 

获得了染色质可及性动态变化数据后,作者将RNA-seq得到的表达模式和染色质可及性动态变化关联起来,从D1开始表达模式发生显著变化(如下图)。

 

 

作者进一步评估了N细胞的OC1-5CO1-5区域,发现N细胞未关闭OC3-5区域的染色质可及性,而且也未能维持CO2-5区域染色质的开放(如下图)。

 

 

为了揭示染色质可及性动态变化的机制,作者将目光转向这些区域的转录因子结合motifAP-2γOCT4:SOX17以及SOX15motifCO区域显著富集;相反,TEADOCT4:SOX2ZICmotifOC区域显著富集(见下图)。

 

 

另外,DP细胞的TFAP2COCT4SOX17BLIMP1基因座展现出意料之中的阶段性染色质开放区域,而且这些基因的转录水平显著上调(如下图)。

 

 

综上,第一阶段作者总结了hESC诱导分化成hPGCLC过程中染色质可及性的动态变化,而且归类出染色质可及性COOCPO的区域,以及这些区域转录因子结合motif的情况。

 

  1. 决定生殖系和非生殖系细胞分化命运分支的调控因子是?

得到了整体染色质可及性变化的数据,作者想进一步确定生殖系和非生殖系细胞分化命运分支的调控因子是哪些。作者首先将ATAC-seqhESC4iD1样本根据信号强度挑选前一万个peak做韦恩图(下图左),其中D1(生殖系)独有的2480peak中,JUN-AP1/AP1EOMESAP-2α/AP-2γGATA转录因子的motif有显著富集(下图右)。之前已经有报道,EOMESAP-2γ转录因子在hPGCLC分化过程中具有关键作用,但是AP1GATA家族转录因子是否关键尚不清楚。

 

 

随后作者将D1D2DP、和D2N样本做韦恩图(下图左),其中D2DP(生殖系)独有的peak中,AP2OCT4:SOX17SOX17以及SOX15转录因子的motif显著富集;而D2N(非生殖系)独有的peak中会显著富集GATA转录因子的motif

 

 

观察到这些区别后,作者进一步寻找这些细胞未分化成生殖系细胞的原因。通过比较分化中期和晚期阶段生殖系和非生殖系细胞中的染色质可及性的区别,作者总结了非生殖系细胞无法打开(FO)或者关闭(FC)的基因座染色质可及性区域(下图左)。FO区域中,AP2OCT4OCT4:SOX17SOX17SOX15以及EBFmotif显著富集,而FC区域中显著富集AP1TEADmotif(下图右)。

 

 

ATAC-seq结果一致,RNA-seq结果显示非生殖系细胞中的GATAAP1TEAD等基因上调表达。

 

 

组学研究告一段落后,作者接着通过免疫荧光染色发现分化第一天的拟胚体(Embryoid body, EB)表达GATA4的细胞群体比表达SOX17的细胞群体更多(下图上),而且GATA4的表达水平在SOX17+或者SOX17-细胞中没有差异,但是从分化第二天开始,SOX17+细胞中GATA4的表达量明显低于SOX17-细胞(下图下)。另外,虽然AP1-JUNmotifD1独有的开放区域中富集,但是JUN蛋白表达在第二天才被检测到(下图上)。

 

 

 

值得注意的是,作者发现JUNSOX17表达模式存在互斥现象(如下图)。这些结果共同说明JUNSOX17可能存在拮抗作用。

 

 

  1. hPGCLC诱导分化过程中有哪些转录因子的参与?

了解了决定生殖系和非生殖系细胞分化命运分支的调控因子后,作者想进一步探究是哪些转录因子在hESC分化为hPGCLC过程中调控相关基因的转录。作者首先将之前鉴定到的CO1-5PO区域的peak关联基因进行注释,其中CO1-5区域中包含3130peak关联基因,PO区域包含6355peak关联基因,去除低表达量的基因后,两区域加起来得到4202peak关联基因(下图左)。接着作者将这4202个基因通过WGCNA分析进行分类,得到16module(下图右)。

 

 

这些module展示出完全不同的表达模式和GO功能,作者根据表达模式将相似的module进行合并,D1 act(分化第一天激活转录的基因)为红色moduleD2 act为黄色和蓝色,D4 act为绿色。GO富集分析显示,hESC分化到D1时,基因在核酸代谢相关方向富集;而D1D2D4 actmodule中的基因在干细胞分裂、WNT通路相关等方向富集(下图右)。与DP细胞相反,N细胞的基因在体细胞分化方向富集。

 

 

通过分析D1D2D4 act共有的转录因子,鉴定出53个候选转录因子,包括SOX17BLIMP1SOX15等(下图左)。其中星号标出的转录因子在DP细胞中上调表达但是在N细胞中下调表达。通过ATAC-seq,作者发现SOX15基因座在第二天处于染色质开放状态,这与RNA-seq结果一致。另外,作者还发现SOX15基因座开放区域存在TFAP2Cpeak(下图右)。

 

为了确定hPGCLC诱导分化过程中SOX15是否关键,作者构建了敲除SOX15hESC细胞系,发现诱导SOX15敲除的hESC后,在第六天和第八天,hPGCLC细胞占比显著减少,说明SOX15可能是维持hPGCLC细胞全能性的关键因素。

 

 

  1. 缺失SOX15的hPGCLC细胞脱离生殖谱系的命运,并启动体细胞谱系的分化程序

为了更深入研究SOX15hPGCLC诱导分化过程中的作用,作者将SOX15 KOWT hESC细胞进行时序RNA-seq。结果显示从分化第二天开始,SOX15 KOWT的分化轨迹已经出现分叉(下图左)。在分化第六天时,对比WTSOX15 KO细胞中与细胞全能性相关的基因下调表达,而与体细胞谱系相关基因上调表达(下图右)。这些结果共同说明SOX15是维持生殖细胞身份的关键转录因子。

 

 

  1. SOX15介导的体细胞基因表达抑制与染色质可及性有关

hPGCLC诱导分化过程中,SOX15是如何抑制体细胞基因表达的呢?带着这个疑问,作者对WTSOX15- hPGCLC细胞做ATAC-seq一探究竟。结果显示,从分化第四天开始,WTSOX15-细胞开始分道扬镳(下图上左)。按之前的分类方式,作者将D4D6ATAC-seq鉴定到的peak分为三类,共同开放(shared-open, SO)、无法开放(FO)和无法关闭(FC)的区域(下图下)。其中SO区域中富集AP2SOX15motifFC区域富集FOXA1:ARTEAD2motif,而FO区域富集OCT:SOX2motif(下图上右)。

 

 

 

作者下一步将分化第六天的RNA-seq数据和ATAC-seq数据进行联合分析,其中FO区域中有53个下调基因和76个上调基因;FC区域中有15个下调基因和28个上调基因;SO区域有393个下调基因和729个上调基因。在SOX15- hPGCLC SO区域中,与心脏发育相关的基因上调表达,而与DNA双链缺口修复相关基因下调表达(如下图)。这说明虽然SO区域染色质可及性没有发生变化,但是染色质开放区域附近的基因还是受到SOX15缺失的影响,暗示可能有其他调控因素。因此,hPGCLC缺失SOX15后会干扰染色质开放区域附近的基因,或者染色质发生异常变化,这两种情况都导致hPGCLC细胞向体细胞谱系细胞转化。

 

 

  1. SOX15通过直接抑制体细胞基因表达并且维持潜在全能性来保持hPGCLC的身份

为了获得SOX15的靶标基因,作者构建了SOX15过表达的hESC细胞系,并启动hPGCLC诱导分化过程,并选择分化第四天的DP细胞进行CUT&Tag实验(下图左)。CUT&Tag结果显示SOX15peak主要分布在启动子区(下图右)。

 

 

接着作者对SOX15peak进行motif分析,发现其中富集AP2-γ(TFAP2C)KLF4OCT:SOX2motif,这说明这些转录因子也会结合SOX15结合位点附近的区域。

 

 

作者下一步将ATAC-seqCUT&Tag鉴定到peak作联合分析,并将peak分为四类(下图上)。其中C4区域展现出DP细胞独有的peak特征,而且SOX15 peak附近的染色质可及性在SOX15 KO DP细胞中显著降低(下图下)。这说明SOX15可能通过调节染色质可及性来调控靶基因的表达。

 

 

 

作者接着将分化6天的SOX15- DP细胞的RNA-seq数据和SOX15 CUT&Tag数据联合分析,GO分析结果显示SOX15结合的基因中,体细胞分化相关基因上调表达,而DNA修复和全能性相关的基因下调表达(下图上)。一些与全能性相关的基因,例如PRDM14NANOGETV4ETV5等的启动子区出现SOX15peak(下图下)。这些结果暗示SOX15参与了hPGCLC全能性的维持。

 

 

另外,作者发现分化第四或第六天的SOX15 KO DP细胞中,这些基因的SOX15结合调控元件的染色质可及性降低,这和RNA-seq结果一致。因此这些结果共同证明SOX15同时通过抑制体细胞基因表达和保留潜在的全能性的双重作用来维持hPGCLC的身份。

 

  1. hPGCLC诱导分化过程中OCT4:SOX motif的切换

为了进一步研究SOXOCT4/SOXhPGCLC诱导分化过程中的阶段性作用,作者将hESCE)、DPN细胞ATAC-seq鉴定到的peak做韦恩图(如下图)。其中DP独有的peakhPGCLChPGC中都存在,而N细胞没有。

 

 

DP细胞独有的peak中,SOX家族或者OCT:SOXmotif显著富集(下图左)。其中SOX2OCT4:SOX2motif排名靠前,但是DP细胞中SOX2没有表达(下图右),那么SOX2motif是被哪个转录因子结合了呢?作者提出假设:SOX17或者SOX15可能替代了SOX2,通过结合OCT4形成OCT4/SOX17或者OCT4/SOX15异源二聚体,占据在SOX2motif上。

 

 

为了验证这一假设,作者进行Co-IP实验,证明了OCT4SOX15或者SOX17的结合。之前有研究报道,过表达SOX15可以挽救mESC缺失SOX2所带来的后果。另外,虽然目前没有研究表明OCT4/SOX15motif存在,但是有研究表明OCT4/SOX17二聚体结合的motifOCT4/SOX2motif非常相似。考虑到OCT4/SOX15/DNA复合物的空间结构与OCT4/SOX2更为相似,因此作者推断之前鉴定到的OCT4:SOX2motif其实是OCT4/SOX15motif

 

 

最后,作者将ATAC-seq鉴定到包含OCT4:SOX15 motifpeak关联基因调出,结合RNA-seq数据,发现下调基因中有PRDM14NANOG,这两个基因是维持生殖系细胞全能性的关键。

 

 

总结

根据所有结果,作者构建了调控模型(下图)。该模型用OCT结合SOX种类的偏好性来说明问题:首先,在hESC中,OCT4/SOX2占主导地位;随后,在分化过程的早期,OCT4/SOX17逐渐成为主效调控的转录因子;最后,在分化晚期,OCT4/SOX15逐渐替代OCT4/SOX17发挥维持生殖系细胞全能性的作用。

 

 

原文链接:

https://www.cell.com/stem-cell-reports/fulltext/S2213-6711(21)00163-6?_returnURL=https%3A%2F%2Flinkinghub.elsevi