A bioinformatics approach to uncover the role of the epigenetic machinery in neurodevelopment
Skrár
Kaan Okay.PhD.thesis.final.version.pdf (8.33 MB)
Dagsetning
Höfundar
Journal Title
Journal ISSN
Volume Title
Útgefandi
University of Iceland, School of Health Sciences, Faculty of Medicine
Útdráttur
The epigenetic machinery (EM) comprises molecular components, such as enzymes and protein complexes, that place, remove, or read epigenetic marks on histone tails and DNA, or remodel the chromatin, thereby regulating gene accessibility and expression. Pathogenic variants in these EM genes cause the Mendelian Disorders of the Epigenetic Machinery (MDEMs), a group of rare disorders with unifying phenotypes, including intellectual disability (ID) and growth dysregulation. However, the underlying mechanisms behind these overlapping phenotypes have not been extensively studied. One unifying feature is that many of these disorders have distinct DNA methylation (DNAm) abnormalities in blood samples; however, the relevance of this in disease-associated cell types, such as neurons, remains unclear. Furthermore, despite clinical reports of tumor risk in certain MDEMs, the underlying molecular basis of cancer susceptibility in patients with MDEMs is poorly understood. To address these gaps, this thesis pursues three aims: First, identifying functionally important EM domains using large-scale pathogenic missense variant (PMV) enrichment analysis; second, investigating shared DNAm and transcriptional abnormalities across multiple EM gene knockouts (KOs) in hippocampal murine neuronal progenitor cells (mNPCs). Through haplotype-resolved methylation profiling, imprinting control region (ICR) analysis, and gene expression integration, this aim uncovers convergent disruptions underlying MDEM pathogenesis; third, characterizing mutational signatures in hippocampal mNPCs after EM gene disruption to evaluate potential impairments in DNA damage response (DDR). Together, these aims integrate genomic, epigenomic, transcriptomic, and mutational analyses to advance our understanding of EM gene function and its role in the pathogenesis of MDEMs. Chapter I presents a domain-centric analysis of EM genes based on PMV enrichment, identifying functionally important domains and their roles in Rubinstein-Taybi (RSTS) and Menke-Hennekam (MKHK) syndromes. Among 21 EM genes, 71.4% exhibited significant PMV enrichment in a single, most often the epigenetically canonical, domain. Notably, enrichment in non-epigenetic domains in a subset of EM genes suggests alternative functions and suggests that some of these may need to be reclassified. Syndrome-specific domain enrichment was observed from PMVs in RSTS and MKHK: RSTS variants clustered in the enzymatic HAT domain, while MKHK variants enriched non-enzymatic domains, with structural modeling implicating defects in SUMOylation and phosphorylation. These insights refine the link between protein domain disruption and disease phenotype, offering a framework for mechanistically informed diagnostics and future therapeutic targeting in MDEM. vii Chapter II investigates the effects of EM gene loss on DNAm and gene expression using an mNPC model derived from F1 off-springs of B6 and FVB mouse strains. KO of 46 EM genes, paired with long-read whole-genome sequencing (WGS), haplotype phasing, and RNA-seq, revealed multi-omic disruptions during early neuronal development. While most KOs induced subtle DNAm changes, promoter methylation analysis identified an EM gene cluster enriched for proteins interacting with DNAm writers or erasers, implicating indirect regulation of DNAm via protein-protein interactions (PPIs). Transcriptomic profiling revealed convergent expression changes in Dnmt1- and Kmt2a-KOs, both showing premature differentiation phenotypes. No DNAm abnormality was shared between these two EM-KOs detected, which suggests transcriptional dysregulation, rather than methylation dysregulation, plays a critical role in the premature differentiation observed here. However, it is not clear whether this is a primary or secondary effect. Haplotype-resolved methylomes revealed thousands of haplotype-specific differentially methylated regions (DMRs), associated with cis regulating methylation quantitative trait loci (cis-mQTLs). Abnormal methylation in imprinting control regions (ICRs) was observed in a subset of EM-KOs, suggesting EM involvement in ICR regulation. Collectively, these results demonstrate that EM gene disruption can result in epigenetic and transcriptional convergence, offering mechanistic insight into MDEM pathogenesis. Chapter III explores the relationship between EM gene loss and DDR in MDEMs, using the same mNPC dataset used in Chapter II. Although no overall significant increase in somatic variant load was observed in EM-KOs compared to controls, B6 controls showed significantly higher variant loads than FVB, likely due to differences in genetic background. A higher somatic variant load than expected by chance was observed in Asxl3, Crebbp, Kmt2d, Kmt2e, Lbr, Tdrd3, and Msl3-KOs, implicating putative roles of these genes in DDR. Among these, Kmt2e, Msl3, and Tdrd3 may represent novel candidates playing a role in the DNA damage response. Mutational signature analysis revealed shared enrichment of two trinucleotide signatures, SBS30 (base excision repair, BER) and SBS44 (mismatch repair, MMR), between multiple EM-KOs, suggesting shared DNA repair impairments. Together, these findings indicate that specific EM gene disruptions may compromise genome integrity and elevate cancer risk in a subset of MDEMs. Collectively, these chapters integrate domain-centric, multi-omic, and mutational analyses to elucidate the diverse, context-dependent functions of EM genes in neurodevelopmental and associated disorders.
Utangenaerfðakerfið inniheldur ensím og próteinflóka sem stýra genatjáningu án þess að breyta erfðaefninu. Sjúkdómsvaldandi breytileikar í genum þessa kerfis valda Mendelskum heilkennum utangenaerfðakerfisins (e. Mendelian disorders of the epigenetic machinery, MDEMs), hóp sjaldgæfra heilkenna með sameiginleg einkenni, m.a. greindarskerðingu og aðrar taugaþroskaraskanir. Hins vegar er óljóst hvaða undirliggjandi ferlar liggja að baki þessum sameiginlegu einkennum og hafa þeir lítið verið rannsakaðir. Einn sameiginlegur þáttur hjá mörgum þessara einstaklinga eru sértæk breytileikamynstur í DNA metýlun (DNAm) í blóði, en tilvist þeirra er ekki þekkt í frumugerðum tengdum sjúkdómsmyndunum, svo sem í taugafrumum. Þrátt fyrir að lýst hafi verið æxlismyndun í einhverjum MDEM heilkennum, er enn óljóst hver sameindalíffræðilegur grundvöllur krabbameinsnæmnis er hjá einstaklingum með þessi heilkenni. Til að auka þekkingu á þessum ferlum hefur þessi ritgerð þrjú meginmarkmið: fyrstur, að uppgötva mikilvægustu próteinhneppi utangenakerfisins, með kerfisbundinni auðgunargreiningu á sjúkdómsvaldandi mislestursbreytingum; sekúndu, að kanna sameiginleg frávik í DNA-metýlun og umritun eftir útslátt 46 utangenaþátta í taugafrumuforverum sem einangraðir voru úr drekasvæði músa. Við notuðum arfgerðasértæka DNAm-greiningu, skoðun á lykilsvæðum genagreyptra gena (imprinting control regions, ICRs) og samþættingu umritunargagna til þess að uppgötva sameiginlegar truflanir sem gætu útskýrt sameiginlegar sjúkdómasvipgerðir MDEM heilkenna; þriðja, að greina stökkbreytimynstur sem finnast í mNPC frumum eftir útslátt á utangenaþáttum, til að meta möguleg frávik í DNA viðgerðarferlum. Í sameiningu samþætta þessi markmið erfðamengis-, utangena-, umritunar- og stökkbreytingagreiningar til að dýpka skilning okkar á virkni utangenaþátta og hvaða hlutverki þau gegna í MDEM-heilkennum. Kafli I lýsir greiningu á próteinhneppum utangenakerfisins þar sem auðgun á sjúkdómsvaldandi mislestursbreytingum er skoðuð til þess að bera kennsl á mikilvægustu próteinhneppi viðkomandi próteina, og við skoðuðum sérstaklega hlutverk slíkrar auðgunar í tveimur MDEM-heilkennum, Rubinstein-Taybi (RSTS) og Menke-Hennekam (MKHK) heilkennum. Af 21 utangenaþætti sýndu 71.4% þeirra marktæka auðgun á mislestursbreytingum innan próteinhneppa sem tengdust grundvallarvirkni viðkomandi utangenaþáttar, líkt og histónasetýlingu. Auðgun á hneppum ótengdum utangenavirkni fannst hjá nokkrum slíkum genum, sem bendir til annars konar virkni og mögulega þörf á endurskilgreiningu á hlutverkum þeirra gena. Heilkenna-sértæk auðgun á mislestursbreytingum fannst í próteinhneppum RSTS og MKHK, þar sem RSTS sýndi auðgun í ensímatíska HAT hneppinu, en MKHK sýndi auðgun í öðrum hneppum. Greining á strúktúrum í þessum hneppum tengir þessar iv breytingar við galla í SUMOleringu og fosfórun þessara próteina í MKHK. Þessi greining gefur betri innsýn í tengslin milli truflunar á virkni sértækra próteinhneppa og svipgerða mismunandi heilkenna, auk þess sem hún býður upp á ramma fyrir greiningu og meðferð MDEM á grundvelli verkunarferla. Kafli II fjallar um áhrif taps á utangenaþáttum á DNA metýlun (DNAm) og genatjáningu í taugaforverafrumum músa sem einangraðar voru úr músum sem eiga foreldra úr tveimur mismunandi raðgreindum músastofnum (B6 og FVB). Með útslætti á 46 utangenaþáttum ásamt heilraðgreiningu erfðamengisins með aðferð sem leyfir raðgreiningu á löngum röðum, aðgreiningu arfgerða (e. haplotype phasing) og RNA raðgreiningu, fundust fjöl-mengja áhrif (e. multi-omic effects) snemma í taugaþroskaferlinu. Þótt útsláttur flestra utangenaþátta leiddi til smávæglegra breytinga á DNAm, sýndi greining á DNAm í stýrilsvæðum hóp utangenaþátta sem hafði meiri bindingu við prótein sem skrifa eða fjarlægja DNAm en búist er við fyrir tilviljun, sem bendir til óbeinnar stjórnunar á DNAm í gegnum prótein víxlverkanir. Greining á genatjáningu eftir Dnmt1- og Kmt2a- útslátt sýndi afar sambærilegar truflanir í genatjáningu og snemmabæra taugasérhæfingu. Engar sambærilegar breytingar á DNAm fundust milli þessara tveggja utangenaþátta, sem gefur til kynna að truflun á genatjáningu gegni meginhlutverki í snemmbærri sérhæfingu, frekar en breyting á metýlun, þó ekki sé ljóst hvort það sé orsök eða afleiðing. DNAm-greining, með aðgreiningu samsæta, leiddi í ljós þúsundir arfgerðasértækra DNAm-breytinga, sem tengjast cis-stýrandi áhrifamörkum á metýlun (e. methylation quantitative trait loci). Auk þess fannst óeðlileg metýlun á stýrisvæðum erfðagreypingar (e. imprinting control regions) eftir útslátt hluta utangenaþáttanna, sem styður við mikilvægi stjórnunar utangenakerfisins á genagreypingu. Samanlagt sýna þessar niðurstöður að útsláttur utangenakerfisins getur leitt til samlegðaráhrifa á umritun og utangenaerfðir, sem veitir innsýn í undirliggjandi ferla sjúkdómamyndunar MDEM. Kafli III kannar tengslin milli taps á utangenaþáttum og áhrif á stökkbreytingar sem tengjast truflun í DNA viðgerðarferlum. Hér gerðum við greiningu á sama gagnasafni og í kafla II. Þrátt fyrir að ekki hafi greinst almenn aukning í stökkbreytnitíðni eftir útslátt utangenaþátta, miðað við viðmiðunarhóp, sýndi B6-arfgerðin marktækt aukinn fjölda stökkbreytinga miðað við FVB-arfgerð, líklega vegna erfðafræðilegs mismunar á bakgrunni stofnanna. Hærri stökkbreytnitíðni fannst eftir útslátt Asxl3, Crebbp, Kmt2d, Kmt2e, Lbr, Tdrd3, og Msl3, sem bendir til hlutverks þessara þátta í DNA viðgerðarferlum. Meðal þeirra gætu Kmt2e, Msl3, og Tdrd3 verið áður óþekktir þátttakendur í DNA viðgerðarferlum. Greining á stökkbreytinga-mynstri sýndi auknar breytingar á tveimur tegundum af þríbasa-mynstrum; SBS30 (basaskerðiviðgerð, base excision repair, BER) og SBS44 (mispörunarviðgerð, mismatch repair, MMR) eftir útslátt nokkurra utangenaþátta, sem bendir til sameiginlegra áhrifa á DNA viðgerðarferla. Samanlagt benda þessar niðurstöður til þess að röskun tiltekinna utangenaþátta geti raskað stöðugleika erfðamengisins og aukið krabbameinshættu í tilteknum undirflokkum MDEM-sjúkdóma. v Saman samþætta þessir kaflar greiningar á mikilvægum virknihneppum, fjöl mengjagreiningu og stökkbreytingamynstur til að varpa ljósi á fjölbreytt og sértæk hlutverk utangenaþátta í taugaþroskaferlinu og tengdum sjúkdómum
Utangenaerfðakerfið inniheldur ensím og próteinflóka sem stýra genatjáningu án þess að breyta erfðaefninu. Sjúkdómsvaldandi breytileikar í genum þessa kerfis valda Mendelskum heilkennum utangenaerfðakerfisins (e. Mendelian disorders of the epigenetic machinery, MDEMs), hóp sjaldgæfra heilkenna með sameiginleg einkenni, m.a. greindarskerðingu og aðrar taugaþroskaraskanir. Hins vegar er óljóst hvaða undirliggjandi ferlar liggja að baki þessum sameiginlegu einkennum og hafa þeir lítið verið rannsakaðir. Einn sameiginlegur þáttur hjá mörgum þessara einstaklinga eru sértæk breytileikamynstur í DNA metýlun (DNAm) í blóði, en tilvist þeirra er ekki þekkt í frumugerðum tengdum sjúkdómsmyndunum, svo sem í taugafrumum. Þrátt fyrir að lýst hafi verið æxlismyndun í einhverjum MDEM heilkennum, er enn óljóst hver sameindalíffræðilegur grundvöllur krabbameinsnæmnis er hjá einstaklingum með þessi heilkenni. Til að auka þekkingu á þessum ferlum hefur þessi ritgerð þrjú meginmarkmið: fyrstur, að uppgötva mikilvægustu próteinhneppi utangenakerfisins, með kerfisbundinni auðgunargreiningu á sjúkdómsvaldandi mislestursbreytingum; sekúndu, að kanna sameiginleg frávik í DNA-metýlun og umritun eftir útslátt 46 utangenaþátta í taugafrumuforverum sem einangraðir voru úr drekasvæði músa. Við notuðum arfgerðasértæka DNAm-greiningu, skoðun á lykilsvæðum genagreyptra gena (imprinting control regions, ICRs) og samþættingu umritunargagna til þess að uppgötva sameiginlegar truflanir sem gætu útskýrt sameiginlegar sjúkdómasvipgerðir MDEM heilkenna; þriðja, að greina stökkbreytimynstur sem finnast í mNPC frumum eftir útslátt á utangenaþáttum, til að meta möguleg frávik í DNA viðgerðarferlum. Í sameiningu samþætta þessi markmið erfðamengis-, utangena-, umritunar- og stökkbreytingagreiningar til að dýpka skilning okkar á virkni utangenaþátta og hvaða hlutverki þau gegna í MDEM-heilkennum. Kafli I lýsir greiningu á próteinhneppum utangenakerfisins þar sem auðgun á sjúkdómsvaldandi mislestursbreytingum er skoðuð til þess að bera kennsl á mikilvægustu próteinhneppi viðkomandi próteina, og við skoðuðum sérstaklega hlutverk slíkrar auðgunar í tveimur MDEM-heilkennum, Rubinstein-Taybi (RSTS) og Menke-Hennekam (MKHK) heilkennum. Af 21 utangenaþætti sýndu 71.4% þeirra marktæka auðgun á mislestursbreytingum innan próteinhneppa sem tengdust grundvallarvirkni viðkomandi utangenaþáttar, líkt og histónasetýlingu. Auðgun á hneppum ótengdum utangenavirkni fannst hjá nokkrum slíkum genum, sem bendir til annars konar virkni og mögulega þörf á endurskilgreiningu á hlutverkum þeirra gena. Heilkenna-sértæk auðgun á mislestursbreytingum fannst í próteinhneppum RSTS og MKHK, þar sem RSTS sýndi auðgun í ensímatíska HAT hneppinu, en MKHK sýndi auðgun í öðrum hneppum. Greining á strúktúrum í þessum hneppum tengir þessar iv breytingar við galla í SUMOleringu og fosfórun þessara próteina í MKHK. Þessi greining gefur betri innsýn í tengslin milli truflunar á virkni sértækra próteinhneppa og svipgerða mismunandi heilkenna, auk þess sem hún býður upp á ramma fyrir greiningu og meðferð MDEM á grundvelli verkunarferla. Kafli II fjallar um áhrif taps á utangenaþáttum á DNA metýlun (DNAm) og genatjáningu í taugaforverafrumum músa sem einangraðar voru úr músum sem eiga foreldra úr tveimur mismunandi raðgreindum músastofnum (B6 og FVB). Með útslætti á 46 utangenaþáttum ásamt heilraðgreiningu erfðamengisins með aðferð sem leyfir raðgreiningu á löngum röðum, aðgreiningu arfgerða (e. haplotype phasing) og RNA raðgreiningu, fundust fjöl-mengja áhrif (e. multi-omic effects) snemma í taugaþroskaferlinu. Þótt útsláttur flestra utangenaþátta leiddi til smávæglegra breytinga á DNAm, sýndi greining á DNAm í stýrilsvæðum hóp utangenaþátta sem hafði meiri bindingu við prótein sem skrifa eða fjarlægja DNAm en búist er við fyrir tilviljun, sem bendir til óbeinnar stjórnunar á DNAm í gegnum prótein víxlverkanir. Greining á genatjáningu eftir Dnmt1- og Kmt2a- útslátt sýndi afar sambærilegar truflanir í genatjáningu og snemmabæra taugasérhæfingu. Engar sambærilegar breytingar á DNAm fundust milli þessara tveggja utangenaþátta, sem gefur til kynna að truflun á genatjáningu gegni meginhlutverki í snemmbærri sérhæfingu, frekar en breyting á metýlun, þó ekki sé ljóst hvort það sé orsök eða afleiðing. DNAm-greining, með aðgreiningu samsæta, leiddi í ljós þúsundir arfgerðasértækra DNAm-breytinga, sem tengjast cis-stýrandi áhrifamörkum á metýlun (e. methylation quantitative trait loci). Auk þess fannst óeðlileg metýlun á stýrisvæðum erfðagreypingar (e. imprinting control regions) eftir útslátt hluta utangenaþáttanna, sem styður við mikilvægi stjórnunar utangenakerfisins á genagreypingu. Samanlagt sýna þessar niðurstöður að útsláttur utangenakerfisins getur leitt til samlegðaráhrifa á umritun og utangenaerfðir, sem veitir innsýn í undirliggjandi ferla sjúkdómamyndunar MDEM. Kafli III kannar tengslin milli taps á utangenaþáttum og áhrif á stökkbreytingar sem tengjast truflun í DNA viðgerðarferlum. Hér gerðum við greiningu á sama gagnasafni og í kafla II. Þrátt fyrir að ekki hafi greinst almenn aukning í stökkbreytnitíðni eftir útslátt utangenaþátta, miðað við viðmiðunarhóp, sýndi B6-arfgerðin marktækt aukinn fjölda stökkbreytinga miðað við FVB-arfgerð, líklega vegna erfðafræðilegs mismunar á bakgrunni stofnanna. Hærri stökkbreytnitíðni fannst eftir útslátt Asxl3, Crebbp, Kmt2d, Kmt2e, Lbr, Tdrd3, og Msl3, sem bendir til hlutverks þessara þátta í DNA viðgerðarferlum. Meðal þeirra gætu Kmt2e, Msl3, og Tdrd3 verið áður óþekktir þátttakendur í DNA viðgerðarferlum. Greining á stökkbreytinga-mynstri sýndi auknar breytingar á tveimur tegundum af þríbasa-mynstrum; SBS30 (basaskerðiviðgerð, base excision repair, BER) og SBS44 (mispörunarviðgerð, mismatch repair, MMR) eftir útslátt nokkurra utangenaþátta, sem bendir til sameiginlegra áhrifa á DNA viðgerðarferla. Samanlagt benda þessar niðurstöður til þess að röskun tiltekinna utangenaþátta geti raskað stöðugleika erfðamengisins og aukið krabbameinshættu í tilteknum undirflokkum MDEM-sjúkdóma. v Saman samþætta þessir kaflar greiningar á mikilvægum virknihneppum, fjöl mengjagreiningu og stökkbreytingamynstur til að varpa ljósi á fjölbreytt og sértæk hlutverk utangenaþátta í taugaþroskaferlinu og tengdum sjúkdómum
Lýsing
Efnisorð
Doktorsritgerðir, Erfðafræði, DNA-rannsóknir, DNA methylation, Missense variants, Epigenetic machinery, Epigenetic machinery