Opin vísindi

Using whole-genome sequence data to discover causes of unexplained rare diseases and miscarriage

Using whole-genome sequence data to discover causes of unexplained rare diseases and miscarriage


Titill: Using whole-genome sequence data to discover causes of unexplained rare diseases and miscarriage
Aðrir titlar: Notkun raðgreiningargagna til að finna erfðafræðilegar orsakir óútskýrðra sjaldgæfra sjúkdóma og fósturláta
Höfundur: Árnadóttir, Guðný Anna
Leiðbeinandi: Unnur Þorsteinsdóttir, Hans Tómas Björnsson
Útgáfa: 2024-04-14
Tungumál: Enska
Háskóli/Stofnun: Háskóli Íslands
University of Iceland
Svið: Heilbrigðisvísindasvið (HÍ)
School of Health Sciences (UI)
Deild: Læknadeild (HÍ)
Faculty of Medicine (UI)
ISBN: 978-9935-9781-1-0
Efnisorð: Raðgreining; Erfðabreytileiki; Fósturlát; Doktorsritgerðir; Mendelskir sjúkdómar; Arfgerðir
URI: https://hdl.handle.net/20.500.11815/4818

Skoða fulla færslu

Útdráttur:

 
Introduction and aims: Although individually, Mendelian disorders are considered rare, collectively they make up a large group of individuals requiring diagnosis and treatment. Because of their individual rarity, many of these disorders are understudied and there is a paucity of diagnosis, resulting in added burden on the health care system. Mendelian disorders can range in severity from adult-onset diseases with phenotypic variability, to onset in the womb leading to congenital diseases, early death, or pregnancy loss. Recent advances in next-generation sequencing technologies have contributed heavily to resolution of the overall diagnostic odyssey, but many rare diseases remain unexplained. Three studies form the basis of this thesis, where the overall aim was to elucidate causes of previously unexplained rare diseases and pregnancy loss. Methods: The studies use whole-genome sequence (WGS) data from more than 50,000 Icelanders (papers I and II), 764 patients who have undergone clinical WGS analysis (papers I and II) and 1,041 fetal samples from 481 Danish pregnancy loss trios (mother, father, and fetus) (paper III). WGS data from the set of Icelanders (papers I and II) was used as a reference set for subsequent imputation into more than 150,000 SNP chip-genotyped Icelanders to identify additional carriers of rare genotypes. Variants detected from WGS were categorized and analyzed based on their frequency (using the Icelandic chip-genotype database and gnomAD as references), predicted effect on protein, relevance of the associated gene with disease, and other aspects relevant to pathogenicity classification as suggested by the American college of medical genetics (papers I-III). In paper I, genotype-based recall for in-depth phenotyping was performed for carriers of interest. In paper II we used deficit of homozygosity, calculated from the minor allele frequency of the variants in the imputed Icelandic chip-genotype database, to outline missense variants of interest. In paper III we used phase-informative sequence variants to assign parental origin to genetic variants detected in the fetal samples. Phenotype data on inflammatory bowel disease (paper I), height (paper I), and miscarriage (papers II and III) was used to further our understanding of the sequence variants highlighted in the studies. Results: Paper I. Chronic granulomatous disease (CGD) is a primary immunodeficiency that results from defects in the phagocyte NADPH oxidase complex, leading to severe and recurrent bacterial and fungal infections. Previously, sequence variants in five genes encoding subunits of NADPH oxidase had been recognized to cause CGD; CYBB, CYBA, NCF1, NCF2 and NCF4. In the study we found that deficiency of CYBC1, a previously uncharacterized protein in humans (previously C17orf62), leads to reduced expression of the main subunit of NADPH oxidase and results in CGD. Through whole-genome sequencing of two young brothers with CGD we identified a homozygous predicted loss-of-function variant in CYBC1; NM_001033046.3:c.6C>G / p.Tyr2Ter. Through imputation of the variant into a population set of 155,250 chip-genotyped Icelanders we found six additional homozygous carriers. We performed genotype-based recall of these individuals for in-depth phenotyping, and discovered that all eight homozygous carriers had symptoms consistent with CGD, either colitis, severe infections, or an impaired neutrophil oxidative burst. We showed that homozygosity for p.Tyr2Ter results in complete loss of CYBC1 function, and a substantial reduction in gp91phox, a key component of the NADPH oxidase complex encoded by CYBB. Our results indicate that CYBC1 likely acts as a chaperone for successful formation of the NADPH oxidase complex. Paper II. The pathogenic effect of missense variants can be difficult to predict as their impact on protein structure and function is not always clear. We used a deficit of observed versus expected homozygous carriers in a population set of 153,054 chip-genotyped Icelanders to identify potentially pathogenic missense variants. We overlayed the identified variants to a set of 764 clinically whole-genome sequenced Icelanders, and found homozygous carriers of five of these variants in that set, including two patients homozygous for a variant in a gene not previously linked to disease; NM_016207.3:c.1403G>A / p.(Gly468Glu) in CPSF3. Through the Icelandic genealogy database, we identified couples that were both heterozygous carriers of the CPSF3 p.(Gly468Glu) variant and whose offspring each had a 25% probability of being homozygous. Among these offspring, four had died before ten years of age. Archival sampling and sequencing of two of these offspring confirmed a homozygous status in them. Additionally, through GeneMatcher, we found two homozygous carriers of another missense variant in CPSF3; NM_016207.3:c.1061T>C / p.(Ile354Thr). All six homozygous carriers had severe intellectual disability, seizures, microcephaly, and abnormal muscle tone. In addition to this novel neurodevelopmental disorder, we also discovered a novel pathogenic effect for two other missense variants that displayed a deficit of homozygous carriers. We found that one of these variants, NM_005476.5:c.1132G>T / p.(Asp378Tyr) in GNE, causes a drastic early-onset myopathic disease in homozygous state, resulting in neonatal death. We also noted an elevated rate of miscarriage among GNE p.(Asp378Tyr) heterozygous carrier couples. We found that the second variant, NM_001003722.2:c.1706G>A / p.(Arg569His) in GLE1, causes embryonic lethality in homozygous carriers, presenting as early miscarriage (week 5-8). Both GNE and GLE are known autosomal recessive disease genes, but a phenotypic effect to this degree has not been reported before. Paper III (manuscript). To gain a better understanding of the genetic landscape underlying early pregnancy loss we sequenced 1,041 samples from 481 pregnancy loss trios from Denmark. Based on the WGS data, we characterized the contribution of different fetal genetic abnormalities to early pregnancy loss (mean gestational age of 10.3 weeks), finding a likely genetic cause in 250 of the losses. The majority of identified causes were aneuploidies (N=200) followed by triploidies (N=30). The genetic causes identified in the remaining euploid pregnancy losses were de novo copy number variants (CNVs) (N=6) and pathogenic genotypes (N=14). We thus found that 9.8% of the euploid pregnancy losses could be explained by pathogenic genotypes affecting single genes. We also detected a variant in homozygous state in one of the pregnancy losses, DHCR7 NM_001360.2:c.964-1G>C, that exhibits an extreme deficit of homozygous carriers in large reference sets. Using phase informative variants, we were able to determine the parent of origin for the majority of these identified genetic causes. We demonstrate an enrichment of pathogenic genotypes in the pregnancy loss trios when comparing to unaffected trios, supporting the overall role of pathogenic genotypes in early pregnancy losses. Conclusions: Taken together, we have identified a novel cause of the rare autosomal recessive disease CGD, by demonstrating that lack of the CYBC1 protein results in a CGD-like phenotype in homozygous loss-of-function carriers. With that conclusion in mind, we investigated the deficit of homozygous missense variants from a large population set and found that it could be used to elucidate causes of a previously undiagnosed autosomal recessive neurodevelopmental disease and unexplained pregnancy losses. Finally, we expanded our study to investigate the role of pathogenic genotypes in early pregnancy losses. We confirmed the role of a homozygous deficit genotype in early pregnancy loss, and found an overall enrichment of pathogenic genotypes in early pregnancy losses compared to healthy trios, confirming the contribution of pathogenic genotypes to early pregnancy loss.
 
Inngangur og markmið: Þó svo að Mendelskir sjúkdómar séu álitnir sjaldgæfir á einstaklingsgrunni, eru samlegðaráhrif þeirra töluverð. Fjöldinn allur af sjúklingum þarfnast greiningar og meðferðar, en vegna þess hve sjaldgæfir þeir eru getur greiningarferlið verið erfitt, sem skilar sér í óþarfa álagi á heilbrigðiskerfið. Alvarleiki Mendelskra sjúkdóma er á breiðu rófi, þeir geta komið fram á fullorðinsaldri með breytilegri sýnd, en geta einnig átt upptök sín í móðurkviði og birst sem meðfæddir sjúkdómar, ungbarnadauði, andvana fæðingar eða sem fósturlát. Nýleg framþróun í raðgreiningartækni hefur lagt mikið af mörkum í þeirri vegferð að draga úr greiningarerfiðleikum, en þó eru margir sjaldgæfir sjúkdómar enn óútskýrðir. Þrjár rannsóknir liggja til grundvallar þessari ritgerð, þar sem heildarmarkmiðið var að finna orsakir áður óútskýrðra sjaldgæfra sjúkdóma og fósturláta. Aðferðir: Í rannsóknunum er notast við heilraðgreiningargögn frá meira en 50,000 Íslendingum (greinar I og II), 764 sjúklingum sem hafa gengist undir klíníska heilraðgreiningu (greinar I og II) og 1,041 fóstursýnum úr 481 dönskum fjölskyldum sem hafa upplifað fósturmissi (móðir, faðir, og fóstur) (grein III). Íslensk heilraðgreiningargögn (greinar I og II) voru notuð til að bera kennsl á sjaldgæfa erfðabreytileika, og með tilreiknun arfgerða fyrir stærra sett 150,000 örflögugreindra Íslendinga var hægt að finna fleiri bera þessara ákveðnu erfðabreytileika. Erfðabreytileikar sem fundust í heilraðgreiningargögnum voru flokkaðir og greindir miðað við tíðni þeirra (íslenski arfgerðargrunnurinn og gnomAD gagnagrunnurinn voru notaðir til viðmiðunar), áætluð áhrif þeirra á prótein, tengsl gensins við sjúkdóma, og aðra þætti sem skipta máli við flokkun sjúkdómsvaldandi breytileika samkvæmt Amerísku erfðafræðistofnuninni (e. the American college of medical genetics) (greinar I-III). Í grein I var arfgerðarbundin innköllun einstaklinga með ákveðna sjúkdómsvaldandi breytileika framkvæmd, til ítarlegrar svipgerðargreiningar. Í grein II nýttum við skort á arfhreinum arfgerðum, reiknaðan út frá tíðni erfðabreytileika í íslenska arfgerðargrunninum, sem tól til að finna áhugaverðar mislestursbreytingar (e. missense variants). Í grein III notuðum við fasaupplýsandi breytileika til að áætla foreldrauppruna erfðaafbrigða sem greindust í fóstursýnunum. Svipgerðargögn um langvinna bólgusjúkdóma í þörmum og ristli (grein I), hæð (grein I), og fósturlát (greinar II og III) voru notuð til að auka skilning okkar á þeim breytileikum sem voru rannsakaðir. Niðurstöður: Grein I. Ættgengt hnúðager (e. chronic granulomatous disease, CGD) er meðfæddur ónæmisbrestur sem kemur til vegna galla í próteinflóka sem kallast NADPH oxidasi, og veldur alvarlegum og síendurteknum bakteríu- og sveppasýkingum. Áður hefur verið staðfest að stökkbreytingar í einhverjum þeirra fimm gena sem kóða undireiningar NADPH oxidasa valda CGD, þ.e. genunum CYBB, CYBA, NCF1, NCF2, eða NCF4. Í rannsókninni komumst við að því að skortur á CYBC1, próteini með áður óskilgreinda virkni í mönnum (áður C17orf62), leiðir til minni tjáningar á aðalundireiningu NADPH oxidasa og veldur CGD. Í raðgreiningargögnum tveggja ungra bræðra með CGD fundum við arfhreina stökkbreytingu sem er talin valda tapi á virkni CYBC1 próteinsins: NM_001033046.3:c.6C>G / p.Tyr2Ter. Með tilreiknun breytingarinnar í arfgerðargrunni sem samanstóð af 155,250 Íslendingum, fundum við sex arfhreina einstaklinga til viðbótar. Við framkvæmdum arfgerðarbundna innköllun á þeim og komumst að því að allir átta arfhreinu einstaklingarnir voru með einkenni í samræmi við CGD, annaðhvort ristilbólgur, alvarlegar sýkingar, eða skert drápspróf (e. neutrophil oxidative burst test). Við sýndum fram á að arfhrein arfgerð p.Tyr2Ter veldur algjöru tapi á CYBC1 próteininu, sem og verulegri lækkun í tjáningu á gp91phox, einni aðalundireiningu NADPH oxidasa, sem genið CYBB kóðar fyrir. Niðurstöður okkar benda til þess að CYBC1 virki sem hjálparprótein, og sé nauðsynlegt til þess að NADPH próteinflókinn myndist á réttan hátt. Grein II. Erfitt getur reynst að spá fyrir um sjúkdómsvaldandi áhrif mislestursbreytinga, þar sem áhrif þeirra á uppbyggingu og virkni próteina eru ekki alltaf ljós. Við nýttum okkur skort á arfhreinum arfgerðum í gagnasetti 153,054 arfgerðargreindra Íslendinga, miðað við áætlaðan fjölda arfhreinna arfgerða, til að bera kennsl á hugsanlega sjúkdómsvaldandi mislestursbreytingar. Við flettum þessum arfgerðum upp í gagnasetti sem innihélt heilraðgreiningargögn 764 einstaklinga sem höfðu verið raðgreindir í klínískum tilgangi, og fundum þar fimm arfhreina einstaklinga, þar á meðal tvo einstaklinga sem voru arfhreinir berar stökkbreytingar í geni sem hafði ekki verið tengt við sjúkdóm: NM_016207.3:c.1403G>A / p.(Gly468Glu) í geninu CPSF3. Í gegnum Íslendingabók fundum við pör sem bæði voru arfblendin fyrir CPSF3 p.(Gly468Glu) breytingunni, og afkvæmi þeirra því með 25% líkur á að vera arfhrein. Meðal þessara afkvæma höfðu fjögur látist fyrir tíu ára aldur. Heilraðgreining á paraffin sýnum, úr meinafræðisafni, frá þessum afkvæmum staðfesti arfhreina stöðu stökkbreytingarinnar í tveimur þeirra. Við fundum tvo arfhreina einstaklinga til viðbótar í gegnum GeneMatcher forritið, en þeir voru með aðra mislestursbreytingu í CPSF3: NM_016207.3:c.1061T>C / p.(Ile354Thr). Allir þessir sex arfhreinu einstaklingar voru með alvarlega greindarskerðingu, flogaveiki, höfuðsmæð, og óeðlilega vöðvaspennu. Til viðbótar þessari nýskilgreindu taugaþroskaröskun, sýndum við einnig fram á ný sjúkdómsvaldandi áhrif tveggja annarra mislestursbreytinga sem sýndu líka skort á arfhreinum arfgerðum. Við komumst að því að ein þessara breytinga, NM_005476.5:c.1132G>T / p.(Asp378Tyr) í GNE geninu, veldur alvarlegum vöðvakvilla á arfhreinu formi, sem leiðir til ungbarnadauða. Við tókum líka eftir aukinni tíðni fósturláta meðal para þar sem bæði voru arfblendnir berar GNE p.(Asp378Tyr) breytingarinnar. Við komumst að því að hinn breytileikinn, NM_001003722.2:c.1706G>A / p.(Arg569His) í GLE1 geninu, veldur snemmbúnu fósturláti á arfhreinu formi (á viku 5-8 á meðgöngu). Bæði GNE og GLE eru þekkt víkjandi sjúkdómsgen, en svipgerðaráhrifum á þessu alvarleikastigi hefur ekki verið lýst fyrr en nú. Grein III (handrit). Til þess að öðlast betri yfirsýn yfir erfðafræðilegar orsakir snemmbúinna fósturláta heilraðgreindum við 1,041 sýni úr 481 dönskum fósturlátsfjölskyldum (sem samanstóðu af móður, föður og fósturvef). Byggt á heilraðgreiningargögnunum, greindum við framlag mismunandi erfðafræðilegra orsaka snemmbúinna fósturláta (meðalmeðgöngulengd 10.3 vikur), og fundum líklega erfðafræðilega skýringu á 250 þessara fósturláta. Meirihluti greindra orsaka voru ójafnlitnun (e. aneuploidies) (N=200) og þar á eftir þrílitnun (e. triploidies) (N=30). Þær erfðafræðilegu orsakir sem greindust í jafnlitna (e. euploid) fóstursýnum voru annarsvegar nýir (e. de novo) eintakabreytileikar (e. copy number variants) (N=6) og hins vegar sjúkdómsvaldandi eingena arfgerðir (N=14). Sjúkdómsvaldandi breytileikar bundnir við einstaka gen voru þar af leiðandi líkleg útskýring á alls 9.8% fósturláta jafnlitna fóstra. Einn þessara breytileika var arfhrein arfgerð í geninu DHCR7, en þessi breytileiki sýnir umtalsverðan skort arfhreinna arfgerða í stóru viðmiðunargagnasetti, og endurspeglar þannig niðurstöður okkar úr grein II. Með því að nota fasaupplýsandi breytileika frá foreldrum gátum við í framhaldinu áætlað foreldrauppruna meirihluta þessara erfðafræðilegu orsaka. Við sýndum fram á aukna tíðni sjúkdómsvaldandi eingena arfgerða í fósturlátunum, borið saman við heilbrigða einstaklinga, sem rennir stoðum undir það að sjúkdómsvaldandi eingena arfgerðir gegni veigamiklu hlutverki í snemmbúnum fósturlátum. Ályktanir: Í þessari rannsókn höfum við borið kennsl á nýja orsök sjaldgæfa víkjandi sjúkdómsins CGD, með því að sýna fram á að skortur á CYBC1 próteini leiðir til CGD-líkrar svipgerðar hjá arfhreinum einstaklingum. Með þessa niðurstöðu að leiðarljósi, könnuðum við skort á arfhreinum mislestursbreytingum í stórum íslenskum arfgerðargrunni og sýndum fram á að hægt er að nota skort slíkra arfgerða til að bera kennsl á áður óútskýrða víkjandi sjúkdóma og fósturlát. Að lokum útvíkkuðum við rannsóknina til að kanna hlutverk sjúkdómsvaldandi eingena arfgerða í snemmbúnum fósturlátum. Við fundum arfhreina arfgerð í einu fósturlátanna sem sýnir skort á arfhreinum arfgerðum í stórum viðmiðunargagnasettum. Við fundum einnig aukna tíðni á sjúkdómsvaldandi arfgerðum í snemmbúnum fósturlátum, og staðfestum þannig hlutverk þeirra í snemmbúnum fósturlátum.
 

Skrár

Þetta verk birtist í eftirfarandi safni/söfnum: