GraphTyper: A pangenome method for identifyingsequence variants at a population scale

dc.contributorHáskóli Íslandsen_US
dc.contributorUniversity of Icelanden_US
dc.contributor.advisorPáll Melsteden_US
dc.contributor.authorEggertsson, Hannes
dc.contributor.departmentIðnaðarverkfræði-, vélaverkfræði- og tölvunarfræðideild (HÍ)en_US
dc.contributor.departmentFaculty of Industrial Eng., Mechanical Eng. and Computer Science (UI)en_US
dc.contributor.schoolVerkfræði- og náttúruvísindasvið (HÍ)en_US
dc.contributor.schoolSchool of Engineering and Natural Sciences (UI)en_US
dc.date.accessioned2019-06-26T10:14:20Z
dc.date.available2019-06-26T10:14:20Z
dc.date.issued2019-06
dc.description.abstractA fundamental requisite for genetic studies is an accurate determination of sequence variation. While human genome sequence diversity is increasingly well characterized, there is a need for efficient ways to utilize this knowledge in sequence analysis. Here we present GraphTyper, a publicly available novel algorithm and software for genotyping sequence variants. GraphTyper can discover small variants directly from sequence data and is able to encode and accurately genotype all sizes of variants. GraphTyper realigns short-read sequence data to a pangenome, a variation-aware graph structure that encodes sequence variation within a population by representing possible haplotypes as graph paths. Our results show that GraphTyper is fast, highly scalable, and provides sensitive and accurate genotype calls. GraphTyper genotyped 60 million sequence variants in whole-genomes of 49,962 Icelanders, including half a million structural variants, which is to our knowledge the largest such sequence analysis to date. We compare GraphTyper to previous methods and show that it is a valuable tool in characterizing sequence variation in both small and population-scale sequencing studies.en_US
dc.description.abstractNauðsynleg krafa fyrir erfðafræðirannsóknir eru áreiðanlegar aðferðir til að finna arfgerðir einstaklinga með raðgreiningargögnum. Miklum upplýsingum um erfðabreytileika hefur nú þegar verið safnað, sem kallar á nýjar aðferðir til að nýta þessar upplýsingar. Hér kynnum við GraphTyper, frjáls og frír hugbúnaður sem finnur erfðabreytileika í raðgreiningargögnum. GraphTyper býr til stærðfræðilegt net sem inniheldur þekkta erfðabreytileika, þar sem að hver leið í netinu skilgreinir mögulegar erfðaraðir. GraphTyper ber saman raðgreiningargögn við netið til að bera kennsl á arfgerð einstaklings. Niðurstöður okkar sýna að GraphTyper skalast vel með fjölda einstaklinga og veitir bæði næm og nákvæm köll á arfgerðum í samanburði við aðra samskonar hugbúnaða. GraphTyper kallaði 60 milljón breytileika í 49,962 Íslendingum, þar á meðal hálfa milljón breytileika sem eru stærri en 50 basapör, og er það stærsta slík köllun sinnar tegundar. Við trúum að GraphTyper sé framför fyrir svið erfðafræðirannsókna og muni nýtast í að tengja erfðafræðiupplýsingar við sjúkdóma og aðrar svipgerðiren_US
dc.identifier.citationHannes Pétur Eggertsson, 2019, GraphTyper: A pangenome method for identifying sequence variants at a population scale, PhD dissertation, Faculty of Industrial Engineering, Mechanical Engineering and Computer Science, University of Iceland, 154 pp.en_US
dc.identifier.isbn978-9935-9473-2-1
dc.identifier.urihttps://hdl.handle.net/20.500.11815/1200
dc.language.isoenen_US
dc.publisherUniversity of Iceland, School of Engineering and Natural Sciences, Faculty of Industrial Engineering, Mechanical Engineering and Computer Scienceen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDNA-rannsókniren_US
dc.subjectC++ (forritunarmál)en_US
dc.subjectTölvunarfræðien_US
dc.subjectDoktorsritgerðiren_US
dc.titleGraphTyper: A pangenome method for identifyingsequence variants at a population scaleen_US
dc.title.alternativeGraphTyper: Aðferð sem byggist á neterfðamengi sem greinir erfðabreytileika í stórum stílen_US
dc.typeinfo:eu-repo/semantics/doctoralThesisen_US

Skrár

Original bundle

Niðurstöður 1 - 1 af 1
Hleð...
Thumbnail Image
Nafn:
phd_thesis_graphtyper.pdf
Stærð:
5.89 MB
Snið:
Adobe Portable Document Format
Description:
Printed version