Opin vísindi

GraphTyper: A pangenome method for identifyingsequence variants at a population scale

Skoða venjulega færslu

dc.contributor Háskóli Íslands
dc.contributor University of Iceland
dc.contributor.advisor Páll Melsted
dc.contributor.author Eggertsson, Hannes
dc.date.accessioned 2019-06-26T10:14:20Z
dc.date.available 2019-06-26T10:14:20Z
dc.date.issued 2019-06
dc.identifier.citation Hannes Pétur Eggertsson, 2019, GraphTyper: A pangenome method for identifying sequence variants at a population scale, PhD dissertation, Faculty of Industrial Engineering, Mechanical Engineering and Computer Science, University of Iceland, 154 pp.
dc.identifier.isbn 978-9935-9473-2-1
dc.identifier.uri https://hdl.handle.net/20.500.11815/1200
dc.description.abstract A fundamental requisite for genetic studies is an accurate determination of sequence variation. While human genome sequence diversity is increasingly well characterized, there is a need for efficient ways to utilize this knowledge in sequence analysis. Here we present GraphTyper, a publicly available novel algorithm and software for genotyping sequence variants. GraphTyper can discover small variants directly from sequence data and is able to encode and accurately genotype all sizes of variants. GraphTyper realigns short-read sequence data to a pangenome, a variation-aware graph structure that encodes sequence variation within a population by representing possible haplotypes as graph paths. Our results show that GraphTyper is fast, highly scalable, and provides sensitive and accurate genotype calls. GraphTyper genotyped 60 million sequence variants in whole-genomes of 49,962 Icelanders, including half a million structural variants, which is to our knowledge the largest such sequence analysis to date. We compare GraphTyper to previous methods and show that it is a valuable tool in characterizing sequence variation in both small and population-scale sequencing studies.
dc.description.abstract Nauðsynleg krafa fyrir erfðafræðirannsóknir eru áreiðanlegar aðferðir til að finna arfgerðir einstaklinga með raðgreiningargögnum. Miklum upplýsingum um erfðabreytileika hefur nú þegar verið safnað, sem kallar á nýjar aðferðir til að nýta þessar upplýsingar. Hér kynnum við GraphTyper, frjáls og frír hugbúnaður sem finnur erfðabreytileika í raðgreiningargögnum. GraphTyper býr til stærðfræðilegt net sem inniheldur þekkta erfðabreytileika, þar sem að hver leið í netinu skilgreinir mögulegar erfðaraðir. GraphTyper ber saman raðgreiningargögn við netið til að bera kennsl á arfgerð einstaklings. Niðurstöður okkar sýna að GraphTyper skalast vel með fjölda einstaklinga og veitir bæði næm og nákvæm köll á arfgerðum í samanburði við aðra samskonar hugbúnaða. GraphTyper kallaði 60 milljón breytileika í 49,962 Íslendingum, þar á meðal hálfa milljón breytileika sem eru stærri en 50 basapör, og er það stærsta slík köllun sinnar tegundar. Við trúum að GraphTyper sé framför fyrir svið erfðafræðirannsókna og muni nýtast í að tengja erfðafræðiupplýsingar við sjúkdóma og aðrar svipgerðir
dc.language.iso en
dc.publisher University of Iceland, School of Engineering and Natural Sciences, Faculty of Industrial Engineering, Mechanical Engineering and Computer Science
dc.rights info:eu-repo/semantics/openAccess
dc.subject DNA-rannsóknir
dc.subject C++ (forritunarmál)
dc.subject Tölvunarfræði
dc.subject Doktorsritgerðir
dc.title GraphTyper: A pangenome method for identifyingsequence variants at a population scale
dc.title.alternative GraphTyper: Aðferð sem byggist á neterfðamengi sem greinir erfðabreytileika í stórum stíl
dc.type info:eu-repo/semantics/doctoralThesis
dc.contributor.department Iðnaðarverkfræði-, vélaverkfræði- og tölvunarfræðideild (HÍ)
dc.contributor.department Faculty of Industrial Eng., Mechanical Eng. and Computer Science (UI)
dc.contributor.school Verkfræði- og náttúruvísindasvið (HÍ)
dc.contributor.school School of Engineering and Natural Sciences (UI)


Skrár

Þetta verk birtist í eftirfarandi safni/söfnum:

Skoða venjulega færslu