In the course of a nearly century-long global effort to discover new bacterialderived
drugs from the environment, there have been few innovations to the
way that researchers have collected samples and subsequently created
microbial libraries sourced for therapeutic discovery. Virtually every stage of
the natural products (NP) drug discovery process has undergone a
renaissance in method innovation: analytical detection of NPs, bioinformaticdriven
discovery of NPs, detection, modification and expression of NP
biosynthetic gene clusters, structure elucidation and dereplication of NPs and
NP biological activity screening. Despite these advances, the philosophy we
use to create microbial strain libraries from the environment (arguably the
most important step) has seen little change in nearly eight decades of
biomedical research. As a result, it is difficult to discover novel antibiotic
scaffolds due to the degree of taxonomic and chemical redundancy that
exists in these strain libraries, which has led to a divestment in microbialbased
natural product drug discovery. To address the need for creating
libraries with minimal taxa and NP overlap from environmental samples, we
developed a high-throughput matrix assisted laser desorption ionization mass
spectrometry (MALDI-TOF MS) based bioinformatics pipeline (IDBac) that
allows us to readily group bacterial colonies by putative taxonomic identity
and further discriminate them based on in situ natural product production. In
addition to this, using a collection expedition to Iceland as an example, we
purified all distinguishable bacterial colonies (1,616 total) off of isolation
plates derived from 86 environmental samples and we employed the mass
spectrometry (MS) based-IDBac workflow on these isolates to form groups of
taxa (based on protein MS fingerprints; 3,000-15,000 Da), and further
distinguished taxa subgroups based on their degree of overlap within
corresponding natural product spectra (200-2,000 Da). This informed the
decision to create a library of 301 isolates spanning 54 genera. This process
required only 25 hours of data acquisition and 2 hours of analysis.
In a separate experiment using isolates from previous expeditions to Iceland,
we reduced the size of an existing library from 833 to 233 isolates, a 72.0%
reduction. This pipeline minimizes library entries and costs associated with
library generation, and maximizes chemical space entering into downstream
biological screening efforts. This workflow represents a significant advance
toward front-end discovery efforts, thereby removing serendipity from library
generation.
Þrátt fyrir að leit eftir nýjum sýklalyfjum úr náttúrunni hafi staðið yfir í nærri
heila öld, hafa fáar nýjungar litið dagsins ljóss þegar kemur að söfnun
baktería úr umhverfinu og uppsetningu sýnasafna í þeim tilgangi að leita
lyfjavirkra efna úr þeim.
Flestar aðferðir og aðferðafræðin sem notuð er við leit að lyfjavirkum
náttúruefnum hefur þróast umtalsvert og má þar t.d. nefna efnagreiningar
náttúruefna, leitina að nýjum náttúruefnum með hjálp lífupplýsingafræði,
greiningar á breytingum og tjáningu á erfðaklösum sem tjá náttúruefni,
aðferðir við ákvörðun sameindabygginga auk aðferða sem miða að því að
koma í veg fyrir enduruppgötvun þekktra efnasambanda (e. dereplication),
ásamt skimunaraðferðum í lífvirkniprófunum.
Þrátt fyrir stórstígar framfarir á þessum sviðum undanfarna áratugi hafa
litlar framfarir orðið í því hvernig bakteríusýnasöfn eru byggð upp sem má þó
e.t.v. telja eitt mikilvægasta skrefið í þessu ferli.
Sökum einleitni tegunda og efnaflokka í þessum bakteríusöfnum hefur
reynst erfitt að uppgötva ný og áður óþekkt sýklahemjandi efnasambönd úr
þeim.
Markmið þessa verkefnis var að setja upp bakteríustofnasafn með
lágmarksskörun hvað varðar bakteríutegundir og innihaldsefni. Bakteríurnar
fengust úr fjölbreyttum sýnum sem safnað var úr náttúrunni og háhraða
MALDI-TOF massagreiningaðferð og lífupplýsingatækni (IDBac) var nýtt til að
flokka saman bakteríukólóníur samkvæmt tegundaröðun og aðgreina þær
frekar eftir því hvaða náttúruefni þær framleiða in situ.
Þar að auki voru 1616 bakteríukóloníur úr 86 sýnum sem eiga rætur sínar
að rekja til söfnunarferða um Ísland og úr sjónum í kringum Ísland,
einangraðar af ræktunarskálum. Massagreining (MS) tengd
lífupplýsingatækni (IDBac) var notuð til að flokka bakteríurnar niður eftir
massagreiningarrófum af próteinum með mólþunga 3000-15000 Da. Þær
voru síðan flokkaðar frekar niður í undirflokka með því að tengja saman
massagreiningarróf af náttúrefnum sem þær framleiða á mólþungabilinu 200-
2000 Da við fyrri róf. Að lokum voru þessar upplýsingar nýttar til að útbúa
sýnasafn með 301 einangruðum bakteríum sem náðu yfir 54 ættkvíslir.
Söfnun þessara niðurstaðna tók 25 tíma og tveir tímar fóru í greiningarvinnu. Í annarri tilraun sem framkvæmd var á einangruðum bakteríustofnum úr
fyrri söfnunarleiðöngrum á Íslandi, tókst að minnka sýnasafnið úr 833 í 233
sem samsvarar 72% fækkun stofna. Með þessu móti er hægt að lágmarka
þann fjölda sem fer inn í bakteríustofnasýnasöfn og þar með þann kostnað
sem fylgir, hámarka efnafræðilegan fjölbreytileika og lágmarka upphreinsun á
efnum og skimun fyrir lífvirkni. Þessi verkferill sýnir að með því að útbúa betri
sýnasöfn er mögulegt að bæta ferilinn við uppgötvun lyfjaefna úr bakteríum til
muna og stuðla að markvissari útkomu við skimun sýnasafnanna.