Comprehensive phylogenetic study of ECF sigma factors

Autor: Casas Pastor, Delia, Becker, Anke (Prof. Dr.)
Jazyk: angličtina
Rok vydání: 2021
Předmět:
DOI: 10.17192/z2020.0124
Popis: Extracytoplasmic function (ECF) σ factors are the most minimalistic member of the σ70 family. ECFs and their activity regulators are one of the main signal transduction mechanisms that allow bacteria to respond to extracellular changes. Aside from their natural role in bacterial homeostasis, ECFs are generally host independent and functionally orthogonal, which makes them especially attractive for constructing bacterial synthetic circuits. In silico identification of sets of ECFs, their target promoters and their regulators is particularly simple since ECFs and their regulators are typically encoded in the same genetic neighborhood and usually in the same operon, and ECFs usually target their own promoter. Earlier works on the phylogenetic classification of ECFs revealed that there is a correlation between ECF groups, which harbor proteins with a similar sequence, regulator type and target promoter motif elements. This showed that the phylogenetic classification of ECFs is essential to understand their modes of regulation. The large number of sequenced bacterial genomes currently deposited in databases suggests that an ECF reclassification would expand our knowledge on ECF regulation. This thesis addresses the analysis of the main modes of regulation found in the comprehensive classification of ECF σ factor subfamily. For this study, I first extracted ECFs from all bacterial genomes deposited in NCBI. I identified more than 170,000 unique protein sequences that are likely to function as ECFs. This resulted in a 50-fold expansion over the original ECF library. Then, I classified the conserved σ domains of these proteins into more than 150 phylogenetic groups, each associated to a conserved type of regulator. I systematically described each ECF group in terms of its putative regulator, putative target promoter, taxonomic distribution and putative function. I confirmed these predictions for groups with described members. Anti-σ factors are the main type of ECF regulator across groups, followed by C-terminal extensions of their protein and serine/threonine kinases, which have been suggested to phosphorylate ECFs. I hypothesized new alternative types of regulators for some ECF groups. Using a combination of bioinformatic tools and collaborating with different experimental research groups, I focused on the most important regulatory elements of ECFs to shed light into their mechanism of regulation. In the case of anti-σ factors, I focused on their most common type, class I anti-σ factors, to reveal two shared binding interfaces between ECFs and these inhibitors. Then, I focused on the three largest ECF groups associated to C-terminal extensions, showing a different role of this additional region in the control of ECF activity in the different groups. Lastly, I focused on serine/threonine kinases to find that phosphorylation compensates for the lack of negative charges in one of the main RNA polymerase binding surfaces of ECF σ factors. In summary, this thesis provides the scientific community with a comprehensive overview of ECF σ factor regulation, target promoter and function across phylogenetic groups, and sheds light into some of their most important regulatory mechanisms.
Extracytoplasmatisch wirkende (ECF) σ-Faktoren sind die minimalistischsten Mitglieder der σ70 Familie. ECFs und ihre Aktivitätsregulatoren sind eine der wichtigsten Signaltransduktionsmechanismen, die es Bakterien ermöglichen auf extrazelluläre Änderungen zu reagieren. Neben der bakteriellen Homöostase, ECFs sind im Allgemeinen wirtsunabhängig und funktionell orthogonal, wodurch sie besonders attraktiv für die Konstruktion von bakteriellen synthetischen Schaltkreisen sind. In silico Identifizierung von Paaren aus ECFs, ihren Zielpromotoren und ihren Regulatoren ist insbesondere deshalb einfach, weil ECFs und ihre Regulatoren typischerweise in derselben genetischen Nachbarschaft und üblicherweise im selben Operon kodiert sind. Außerdem erkennen ECFs üblicherweise ihre eigenen Promotoren. Frühere Arbeiten haben gezeigt, dass eine Korrelation zwischen der ECF Proteinsequenz, also der phylogenetischen Gruppe, und dem Regulationstyp, sowie dem Zielpromoter besteht, was zeigt, dass die phylogenetische Klassifizierung von ECFs essentiell für das Verständnis der Regulationsmodi ist. Die hohe Anzahl an sequenzierten bakteriellen Genomen, die aktuell in Datenbanken hinterlegt ist, legt nahe, dass eine ECF-Reklassifizierung unser Verständnis über ECF-Regulation erweitern würde. Diese Arbeit befasst sich mit der Analyse der wichtigsten Regulationsmechanismen, die in einer umfassenden Klassifizierung der ECF-σ-Faktor Unterfamilie gefunden wurden. Für dieses Projekt habe ich zuerst die ECFs aus allen bakteriellen Genomen extrahiert, die in NCBI hinterlegt sind. Ich habe mehr als 170000 einzigartige Proteinsequenzen identifiziert, die wahrscheinlich als ECFs wirken. Dies resultiert in einer 50-fachen Erweiterung im Vergleich zu der vorherigen ECF-Sammlung. Anschließend habe ich die konservierten σ-Domänen dieser Proteine in mehr als 150 phylogenetische Gruppen gruppiert, von der jede mit einem konservierten Regulator assoziiert ist. Ich habe die ECF-Gruppen in Bezug auf ihre möglichen Regulatoren und Zielpromotoren, taxonomische Verbreitung, sowie ihrer mögliche Funktion beschrieben. In den meisten Gruppen, Anti-σ-Faktoren sind die wichtigsten Regulatoren, gefolgt von C-terminalen Verlängerungen des Proteins und Serin/Threonin-Kinasen, die möglicherweise ECFs phosphorylieren. Ich habe Hypothesen über neue, alternative Regulationsmechanismen für einige ECF-Gruppen aufgestellt. Durch die Nutzung von bioinformatischen Methoden und in Zusammenarbeit mit experimentell arbeitenden Gruppen, habe ich mich auf die wichtigsten regulatorischen Elemente von ECFs fokussiert, um ihre Regulationsmechanismen aufzudecken. Im Fall der Anti-σ-Faktoren habe ich mich auf den häufigsten Typ, Klasse I Anti-σ-Faktoren, fokussiert um zwei gemeinsame Bindungsoberflächen zwischen ECF und Anti-σ-Faktoren zu entdecken. Anschließend habe ich mich mit den drei häufigsten ECF Gruppen befasst, die mit C-terminalen Verlängerungen assoziiert sind, wodurch ich eine verschiedenartige Rolle dieser Sequenz in der Kontrolle der ECF-Aktivität in den verschiedenen Gruppen zeigen konnte. Abschließend habe ich mich auf Serin/Threonin-Kinasen konzentriert, um zu entdecken, dass Phosphorylierungen für den Mangel an negativen Ladungen in einer der wichtigsten Bindeoberflächen zwischen RNA-Polymerase und ECF-σ-Faktoren kompensiert. Zusammenfassend bietet diese Arbeit der wissenschaftlichen Gemeinschaft einen umfassenden Überblick über phylogenetische Gruppen von ECF-σ-Faktoren ihrer Zielpromotoren und Funktionen, sowie wichtige Einblicke in einige ihrer wichtigsten Regulationsmechanismen.
Databáze: OpenAIRE