Crosslinking mass spectrometry in human mitochondria: From data analysis strategy to in situ biological findings

Autor: Ryl, Petra Sabine Jutta
Jazyk: angličtina
Rok vydání: 2023
Předmět:
DOI: 10.14279/depositonce-16959
Popis: Mitochondria are cellular organelles that fulfil a number of essential biological roles, including the production of cellular useable energy (in form of adenosine triphosphate, ATP) and the biosynthesis of other crucial macromolecules. These fundamental molecular processes are orchestrated by a multitude of approximately 1,500 mitochondrial proteins and their dynamic interactions, described as interactome. Analysing the interactome of proteins within a living cell sheds light on life at a molecular basis, explains how interactions adapt to changes and illuminates how protein-protein interactions are malfunctioning in diseases. Mitochondria are closely associated to various diseases; however, the lack of protein identification and structural information makes it challenging to grasp the full potential of their interactome for an integrated understanding of mitochondrial functions. This has led to the development of many bioanalytical methods to determine the three-dimensional structure of proteins, assessing their functions and finally analysing their interactome. Crosslinking mass spectrometry (CLMS) is a comparatively new tool that generates in situ structural information and allows protein-protein interaction analysis on a proteome-wide level. This is done by introducing crosslinkers that covalently connect amino acids in spatial proximity to each other. After crosslinking, the proteins are proteolytically digested and the resulting peptides are analysed by mass spectrometry. The CLMS method has a large impact on traditional structural biological applications due to its scalability to analyse also large protein complexes and their protein-protein interactions networks in their native environment. The complexity of the biological systems that have been subjected to in situ CLMS has increased with the depth of analysis and the development of enrichable and MS-cleavable cross-linkers nowadays. On the way to in vivo crosslinking, cellular organelles like mitochondria, or virus or intact cells are subjected to proteome-wide CLMS analysis. However, the detection and identification of underrepresented crosslinked peptides still presents the major analytical and computational challenge in large-scale CLMS studies. To address this challenge first, crosslinked peptides using a non-cleavable (disuccinimidyl suberate, DSS) and a MS-cleavable crosslinker (disuccinimidyl sulfoxide, DSSO) in human mitochondria, were enriched experimentally by multidimensional fractionation, sequential digestion and targeted LC-MS/MS acquisition methods. Second, the challenge of structural data interpretation was approached by using high-throughput comparative modelling, analyzing long-distance crosslinks in a systematic way and ultimately revealing structural insights into in situ protein dynamics. Third, the computational challenge of data analysis, as all possible combinations of peptide pairs resulting from their digestion have to be examined during database search, was tackled by the development of a novel iterative search approach. Usually, exclusively high abundant proteins are included in the database of large-scale CLMS studies, but this does not necessarily represent the ideal database for crosslink identification. Proteins that are absent or crosslinked at an underrepresented rate will add noise to the database and diminish crosslink identification. Finally, yet important, the investigation of a novel iterative search strategy based on an optimization of the database used for crosslink identification, addressed the challenge of identifying the minority of crosslinks between proteins and yielded in novel insights into protein-protein interactions in human mitochondria.
Mitochondrien sind zelluläre Organellen, die eine Vielzahl an essentiellen biologischen Funktionen erfüllen, welche die Produktion von zellulär nutzbarer Energie (in Form von Adenosinetriphosphat, kurz ATP) und die Biosynthese anderer wichtiger Markomoleküle beinhalten. Diese fundamentalen, molekularen Prozesse sind inszeniert von einer Fülle von schätzungsweise 1500 mitochondrialen Proteinen und deren dynamischen Interaktionen, welche als Interaktom beschrieben werden. Die Analyse des proteinären Interaktoms in lebenden Zellen offenbart Einblicke, wie Leben auf molekularer Basis funktioniert, erläutert wie sich Interaktionen auf umgebende Änderungen anpassen und beleuchtet wie Protein-Protein-Interaktionen im Fall von Krankheiten gestört sind. Besonders Mitochondrien sind eng mit verschiedensten Krankheitsbildern assoziiert. Die Ermangelung an Proteinidentifikation und strukturellen Informationen zu mitochondrialen Proteinen stellt eine Herausforderung dar, das volle Potential des Interaktoms für das ganzheitliche Verständnis der mitochondrialen Funktionen ausschöpfen zu können. Das hat zu der Entwicklung von verschiedenen, bioanalytischen Methoden geführt, die zur Bestimmung der dreidimensionalen Proteinstruktur, zur Untersuchung der Proteinfunktionen und schlussendlich zur Analyse des Interaktoms beitragen. Quervernetzende Massensprektrometrie (crosslinking mass spectrometry, kurz CLMS) ist ein vergleichsweise neuartiges Werkzeug, welches in situ strukturelle Informationen generiert und die Protein-Protein-Interaktionsanalyse auf einem Proteom-weiten Level ermöglicht. Dies geschieht durch die Verwendung von chemischen Quervernetzern (sogenannten Crosslinkern), welche räumlich naheliegende Aminosäuren kovalent miteinander verbinden. Nach dem chemischen Verbinden werden die Proteine proteolytisch verdaut und die resultierenden Peptide werden mittels Massenspektrometrie analysiert. Die CLMS-Methode hat einen starken Einfluss auf traditionelle, strukturbiologische Anwendungen aufgrund ihrer Skalierbarkeit sogar große Proteinkomplexe und deren Protein-Protein-Interaktionen in ihrer natürlichen Umgebung zu analysieren. Die Komplexität der biologischen Systeme, die bereits in situ CLMS-Untersuchungen unterzogen wurden, steigt heutzutage stetig mit der verbesserten, analytischen Tiefe und der Entwicklung von anreicherbaren sowie massen-spektrometrisch-spaltbaren Crosslinkern an. Auf dem Weg zur Untersuchung in lebenden Organismen (in vivo Crosslinking) wurden bereits zelluläre Organellen wie Mitochondrien, oder Viren oder sogar intakte Zellen einer Proteom-weiten CLMS-Analyse unterzogen. Dennoch stellt die Detektion und Identifikation von unterrepräsentierten, querverbundenen Peptiden in großangelegten CLMS-Analysen immer noch die hauptsächliche, analytische sowie rechengestützte Herausforderung dar. Diese Herausforderung wird erstens adressiert, indem die verbundenen Peptide, aus der Reaktion mit einem nicht-spaltbaren (disuccinimidyl suberate, DSS) sowie einem massenspektrometrisch-spaltbaren Crosslinker (disuccinimidyl sulfoxide, DSSO) in menschlichen Mitochondrien, experimentell angereichert werden. Dies geschieht mit Hilfe einer multidimensionalen Fraktionierung und eines sequentiellen, proteolytischen Verdaus, in Verbindung mit gezielten massenspektrometrischen Akquisemethoden. Zweitens wird die Herausforderung der strukturellen Dateninterpration durch vergleichende (komparative) Modellierung im Hochdurchsatzverfahren angegangen, was die systematische Analyse von Crosslinks mit unnatürlich langen Distanzen ermöglicht und neue, strukturelle Erkenntnisse zu in situ Proteindynamiken liefert. Drittens wird die Herausforderung der rechenbetonten Datenanalyse durch die Entwicklung einer neuartigen, sich wiederholenden (iterativen) Suchstrategie adressiert. Bei der Datenanalyse müssen alle denkbaren Kombinationen von Peptidepaaren, die sich aus dem proteolytischem Verdau ergeben, in der Protein-Datenbank berücksichtigt werden. Normalerweise werden hierfür ausschließlich hochabundante Proteine in die Datenbank-Suche inkludiert, jedoch stellen diese nicht zwangsläufig die bestmögliche Datenbank für die Identifikation von Crosslinks dar. Proteine, die nicht oder nur zu einem unterrepräsentativen Anteil quervernetzt wurden, fügen der Datenbank ein unnötiges Hintergrundrauschen hinzu und vermindert so die Identifikation von Crosslinks. Schlussendlich ist die Entwicklung der neuartigen, iterativen Suchstrategie, basierend auf der Optimierung der Datenbank zur Crosslink-Identifikation, von Bedeutung, weil diese sich der Herausforderung stellt, die Minderheit der Crosslinks zwischen unterschiedlichen Proteinen zu identifizieren. Dies führte letztendlich zu neuen Einblicken in die Protein-Protein-Interaktion in humanen Mitochondrien.
Databáze: OpenAIRE