Comprendre la fonction cellulaire par l'analyse du transcriptome : une approche bio-informatique

Autor: Mola, Saraï
Jazyk: francouzština
Rok vydání: 2022
Předmět:
Druh dokumentu: Diplomová práce
Popis: Le système immunitaire permet la défense de l’organisme contre l’intrusion de nombreux pathogènes (ex : microbes, champignons, virus et bactéries). Il est composé de plusieurs populations cellulaires, provenant d’une même cellule souche multipotente, et pouvant identifier la présence de ces pathogènes. La reconnaissance de ces derniers induit deux types de réponses immunitaires afin de les éliminer : les réponses immunitaires innée et adaptative. Ces réponses entrainent le recrutement de nombreuses cellules immunitaires circulantes sur le lieu de détection du pathogène, appelé site d’inflammation. Chaque population de cellule immunitaire présente sur le site, va jouer un rôle spécifique, déterminé par sa fonction cellulaire. Un individu est défini par son génome composé de gènes hérédités et spécifiquement exprimés à travers les populations cellulaires de l’organisme. L’étude de l’expression génique à travers plusieurs tissus humains a montré qu’un sous-groupe de moins de 200 gènes était exclusivement exprimé dans un tissu donné et qu’environ 2 000 gènes sont indispensables pour qu’une cellule humaine se développe et prolifère. De plus, certains gènes ont la capacité d’exprimer plusieurs transcrits qui vont encoder différents isoformes d’une protéine dont certaines ont une fonction qui leur est spécifique. L’étude du transcriptome dans plusieurs types cellulaires permettrait de mieux comprendre les fonctions spécifiques d’une cellule. Le développement d’approche pour l’étude de l’expression génique dans les cellules immunitaires primaires humaines offrirait un niveau supplémentaire d’information sur l’établissement et le maintien de l’expression des gènes et des transcrits encodant différentes isoformes protéiques, qui sont en partie responsables de la fonction cellulaire. L’identification des éléments et mécanismes régulant l’expression des gènes et de leurs transcrits complèterait l’approche. La première partie de cette thèse présente une étude de la co-expression génique dans les cellules immunitaires primaires pour mieux comprendre la fonction cellulaire. L’approche développée identifie tout d’abord des modules fonctionnels de gènes. Nos modules de gènes co- exprimés sont obtenus avec l’outil WGNA puis étudiés par trois analyses, une globale d’enrichissement d’annotations géniques et deux ciblées, utilisant respectivement un classement par percentile et une analyse de la première composante principale, pour sélectionner un sous- groupe de gènes d’intérêt. L’approche développée permet aussi l’étude de la régulation de l’expression génique, par les facteurs de transcription au sein des modules de gènes co-exprimés, et dans les décisions de différentiation dans le processus physiologique de production des cellules immunitaires, l’hématopoïèse. Cette approche a permis de démontrer qu’une grande partie des gènes co-exprimés, joue un rôle important dans les fonctions du type cellulaire, auquel ils sont associés. De plus, certains gènes co-exprimés sont impliqués dans la même fonction cellulaire. Pour les gènes dont la fonction et le rôle ne sont pas connus, dans le type cellulaire auquel ils sont associés, nous présupposons que leur rôle est important dans ce type cellulaire. Aussi, ces gènes pourraient jouer un rôle dans les fonctions mises en évidence dans leur module. La seconde partie de la thèse s’intéresse à l’expression par transcrits et aux isoformes de protéines qu’ils encodent afin d’identifier une différence dans le profil d’expression et de la fonction entre les isoformes protéiques provenant d’un même gène. La méthodologie utilisée pour cette approche compare les profils d’expression des transcrits d’un même gène, et identifie ceux qui ont un profil d’expression distinct dans nos types cellulaires et codant pour des isoformes de protéines spécifiques. L’annotation des transcrits a permis de définir quels évènements transcriptomiques (ex : sites d’initiation de la transcription distincts et/ou épissage alternatif) sont impliqués dans le choix de l’isoforme protéique exprimée au sein de la cellule. Nous avons obtenu 15 gènes qui ont au moins un transcrit avec un profil d’expression spécifique dans nos données. Les gènes PTPRC, qui code pour la protéine CD45, et le gène CD44 ont été révélés par notre approche et sont connus pour avoir des isoformes de protéines avec des affinités différentes à leur ligand et ces isoformes sont spécifiquement exprimées dans les cellules immunitaires. Cette approche nous a permis d’identifier des isoformes de transcrits spécifiquement exprimés dans nos cellules immunitaires et pouvant avoir une fonction différente et importante dans ces types cellulaires. Dans cette thèse, nous présentons deux approches d’analyse du transcriptome humain dans les cellules immunitaires primaires. Celles-ci apportent un plus grand niveau de compréhension sur l’expression par gènes et par transcrit, et sa régulation, ainsi que sur l’établissement et le maintien des fonctions cellulaires spécifiques et partagées dans les cellules immunitaires primaires. Ces approches pourront être appliquées dans d’autres conditions de comparaison telles que sain versus malade ou encore traité versus non-traité.
The human immune system protects the body against the intrusion of many pathogens (bacteria, viruses, fungi, and parasites). It is composed of several cell populations, originating from the same multipotent stem cell, and able to identify the presence of these pathogens. Recognition of these induces two types of immune responses to eliminate them: innate and adaptive immune responses. These responses lead to the recruitment of numerous circulating immune cells to the site of detection of the pathogen, called the site of inflammation. Each immune cell population present on the site will play a specific role, determined by its cellular function. An individual is defined by his genome composed of genes inherited and specifically expressed through the cell populations of the organism. The study of gene expression across several human tissues showed that a subset of less than 200 genes were exclusively expressed in each tissue and that approximately 2,000 genes are essential for a human cell to develop and proliferates. In addition, some genes can express several transcripts that will encode different isoforms of a protein, some of which have a specific function. Genome-wide transcriptomic-based analysis in several cell types could give a better understanding to specific cell functions. To increase comprehension of establishment and maintaining gene and transcript expression implicated in cell function, an approach would be developed to study transcriptome of primary human immune cell types. It will be completed with the identification of elements and mechanisms involved in genes and transcript expression in immune cells. The first part of the these presents a study of gene co-expression in primary immune cells to better understand cell function. This approach identifies functional gene modules. Our co- expressed gene modules are obtained with the WGNA tool and the modules were studied to select a subgroup of genes of interest by: (1) one global analysis of gene annotation enrichment and (2) two targeted analyses, using percentile ranking and first principal component analysis respectively. The approach also evaluates gene expression regulation by transcription factors in co-expressed gene modules and in fate decision of hematopoiesis. This approach demonstrates that a large part of the co-expressed genes play an important role in the functions of the associated cell type. Moreover, some co-expressed genes are involved in the same cellular function. For genes whose function and role are not known, in the associated cell type, we assume that their role is important in this cell type by guilt by association. Also, these genes could play a role in the functions highlighted in their module. The second part of the thesis focuses on the expression by transcripts and the protein isoforms they encode to identify a difference in the expression profiles and function between protein isoforms come to the same gene. The methodology used for this approach compares the expression profiles of transcripts from the same gene and identifies those with a distinct expression profile in our cell types and encode specific protein isoforms. Transcript annotation was used to define which transcriptomic events (e.g., distinct transcription initiation sites and/or alternative splicing) are involved in the choice of the protein isoform expressed within the cell. We obtained 15 genes that have at least one transcript with a specific expression profile in our data. The PTPRC genes, which codes for the CD45 protein, and the CD44 gene were revealed by our approach and are known to have protein isoforms with different affinities to their ligand. Their protein isoforms are specifically expressed in immune cells. This approach allowed us to identify isoforms of transcripts specifically expressed in our immune cells and which may have a different and important function in these cell types. In this thesis, we present two approaches for analyzing the human transcriptome in primary immune cells. These provide a greater level of understanding on gene and transcript expression and its regulation, as well as on the establishment and maintenance of specific and shared cellular functions in primary immune cells. These approaches can be applied in other comparison conditions such as between patients and healthy individuals to identify pathogenic pathways or between treated versus untreated individuals to identify biomarkers.
Databáze: Networked Digital Library of Theses & Dissertations