Гены «стахановцы» 18 хромосомы человека, отсутствующие белки и не охарактеризованные белки в ткани печени и клеточной линии HepG2

Autor: George S. Krasnov, Anastasia V. Tsvetkova, Sergey S. Markin, Y.Y. Kiseleva, A. V. Lisitsa, Ekaterina V. Ilgisonis, Victor G. Zgoda, K.G. Ptitsyn, Olga S. Timoshenko, Svetlana A. Khmeleva, Ekaterina V. Poverennaya, Alexander I. Archakov, K.A. Deinichenko, I.V. Buromski, Olga I. Kiseleva, I. V. Vakhrushev, Sergey P. Radko, Elena A. Ponomarenko, V.V. Shapovalova, L. K. Kurbatov, Mikhail A. Pyatnitskiy
Jazyk: angličtina
Rok vydání: 2021
Předmět:
Zdroj: Biomedical Chemistry: Research and Methods
Popis: Missing (MP) and functionally uncharacterized proteins (uPE1) comprise less than 5% of the total number of proteins encoded by human Chr18 genes. Within half a year, since the January 2020 version of NextProt, the number of entries in the MP+uPE1 datasets changed, mainly due to the achievements of antibody-based proteomics. Assuming that the proteome is closely related to the transcriptome scaffold, quantitative PCR, Illumina HiSeq, and Oxford Nanopore Technology were applied to characterize the liver samples of three male donors in comparison with the HepG2 cell line. The data mining of the Expression Atlas (EMBL-EBI) and the profiling of biopsy samples by using orthogonal methods of transcriptome analysis have shown that in HepG2 cells and the liver, the genes encoding functionally uncharacterized proteins (uPE1) are expressed as low as for the missing proteins (less than 1 copy per cell), except the selected cases of HSBP1L1, TMEM241, C18orf21, and KLHL14. The initial expectation that uPE1 genes might be expressed at higher levels than MP genes, was compromised by severe discrepancies in our semi-quantitative gene expression data and in public databanks. Such discrepancy forced us to revisit the transcriptome of Chr18, the target of the Russian C-HPP Consortium. Tanglegram of highly expressed genes and further correlation analysis have shown the severe dependencies on the mRNA extraction method and the analytical platform. Targeted gene expression analysis by quantitative PCR (qPCR) and high-throughput transcriptome profiling (Illumina HiSeq and ONT MinION) for the same set of samples from normal liver tissue and HepG2 cells revealed the detectable expression of 250+ (92%) protein-coding genes of Chr18 (at least one method). The expression of slightly more than 50% protein-coding genes was detected simultaneously by all three methods. Correlation analysis of the gene expression profiles showed that the grouping of the datasets depended almost equally on both the type of biological material and the experimental method, particularly cDNA/mRNA isolation and library preparation.
Отсутствующие белки и функционально не охарактеризованные белки (в англоязычной литературе обозначенные как missing (MP) и functionally uncharacterized proteins (uPE1), соответственно) составляют менее 5% от общего числа белков, кодируемых генами 18 хромосомы человека. В течение полугода, начиная с января 2020 года, в версии NextProt выросло количество записей в наборах данных MP+uPE1. Подобные изменения обусловлены преимущественно достижениями протеомики на основе антител. В данной работе количественная ПЦР, технологии секвенирования Illumina HiSeq и Oxford Nanopore Technologies были применены для сравнительного анализа транскриптомного профиля образцов печени трех доноров мужского пола и клеточной линии HepG2. Анализ данных атласа экспрессии (Expression Atlas, EMBL-EBI) и полученных результатов по биологическим образцам с использованием ортогональных методов анализа транскриптома показал, что в клетках печени и HepG2 уровень экспрессии генов, кодирующих функционально не охарактеризованные белки (uPE1), находится на таком же низком уровне, как и в случае генов MP (в количестве менее 1 копии на клетку). Исключение составили несколько генов: HSBP1L1, TMEM241, C18orf21 и KLHL14. Согласно существенным расхождениям в ранее полученных полуколичественных данных по экспрессии генов и данным в открытых базах данных, изначально предполагалось, что экспрессия генов uPE1 может быть выше, чем генов MP. Подобное расхождение побудило обратиться к транскриптому 18 хромосомы человека, являющейся целевой для России в проекте «Протеом человека». Полученные результаты о наиболее экспрессируемых генах и дальнейший корреляционный анализ показал существование зависимости от метода экстракции мРНК и аналитической платформы. Анализ экспрессии целевых генов 18 хромосомы с применением количественной ПЦР (qPCR) и методов высокопроизводительного профилирования транскриптома (Illumina HiSeq и ONT MinION) для одинаковых наборов образцов нормальной ткани печени и клеточной линии HepG2 выявил более 250 (92%) белок-кодирующих генов, детектируемых хотя бы одним методом. Экспрессия более чем 50% белок-кодирующих генов была детектирована всеми тремя методами. Корреляционный анализ профилей экспрессии генов показал, что результаты «группируются» в зависимости от типа биологического материала и экспериментальных методов, в частности от способа подготовки библиотеки (выделения кДНК, мРНК). Зависимость от выбора способа биоинформатической обработки была отмечена в значительно меньшей степени.
Databáze: OpenAIRE