PERFIL DE PROTEÍNA MALDI-TOF MS DE AMOSTRAS DE URINA COMO FATOR PREDITIVO DE GRAVIDADE DA COVID-19 USANDO MACHINE LEARNING

Autor: Lucas Cardoso Lázari, Marina Farrel Côrtes, Alessandra Luna Muschi, Igor Carmo Borges, Pablo Andres Munoz Torres, Saidy Liceth Vasconez Noguera, Evelyn Patricia Sanches Espinoza, Fabio Guilhardi, José Mauro Vieira, jr, Glaucia Paranhos Baccalà, Silvia Figueiredo Costa, Giuseppe Palmisano
Jazyk: angličtina
Rok vydání: 2023
Předmět:
Zdroj: Brazilian Journal of Infectious Diseases, Vol 27, Iss , Pp 102938- (2023)
Druh dokumentu: article
ISSN: 1413-8670
DOI: 10.1016/j.bjid.2023.102938
Popis: Introdução/Objetivos: O prognóstico da COVID-19 é uma etapa essencial para aumentar a sobrevida do paciente e desempenha um papel importante na alocação de recursos de saúde. A detecção precoce da COVID-19 grave requer técnicas não invasivas, rápidas, de baixo custo e precisas. A proteômica já é descrita na literatura como capaz de detectar padrões para COVID-19 grave, entretanto o uso de amostras pouco invasivas como urina foram pouco exploradas. Neste trabalho utilizamos a proteômica MALDI-TOF MS de amostra de urina combinada com dados clínicos e aprendizado de máquina para predizer gravidade da COVID-19. Métodos: Coorte prospectiva de 372 pacientes hospitalizados com COVID-19 confirmado, realizada no Hospital das Clínicas da FMUSP e no hospital Sírio Libanês, durante o período de julho de 2020 e setembro de 2021. 365 pacientes com até 15 dias de sintomas respiratórios foram incluídos. Amostras de urina foram coletadas, centrifugadas e o sobrenadante estocado a -80°C até o momento de análise. Para obtenção do proteoma por MALDI-TOF MS um total de 500µL de urina foram filtrados (filtro Amicon de 10 kD), dessalinizados (utilizando coluna C18) e submetidos a MALDI-TOF MS, usando uma matriz HCCA. Os arquivos brutos foram pré-processados no R, submetidos às etapas de transformação de dados, normalização, suavização e identificação de picos. A normalidade dos picos identificados foi testada e um teste Wilcoxon rank-sum foi realizado para filtrar os picos proteicos mais relevantes. Os picos resultantes foram usados para treinar um modelo de aprendizado de máquina para classificação de amostras entre condições leves e graves com e sem dados clínicos. Como critério de gravidade, foram considerados necessidade de ventilação mecânica, internação, óbito e marcadores de função renal como ureia e creatinina. Resultados: O modelo de floresta aleatória treinado apenas com o MALDI-TOF MS alcançou um AUC-ROC de 0,760, com precisão, sensibilidade e especificidade de 0,73, 0,77 e 0,69, respectivamente na predição de gravidade da COVID-19. A adição de dados clínicos aos dados proteômicos resultou em um AUC-ROC de 0,827 e sensibilidade e especificidade de 0,81 e 0,87, respectivamente. Conclusões: O perfil proteico por MALDI-TOF MS demonstrou ter potencial para prognóstico de COVID-19; no entanto, a alta variabilidade do proteoma da urina prejudicou o desempenho do modelo. A adição de dados clínicos demonstrou aumentar o desempenho do modelo na classificação da amostra.
Databáze: Directory of Open Access Journals