Death risk and the importance of clinical features in elderly people with COVID-19 using the Random Forest Algorithm
Previsão de óbito e importância de características clínicas em idosos com COVID-19 utilizando o Algoritmo Random Forest

Rev. Bras. Saúde Mater. Infant. (Online); 21 (supl.2), 2021
Publication year: 2021

Abstract Objectives:

train a Random Forest (RF) classifier to estimate death risk in elderly people (over 60 years old) diagnosed with COVID-19 in Pernambuco. A "feature" of this classifier, called feature importance, was used to identify the attributes (main risk factors) related to the outcome (cure or death) through gaining information.

Methods:

data from confirmed cases of COVID-19 was obtained between February 13 and June 19, 2020, in Pernambuco, Brazil. The K-fold Cross Validation algorithm (K=10) assessed RF performance and the importance of clinical features.

Results:

the RF algorithm correctly classified 78.33% of the elderly people, with AUC of 0.839. Advanced age was the factor representing the highest risk of death. The main comorbidity and symptom were cardiovascular disease and oxygen saturation ≤ 95%, respectively.

Conclusion:

this study applied the RF classifier to predict risk of death and identified the main clinical features related to this outcome in elderly people with COVID-19 in the state of Pernambuco.

Resumo Objetivos:

treinar um classificador do tipo Random Forest (RF) para estimar o risco de óbito em idosos (com mais de 60 anos) diagnosticados com COVID-19 em Pernambuco. Uma "feature" deste classificador, chamada feature_importance, foi usada para identificar os atributos (principais fatores de risco) relacionados com o desfecho final (cura ou óbito) através do ganho de informação.

Métodos:

dados dos casos confirmados de COVID-19foram obtidos entre os dias 13 de fevereiro e 19 de junho de 2020, em Pernambuco, Brasil. O algoritmo K-fold Cross Validation, com K=10, foi usado para avaliar tanto o desempenho do RF quanto a importância das características clínicas.

Resultados:

o algoritmo RF classificou corretamente 78,33% dos idosos, com AUC de 0,839. A idade avançada é o fator que representa maior risco de evolução para óbito. Além disso, a principal comorbidade e sintoma também identificados, foram, respectivamente, doença cardiovascular e saturação de oxigênio ≤95%.

Conclusão:

este trabalho se dedicou à aplicação do classificador RF para previsão de óbito e identificou as principais características clínicas relacionadas com este desfecho em idosos com COVID-19 no estado de Pernambuco.

More related