Aplicação de algoritmos de machine learning na avaliação do consumo alimentar: resultados da linha de base do Estudo Longitudinal de Saúde do Adulto (ELSA-Brasil)
Application of machine learning algorithms in the assessment of food consumption: baseline results from the Brazilian Longitudinal Study of Adult Health (ELSA-Brasil)

Publication year: 2021
Theses and dissertations in Portugués presented to the Universidade de São Paulo. Faculdade de Saúde Pública to obtain the academic title of Doutor. Leader: Benseñor, Isabela Judith Martins

Introdução:

A avaliação do consumo alimentar permite gerar conhecimento sobre a alimentação de indivíduos e populações, além de identificar os determinantes e tendências no consumo. Com ela é possível planejar ações, orientar serviços e implementar políticas públicas de saúde adequadas as necessidades da população. Com o apoio da tecnologia é possível automatizar algumas etapas do processo de análise de dados, com redução do tempo e recursos necessários, especialmente em grandes grupos. Entretanto, em países como o Brasil, ainda são escassas as aplicações de algoritmos de machine learning na avaliação da dieta.

Objetivo:

Aplicar algoritmos de machine learning na avaliação do consumo alimentar de servidores públicos em um grande estudo brasileiro.

Métodos:

Este estudo analisou transversalmente os dados da linha de base do Estudo Longitudinal de Saúde do Adulto (ELSA-Brasil). A partir destes dados, para explorar e classificar padrões alimentares, foi utilizado o algoritmo de cluster - K-Means. Na sequência, quatro algoritmos preditivos - Support Vector Machines (SVM), Decision Trees (DT), Naïve Bayes (NB), K-Nearest Neighbours (Knn) - foram aplicados incluindo variáveis demográficas, socioeconômicas e clínicas para predizer padrões alimentares. Adicionalmente, Sistemas de Recomendações foram construídos com algoritmos de Filtragem Colaborativa Baseada em Usuário e Itens (UBCF / IBCF) para o aconselhamento personalizado de dieta. As análises foram realizadas com a utilização do ambiente R.

Resultados:

Dois padrões alimentares foram derivados na amostra. O primeiro padrão, rotulado como "Padrão Ocidental", no qual os participantes apresentaram ingestões médias superiores para cereais refinados, feijões, carnes vermelhas e processadas, leite e produtos lácteos com alto teor de gorduras e bebidas adoçadas, quando comparados aqueles incluídos no outro padrão. O segundo padrão, rotulado como "Padrão Prudente", os participantes apresentaram consumo superior de frutas, vegetais, cereais integrais, aves, peixes, leite e produtos lácteos com redução de gorduras. Para a construção dos Sistemas de Recomendações foi fixado o limite de cinco itens, por participante, para evitar recomendações extensas e inespecíficas sobre a dieta (precisão entre 90% [IBCF] e 91% [UBCF]).

Conclusão:

Através da aplicação de algoritmos de machine learning foi possível realizar a análise de dados sobre o consumo, predizer padrões e personalizar recomendações sobre a dieta. Com o apoio das técnicas utilizadas, é possível subsidiar profissionais na gestão e no planejamento de ações de educação alimentar e nutricional personalizadas.

Introduction:

The evaluation of food consumption allows generating knowledge about the diet of individuals and populations, in addition to identifying the determinants and trends in consumption. With it is possible to plan actions, guide services and implement public health policies appropriate to the needs of the population. With the support of technology, it is possible to automate some stages of the data analysis process, reducing the time and resources needed, especially in large groups. However, in countries like Brazil, the applications of machine learning algorithms in diet assessment are still scarce.

Objective:

Apply machine learning algorithms in the evaluation of food consumption by public servants in a large Brazilian study.

Methods:

This study cross-sectionally analyzed the baseline data from the Brazilian Longitudinal Study of Adult Health (ELSA-Brasil). From these data, to explore and classify dietary patterns, the cluster algorithm K-Means was used. Next, four predictive algorithms - Support Vector Machines (SVM), Decision Trees (DT), Naïve Bayes (NB), K-Nearest Neighbors (Knn) - were applied including demographic, socioeconomic and clinical variables to predict dietary patterns. Additionally, Recommendation Systems were built with User- and Items-Based Collaborative Filtering algorithms (UBCF / IBCF) for personalized diet advice. The analyzes were performed using the environment R.

Results:

Two dietary patterns were derived in the sample. The first pattern, labeled as "Western Pattern", in which the participants had higher average intakes for refined cereals, beans, red and processed meats, milk and dairy products with a high fat content and sweetened drinks, when compared to those included in the other pattern. The second pattern, labeled "Prudent Pattern", participants showed a higher consumption of fruits, vegetables, whole grains, poultry, fish, milk and dairy products with reduced fats. For the construction of the Recommender Systems, a limit of five items was set, per participant, to avoid extensive and unspecific recommendations on the diet (accuracy between 90% [IBCF] and 91% [UBCF]).

Conclusion:

Through the application of machine learning algorithms, it was possible to perform data analysis on consumption, predict patterns and personalize diet recommendations. With the support of the techniques used, it is possible to subsidize professionals in the management and planning of personalized food and nutrition education actions.

More related