Rev. bras. epidemiol; 22 (), 2019
Publication year: 2019
ABSTRACT:
Introduction: Statistical methods such as Principal Component Analysis (PCA) and Factor Analysis (FA) are increasingly popular in Nutritional Epidemiology studies. However, misunderstandings regarding the choice and application of these methods have been observed. Objectives:
This study aims to compare and present the main differences and similarities between FA and PCA, focusing on their applicability to nutritional studies. Methods:
PCA and FA were applied on a matrix of 34 variables expressing the mean food intake of 1,102 individuals from a population-based study. Results:
Two factors were extracted and, together, they explained 57.66% of the common variance of food group variables, while five components were extracted, explaining 26.25% of the total variance of food group variables. Among the main differences of these two methods are:
normality assumption, matrices of variance-covariance/correlation and its explained variance, factorial scores, and associated error. The similarities are:
both analyses are used for data reduction, the sample size usually needs to be big, correlated data, and they are based on matrices of variance-covariance. Conclusion:
PCA and FA should not be treated as equal statistical methods, given that the theoretical rationale and assumptions for using these methods as well as the interpretation of results are different.
RESUMO:
Introdução: Métodos estatísticos de análise multivariada, tais como Análise de Componentes Principais e Análise Fatorial, têm sido cada vez mais utilizados nos estudos em Epidemiologia Nutricional, no entanto equívocos quanto à escolha e aplicação dos métodos são observados. Objetivos:
Os objetivos deste estudo são comparar e apresentar as principais diferenças e similaridades conceituais e metodológicas entre Análise de Componentes Principais e Análise Fatorial visando à aplicabilidade nos estudos em nutrição. Métodos:
Análise de Componentes Principais e Análise Fatorial foram aplicadas em uma matriz de 34 grupos de alimentos que expressaram o consumo alimentar médio de 1.102 indivíduos de um estudo populacional. Resultados:
Um total de dois fatores foi extraído e juntos explicaram 57,66% da variância comum entre as variáveis dos grupos alimentares, enquanto um total de cinco componentes foi extraído e juntos explicaram 26,25% da variância total. Entre as principais diferenças envolvendo os dois métodos estão:
pressuposto de normalidade; as matrizes de variância-covariância/correlação, com consequente quantidade de variância explicada; a carga fatorial/componente e o erro associado. Entre as similaridades estão:
ambas as técnicas são usadas para redução de dados; necessitam de um grande tamanho de amostra; os dados precisam ser correlacionados e são baseadas nas matrizes de variância-covariância/correlação. Conclusão:
Análise de Componentes Principais e Análise Fatorial não devem ser tratadas como métodos estatísticos iguais e intercambiáveis, uma vez que o racional teórico e os pressupostos para o uso dos métodos, assim como a interpretação dos resultados, são diferentes.