F approach algorithm in missing landmark problem
Aproximación al algoritmo F en punto de referencia perdido

Int. j. morphol; 40 (1), 2022
Publication year: 2022

SUMMARY:

Missing data may occur in every scientific studies. Statistical shape analysis involves methods that use geometric information obtained from objects. The most important input to the use of geometric information in statistical shape analysis is landmarks. Missing data in shape analysis occurs when there is a loss of information about landmark cartesian coordinates. The aim of the study is to propose F approach algorithm for estimating missing landmark coordinates and compare the performance of F approach with generally accepted missing data estimation methods, EM algorithm, PCA based methods such as Bayesian PCA, Nonlinear Estimation by Iterative Partial Least Squares PCA, Inverse non-linear PCA, Probabilistic PCA and regression imputation methods. Landmark counts were taken as 3, 6, 9 and sample sizes were taken as 5, 10, 30, 50, 100 in the simulation study. The data are generated based on multivariate normal distribution with positively defined variance-covariance matrices from isotropic models. In simulation study three different simulation scenarios and simulation based real data are considered with 1000 repetations. The best and the most different result in the performance evaluation according to all sample sizes is the Min (F) criteria of the F approach algorithm proposed in the study. In case of three landmarks which is only the proposed F approach and regression assignment method can be applied, Min (F) criteria give best results.

RESUMEN:

Los datos faltantes pueden ocurrir en todos los estudios científicos. El análisis estadístico de formas involucra métodos que utilizan información geométrica obtenida de objetos. La entrada más importante para el uso de información geométrica en el análisis estadístico de formas son los puntos de referencia. Los datos que faltan en el análisis de formas se producen cuando hay una pérdida de información sobre las coordenadas cartesianas históricas. El objetivo del estudio es proponer el algoritmo de enfoque F para estimar las coordenadas de puntos de referencia faltantes y comparar el rendimiento del enfoque F con métodos de estimación de datos faltantes generalmente aceptados, algoritmo EM, métodos basados en PCA como Bayesian PCA, Estimación no lineal por Iterative Partial Least Squares PCA, PCA no lineal inverso, PCA probabilístico y métodos de imputación de regresión. Los recuentos de puntos de referencia se tomaron como 3, 6, 9 y los tamaños de muestra se tomaron como 5, 10, 30, 50, 100 en el estudio de simulación. Los datos se generan en base a una distribución normal multivariada con matrices de varianza-covarianza definidas positivamente a partir de modelos isotrópicos. En el estudio de simulación se consideran tres escenarios de simulación diferentes y se consideran datos reales basados en simulación con 1000 repeticiones. El mejor y más diferente resultado en la evaluación del desempeño según todos los tamaños de muestra es el criterio Min (F) del algoritmo de enfoque F propuesto en el estudio. En el caso de tres puntos de referencia, que es solo el enfoque F propuesto y se puede aplicar el método de asignación de regresión, los criterios Min (F) dan mejores resultados.

More related