Métodos estadísticos bayesianos aplicados en la modelación de la distribución potencial de Fusarium oxysporum en Ecuador continental
Authors
Loading...
Date
2023
Directors
Journal Title
Journal ISSN
Volume Title
Publisher
Quevedo:UTEQ
Abstract
Evaluar la eficacia de los modelos de distribución de especies es crucial para predecir la distribución futura de una especie. En esta investigación, se evaluó la eficiencia del modelo bayesiano, Bayesian Additive Regression Trees (BART), frente a modelos estadísticos: Generalized Linear Model (GLM), Generalized Additive Model (GAM) y algoritmos de aprendizaje automáticos: Random Forest (RF), Maximum Entropy (MAXENT) y Gradient Boosting Machine (GBM) para modelar la distribución potencial de Fusarium oxysporum en Ecuador continental. Se utilizaron registros de presencia de la especie (GBIF) y variables bioclimáticas (WorldClim), para construir los modelos en RStudio a una resolución espacial de 10 x 10 km2. Los modelos se evaluaron mediante AUC, línea de calibración de Miller y clasificación basada en umbrales. Los mapas de probabilidad de presencia de cada modelo se exportaron de RStudio a ArcGis para generar mapas binarios y calcular el área de presencia y ausencia de la especie en Ecuador. Los resultados indican que el modelo RF tuvo el mejor rendimiento en la mayoría de las métricas, con umbral de prevalencia: Especificidad (0.93), estadística de habilidad verdadera (TSS) (0.98); con umbral óptimo: Especificidad (0.98), TSS (0.99); para AUC (1). Sin embargo, GLM presentó buenos resultados en la línea de calibración Miller (1), y la mayor área de presencia del fitopatógeno (127200 km2) y la menor RF (47100 km2). Aunque los modelos bayesianos fueron eficientes en predecir la distribución de F. oxysporum, al igual que los demás métodos, se deben realizar investigaciones futuras con más registros de presencia para mejorar la precisión.
Palabras claves: Algoritmos de Aprendizaje Automático, enfermedad de Panamá, MAXENT, BART, GAM, GLM, Random Forest.
Description
Evaluating the efficiency of species distribution models is crucial for predicting the future distribution of a species. In this research, the efficiency of the Bayesian model, Bayesian Additive Regression Trees (BART), was evaluated against statistical models: Generalized Linear Model (GLM), Generalized Additive Model (GAM) and machine learning algorithms: Random Forest (RF), Maximum Entropy (MAXENT), Gradient Boosting Machine (GBM) to model the potential distribution of Fusarium oxysporum in continental Ecuador. Species occurrence records (GBIF) and bioclimatic variables (WorldClim) were used to build the models in RStudio at a spatial resolution of 10 x 10 km2. Models were evaluated using AUC, Miller calibration line and threshold-based classification. Presence probability maps from each model were exported from RStudio to ArcGis to generate binary maps and calculate the area of presence and absence of the species in Ecuador. The results indicate that the RF model had the best performance in most metrics, with threshold prevalence: Specificity (0.93), true skill statistic (TSS) (0.98); with optimal threshold: Specificity (0.98), TSS (0.99); for AUC (1). However, GLM presented good results in the Miller calibration line (1), and the largest area of phytopathogen presence (127200 km2) and the smallest RF (47100 km2). Although Bayesian models were efficient in predicting the distribution of F. oxysporum, as were the other methods, future research should be conducted with more occurrence records to improve accuracy.
Keywords: Machine Learning Algorithms, Panama Disease, MAXENT, BART, GAM, GLM, Random Forest.
Keywords
Algoritmos de Aprendizaje Automático, enfermedad de Panamá, MAXENT, BART, GAM, GLM, Random Forest
Citation
Jacho Saa Jorge Josué (2023) "Métodos estadísticos bayesianos aplicados en la modelación de la distribución potencial de Fusarium oxysporum en Ecuador continental"Quevedo.UTEQ.86p.