Modelo de predicción para la estimación de la producción del banano (musa paradisiaca) a través de técnicas de aprendizaje automático.

Loading...
Thumbnail Image

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Quevedo: UTEQ

Abstract

La presente investigación tuvo como propósito desarrollar un modelo de predicción orientado a estimar la producción del banano (Musa paradisiaca) mediante la aplicación de técnicas de aprendizaje automático. Para ello, se identificaron inicialmente las variables morfológicas, fisiológicas, edáficas y climáticas con mayor incidencia en el rendimiento del cultivo, a partir de un análisis comparativo de estudios previos y un análisis de correlación múltiple. Posteriormente, se evaluaron diversas técnicas de aprendizaje supervisado, entre ellas Regresión Lineal, Árbol de Decisión, Máquinas de Vectores de Soporte, K-Vecinos Más Cercanos, Random Forest, Gradient Boosting, AdaBoost, XGBoost y LightGBM, aplicadas al conjunto de datos provenientes de la Hacienda El Rosario (Valencia, Los Ríos) correspondientes al periodo 2023–2024. La validación del desempeño predictivo se realizó mediante validación cruzada de cinco folds y métricas estadísticas como RMSE, MAE, MAPE, MASE y R², lo que permitió comparar objetivamente la exactitud y estabilidad de cada algoritmo. Los resultados evidenciaron que el modelo Random Forest presentó el mejor comportamiento predictivo, destacándose por su alta precisión, menor margen de error y mayor capacidad de generalización frente a los demás métodos evaluados. La investigación demuestra que la integración de datos agronómicos y herramientas de aprendizaje automático fortalece la agricultura de precisión, optimiza la planificación productiva y constituye una alternativa eficiente para mejorar la estimación del rendimiento bananero.

Description

This research aimed to develop a predictive model to estimate banana (Musa paradisiaca) production using machine learning techniques. First, the key morphological, physiological, edaphic, and climatic variables influencing crop yield were identified through a comparative analysis of previous studies and multiple correlation analysis. Subsequently, several supervised learning algorithms were evaluated—including Linear Regression, Decision Tree, Support Vector Regression, K-Nearest Neighbors, Random Forest, Gradient Boosting, AdaBoost, XGBoost, and LightGBM—using the dataset collected from Hacienda El Rosario, located in Valencia, Los Ríos, during the 2023–2024 production period. Model performance was assessed through five-fold cross-validation and statistical metrics such as RMSE, MAE, MAPE, MASE, and R², enabling an objective comparison of accuracy and stability among the algorithms. The results demonstrated that the Random Forest model achieved the best predictive performance, showing higher accuracy, lower error rates, and improved generalization capacity compared to the other evaluated techniques. This study highlights that integrating agronomic data with machine learning tools strengthens precision agriculture, enhances production planning, and provides an efficient alternative for improving banana yield estimation.

Keywords

Modelo predictivo, Musa paradisiaca, Producción de banano, Aprendizaje automático, Correlación múltiple, Agricultura de precisión, Random Forest

Citation

Espinoza Zamora, Silvana Marisol (2025). Modelo de predicción para la estimación de la producción del banano (musa paradisiaca) a través de técnicas de aprendizaje automático Quevedo. UTEQ. 93 Paginas