"Gestión automática de documentos digitales basado en el contenido textual, para facilitar el acceso a la información de la Facultad de Ciencias de la Ingeniería"

Loading...
Thumbnail Image
Date
2016
Journal Title
Journal ISSN
Volume Title
Publisher
Quevedo: UTEQ
Abstract
La clasificación de documentos en el área de la Inteligencia Artificial (IA), consiste en organizar los archivos de manera automática mediante un modelo de aprendizaje generado por un algoritmo. En la Secretaría de Facultad de Ciencias de la Ingeniería (FCI), la gestión de los documentos digitales se realiza de manera manual. Esto provoca el consumo de recursos al almacenar los archivos, duplicaciones, eliminación, alteraciones en los documentos y al no contar con un módulo de respaldo de la documentación se dificulta la restauración de los documentos alterados y eliminados, aumentando la carga de trabajo para la persona encargada. La búsqueda de archivos es un proceso que se debe agilizar en la secretaría, por el incremento de los documentos digitales de los trámites que se generan en la FCI. Por tal razón se debe automatizar este proceso a través de una aplicación que facilite las tareas que se realizan en dicha Secretaría. Se propuso diseñar una herramienta que mejore la gestión de los documentos digitales en la FCI, implementado diferentes técnicas de la IA como; el algoritmo clasificación de documentos Naive Bayes, permitiendo obtener una organización adecuada de los archivos y clasificándolos de manera automática, la biblioteca Apache Lucene para optimizar el proceso de búsqueda de los mismos y la biblioteca OpenNLP que permitió el procesamiento de los diferentes tipos de archivos. Para el desarrollo de este sistema clasificación de automática de documentos digitales se realizó un análisis de las tareas que realiza la Secretaria de la FCI, para la implementación se elaboró un módulo de clasificación con el algoritmo Naive Bayes y una interfaz de fácil manejo bajo la plataforma de desarrollo Netbeans. Palabras Clave: lucene, clasificación automática, naive bayes, opennlp, inteligencia artificial.
Description
The classification of documents in the area of Artificial Intelligence (AI), consists of organize files automatically through a learning model generated by an algorithm. In the Secretaria of the Faculty of Engineering Sciences (FCI), the management of digital files is done manually. This causes resource consumption by storing files, duplication, deletion, changes in the documents and not having a support module documentation restoration of altered documents is difficult and eliminated, thus increasing the workload for the person in charge thereof. File searching is a process that should speed up in the secretariat, by the increase of digital documents paperwork generated in the FCI. For this reason you should automate this process through an application that facilitates the tasks performed in the Secretariat of the FCI. It was proposed to design a tool that improves the management of digital documents in the FCI, implemented different AI techniques like; the algorithm document classification Naive Bayes, allowing to obtain an adequate organization of files and sorting them automatically, the Apache Lucene library to optimize the search process them and OpenNLP library that allowed processing different types of files. For the development of this classification system automatic digital document an analysis of the tasks performed by the Secretariat of the FCI, to implement a module classification was developed with the algorithm Naive Bayes and an interface easy to use underperformed the Netbeans development platform. Keywords: lucene, classification automatic, naive Bayes, OpenNLP, intelligence artificial.  
Keywords
Lucebce, clasificación automática, naive, bayas, opennlp,, Inteligencia artificial
Citation
Agual Espín, José Luis. (2016). "Gestión automática de documentos digitales basado en el contenido textual, para facilitar el acceso a la información de la Facultad de Ciencias de la Ingeniería" . Quevedo. UTEQ 141 p.