Modelo de minería de datos para evaluar el efecto del uso del aula virtual sobre el rendimiento académico de los estudiantes de la Facultad de Ingeniería de la Universidad Nacional Jorge Basadre Grohmann de Tacna, en tiempos de pandemia, 2020
Loading...
Date
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Nacional Jorge Basadre Grohmann
Abstract
La Pandemia mundial ha obligado a las universidades a implementar un sistema no presencial en las actividades académicas y la Universidad Nacional Jorge Basadre Grohmann (UNJBG) no es la excepción. Sin embargo no se tiene evidencias del éxito del uso del aula virtual respecto al rendimiento de los estudiantes, para esto se ha propuesto un Modelo basado en minería de datos para relacionar el acceso al entorno virtual de aprendizaje y el rendimiento académico en los estudiantes de la Facultad de Ingeniería en tiempos de pandemia 2020, esto se logró utilizando un marco de trabajo KDD y técnicas computacionales tanto a nivel descriptivo como de aprendizaje automático dentro del campo del Machine Learning. La presente tesis es de tipo correlacional, explicativa y predictiva, donde la población de estudio corresponde a datos de acceso al aula virtual, calificaciones y datos socioeconómicos de todos los estudiantes de la UNJBG tomando como muestra a la Facultad de Ingeniería en el periodo académico 2020-I. Se desarrolló en el marco de trabajo KDD y se siguió cada una de las etapas. Para la captura de datos se solicitó a la UNJBG acceso a los datos de uso del aula virtual en nuestro caso desde la plataforma Moodle, luego se solicitó acceso a los datos de registro académico para obtener los rendimientos académicos de los estudiantes, se hizo el análisis de los datos, procediendo a limpiar, preprocesar y transformar para que cumpla con las exigencias del modelo que se propuso. Inicialmente se ha descrito los datos para entenderlos y centrar el análisis. Luego se procedió a aplicar operaciones de combinación de los datos y de esta forma poder determinar la relación entre las distintas variables, como por ejemplo el número de accesos al aula virtual y el rendimiento académico. Para el aprendizaje automático se dividió los datos en dos partes: un grupo de datos para entrenamiento correspondiente al 80% y un grupo de datos para el testeo de 20% del total de datos. Se utilizó la matriz de confusión para evaluar la precisión de la clasificación, logrando implementar un modelo basado en el algoritmo Gradient Boosted Trees que fue el que mejor desempeño tuvo al clasificar el rendimiento académico con valores de dos clases (SATISFACTORIO y DEFICIENTE) con una precisión de 91,79%, también se logró desarrollar un modelo basado en el algoritmo de Random Forest que obtuvo la mayor precisión para clasificar el rendimiento académico con valores de tres clases (SATISFACTORIO, REGULAR y DEFICIENTE) con una precisión de 89,26%.
Description
Keywords
Minería de datos, Aprendizaje automático, Evaluación de rendimiento