Abstract:
El uso de técnicas de análisis de sentimientos para capturar las opiniones de las masas a través de las redes sociales ha aumentado en los últimos años en diferentes áreas como la política, así lo demuestran estudios realizados alrededor del mundo, donde los niveles de asertividad alcanzados en la predicción de intención de voto fueron significativos. Considerando el contexto latinoamericano, como las Elecciones Presidenciales Perú 2021, el estudio se propuso determinar la técnica de Machine Learning más asertiva para la predicción de intención de voto aplicada a un modelo de análisis de sentimientos en Twitter. Para ello, se construyó un conjunto de datos denominado Elecciones Bicentenario 2021 Tweets, conformado por 49,916 tweets históricos publicados en idioma español, cuyas características fueron extraídas usando TF-IDF, BOW y N-Gramas, por el impacto que tienen en el desempeño del análisis de sentimientos. Luego, se aplicaron algoritmos de clasificación como Regresión Logística, Naïve Bayes, Máquinas de Vectores de Soporte, y Árboles de Decisión al modelo propuesto, los cuales fueron evaluados de manera cuantitativa, en términos de exactitud, precisión, exhaustividad y valor-F1. Los resultados electorales y los obtenidos por el modelo coinciden con el sentimiento expresado en las redes sociales en la mayoría de los casos, observándose que Regresión Logística tiene mejor desempeño, alcanzado un 79% de exactitud y precisión, 73% de exhaustividad y 76% de valor-F1. En conclusión, el algoritmo más asertivo para la predicción de intención de voto fue Regresión Logística, seguido por Máquinas de Vectores de Soporte, Naïve Bayes y Árboles de Decisión.