dc.contributor.advisor |
Apaza Cruz, Jorge Luis |
|
dc.contributor.author |
Fernandez Chambi, Mayenka |
|
dc.date.accessioned |
2020-02-20T18:16:53Z |
|
dc.date.available |
2020-02-20T18:16:53Z |
|
dc.date.issued |
2019-12-06 |
|
dc.identifier.uri |
http://repositorio.unap.edu.pe/handle/20.500.14082/13506 |
|
dc.description.abstract |
La presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre del 2017 según calendario clasificatorio Rusia 2018 de la FIFA. El modelo del análisis de opinión o sentimiento ha sido desarrollado en la plataforma de computación distribuida Spark; demostrándose que las tareas de preparación de datos, modelado y evaluación de algoritmos de aprendizaje de máquina para clasificación de texto se han desarrollado con eficiencia dentro del pipeline de Spark entre tareas transformadoras y estimadoras sobre la estructura de datos DataFrame y la librería MLlib, así los modelos estándar de aprendizaje de máquina para Big Data pueden ser realizadas en forma escalable y distribuida con facilidad de uso por los científicos de datos. Finalmente el modelo de clasificación binario de texto de tuits ha alcanzado una precisión de 83.51% para un modelo de regresión logística y está sobre las métricas estándar de aceptación de clasificadores de su mismo tipo; adicionalmente, esta investigación deja construido y disponible el dataset “PeruARusia2018.csv” con 3000 ítems de tuits etiquetados siguiendo los estándares adecuados que la hacen propicia para que la comunidad investigadora pueda seguir experimentando sobre ella y halle mejores resultados; así como 376,250 tuits como raw data. |
es_PE |
dc.description.uri |
Tesis |
es_PE |
dc.format |
application/pdf |
es_PE |
dc.language.iso |
spa |
es_PE |
dc.publisher |
Universidad Nacional del Altiplano |
es_PE |
dc.rights |
info:eu-repo/semantics/openAccess |
es_PE |
dc.rights.uri |
https://creativecommons.org/licenses/by/4.0/deed.es |
es_PE |
dc.source |
Universidad Nacional del Altiplano |
es_PE |
dc.source |
Repositorio Institucional - UNAP |
es_PE |
dc.subject |
Ingeniería de Software |
es_PE |
dc.subject |
Minería de textos |
es_PE |
dc.title |
Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark |
es_PE |
dc.type |
info:eu-repo/semantics/masterThesis |
es_PE |
thesis.degree.name |
Magister Scientiae en Informática con mención en Ingeniería de Software |
es_PE |
thesis.degree.discipline |
Informática |
es_PE |
thesis.degree.grantor |
Universidad Nacional del Altiplano. Escuela de Posgrado |
es_PE |
thesis.degree.level |
Maestría |
es_PE |