Show simple item record

dc.contributor.advisorApaza Cruz, Jorge Luis
dc.contributor.authorFernandez Chambi, Mayenka
dc.date.accessioned2020-02-20T18:16:53Z
dc.date.available2020-02-20T18:16:53Z
dc.date.issued2019-12-06
dc.identifier.urihttp://repositorio.unap.edu.pe/handle/20.500.14082/13506
dc.description.abstractLa presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre del 2017 según calendario clasificatorio Rusia 2018 de la FIFA. El modelo del análisis de opinión o sentimiento ha sido desarrollado en la plataforma de computación distribuida Spark; demostrándose que las tareas de preparación de datos, modelado y evaluación de algoritmos de aprendizaje de máquina para clasificación de texto se han desarrollado con eficiencia dentro del pipeline de Spark entre tareas transformadoras y estimadoras sobre la estructura de datos DataFrame y la librería MLlib, así los modelos estándar de aprendizaje de máquina para Big Data pueden ser realizadas en forma escalable y distribuida con facilidad de uso por los científicos de datos. Finalmente el modelo de clasificación binario de texto de tuits ha alcanzado una precisión de 83.51% para un modelo de regresión logística y está sobre las métricas estándar de aceptación de clasificadores de su mismo tipo; adicionalmente, esta investigación deja construido y disponible el dataset “PeruARusia2018.csv” con 3000 ítems de tuits etiquetados siguiendo los estándares adecuados que la hacen propicia para que la comunidad investigadora pueda seguir experimentando sobre ella y halle mejores resultados; así como 376,250 tuits como raw data.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.language.isospaes_PE
dc.publisherUniversidad Nacional del Altiplanoes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/deed.eses_PE
dc.sourceUniversidad Nacional del Altiplanoes_PE
dc.sourceRepositorio Institucional - UNAPes_PE
dc.subjectIngeniería de Softwarees_PE
dc.subjectMinería de textoses_PE
dc.titleAnálisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Sparkes_PE
dc.typeinfo:eu-repo/semantics/masterThesises_PE
thesis.degree.nameMagister Scientiae en Informática con mención en Ingeniería de Softwarees_PE
thesis.degree.disciplineInformáticaes_PE
thesis.degree.grantorUniversidad Nacional del Altiplano. Escuela de Posgradoes_PE
thesis.degree.levelMaestríaes_PE


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess