DSpace Repository

Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark

Show simple item record

dc.contributor.advisor Apaza Cruz, Jorge Luis
dc.contributor.author Fernandez Chambi, Mayenka
dc.date.accessioned 2020-02-20T18:16:53Z
dc.date.available 2020-02-20T18:16:53Z
dc.date.issued 2019-12-06
dc.identifier.uri http://repositorio.unap.edu.pe/handle/20.500.14082/13506
dc.description.abstract La presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre del 2017 según calendario clasificatorio Rusia 2018 de la FIFA. El modelo del análisis de opinión o sentimiento ha sido desarrollado en la plataforma de computación distribuida Spark; demostrándose que las tareas de preparación de datos, modelado y evaluación de algoritmos de aprendizaje de máquina para clasificación de texto se han desarrollado con eficiencia dentro del pipeline de Spark entre tareas transformadoras y estimadoras sobre la estructura de datos DataFrame y la librería MLlib, así los modelos estándar de aprendizaje de máquina para Big Data pueden ser realizadas en forma escalable y distribuida con facilidad de uso por los científicos de datos. Finalmente el modelo de clasificación binario de texto de tuits ha alcanzado una precisión de 83.51% para un modelo de regresión logística y está sobre las métricas estándar de aceptación de clasificadores de su mismo tipo; adicionalmente, esta investigación deja construido y disponible el dataset “PeruARusia2018.csv” con 3000 ítems de tuits etiquetados siguiendo los estándares adecuados que la hacen propicia para que la comunidad investigadora pueda seguir experimentando sobre ella y halle mejores resultados; así como 376,250 tuits como raw data. es_PE
dc.description.uri Tesis es_PE
dc.format application/pdf es_PE
dc.language.iso spa es_PE
dc.publisher Universidad Nacional del Altiplano es_PE
dc.rights info:eu-repo/semantics/openAccess es_PE
dc.rights.uri https://creativecommons.org/licenses/by/4.0/deed.es es_PE
dc.source Universidad Nacional del Altiplano es_PE
dc.source Repositorio Institucional - UNAP es_PE
dc.subject Ingeniería de Software es_PE
dc.subject Minería de textos es_PE
dc.title Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark es_PE
dc.type info:eu-repo/semantics/masterThesis es_PE
thesis.degree.name Magister Scientiae en Informática con mención en Ingeniería de Software es_PE
thesis.degree.discipline Informática es_PE
thesis.degree.grantor Universidad Nacional del Altiplano. Escuela de Posgrado es_PE
thesis.degree.level Maestría es_PE


Files in this item

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess

Search DSpace


Browse

My Account

Statistics