Abstract:
Este informe de tesis se realizó con el objetivo de determinar el incremento del número de respuestas válidas en la búsqueda de textos por índice de contenido digitalizado, usando el algoritmo de reconocimiento de patrones en imágenes digitales, pero los índices de los libros se encontraban en imágenes digitalizados, para ello se desarrolló un algoritmo basado en Reconocimiento de Patrones en imágenes digitales utilizando el algoritmo de Reconocimiento Óptico de Caracteres OCR, para extraer los textos de las imágenes digitales que son los índices de los libros, entonces se encontró como objetivo específico de extraer el texto de las imágenes digitales que son los índices de los libros de la biblioteca central de la Universidad Nacional del Altiplano con la finalidad de guardar los textos extraídos en formato digital en la base de datos de la biblioteca y compararlos con los temas buscados por el usuario así mostrarle a los usuarios que libros son más recomendados para su préstamo en el portal “Sistema Integral de Control, Gestión y Administración de Textos Bibliográficos-SICGA” el algoritmo de reconocimiento óptico de caracteres OCR nos facilitó en el proceso de extracción del texto de las imágenes que son los índices de los libros y así incremento el número de respuestas validas en la búsqueda de texto por índice de contenidos digitalizados. Además, se llegaron a comprobar los siguientes objetivos; se afirmó que el incremento promedio porcentual del número de respuesta válidas en la búsqueda de textos por índice de contenidos digitalizados, aplicando el algoritmo de reconocimiento de patrones en imágenes digitales es superior a cero; llegando a un incremento máximo de 70.0% y un promedio de 25,5688% de respuestas válidas a temas buscados. tambien se llegó a comprobar que el porcentaje promedio de las palabras extraídas es superior al 98.8%, por lo tanto se afirmó que la extracción del total de caracteres de una imagen se extrajo un equivalente al 100% de los caracteres existentes en una imagen, las bondades a los que se llegó fue que la extracción de textos de los indicies digitales sólo se elabora por una única vez y se guardan en la base de datos estos textos extraídos, para evitar consumir recursos en el servidor, y así la rapidez en la búsqueda de un material bibliográfico se hace más eficiente.