Abstract:
La Prueba de Turing pública completamente automatizada para distinguir computadoras de humanos CAPTCHA (en inglés: Completely Automated Public Turing Test to Tell Computers and Human Apart) es una prueba que garantiza que los usuarios son personas y no computadoras. Han sido diseñadas para que las personas las puedan resolver fácilmente, pero que son difíciles para las computadoras, se utiliza para evitar que los programas informáticos con procedimientos reiterativos (bots) intenten acceder de manera no autorizada. Aunque existen varios tipos de captchas basados en texto, audio, imágenes, videos y acertijos. Muchos sitios web, incluido los servicios gubernamentales, todavía utilizan captchas basados en texto. El propósito principal de esta investigación fue desarrollar un modelo para reconocer captchas de texto de la librería GregwarCaptcha comparando dos modelos, el primero con reconocimiento óptico de imágenes y el segundo con redes neuronales convolucionales. Se obtuvo una base de datos de 1017 imágenes de captchas; seguidamente, se realizaron el preprocesamiento de datos, clasificación y entrenamiento de los dos modelos. Asimismo, se evaluó y se comparó la utilidad de los algoritmos mediante la matriz de confusión y el método F1-score, desarrollado en Python. El enfoque de investigación es cuantitativo, de nivel proyectiva. Los resultados mostraron que las redes neuronales convolucionales obtuvieron una exactitud del 97% superando significativamente al 37% del método OCR. En conclusión, esta investigación demostró la eficacia de las redes neuronales convolucionales para reconocer captchas de texto, que pueden mejorar la seguridad de los sistemas de información en un futuro.