Tecnología OCR aplicada en temas de seguridad

MIT. Carlos Saldaña Lara

Hoy en día vivimos en un entorno computarizado, por eso, es de vital importancia que los humanos y los dispositivos puedan entenderse unos a otros, con el fin de poder intercambiar información. Los dispositivos tienen su propia manera de hablar, en nuestro caso la comunicación con ellos es un tanto simple, haciendo uso de teclado, mouse o el simple toque de un dedo es como podemos indicarles lo que queremos que hagan. Pero, cuando se trata de procesar información de una manera un tanto más humana, como un libro impreso a la antigua o una carta escrita con una pluma, los dispositivos tienen que trabajar mucho más para lograr interpretar dicha información.

Aquí es donde entra el reconocimiento óptico de caracteres, el cual, es un tipo de tecnología que puede analizar automáticamente el texto impreso y convertirlo a una forma que una computadora puede procesar más fácilmente. OCR está en el corazón de mucha de la tecnología actual, desde programas de análisis de escritura a mano en teléfonos celulares, hasta las gigantescas máquinas de clasificación de correo que aseguran que todos esos millones de cartas lleguen a sus destinos. Pero ¿cómo funciona exactamente? ¡Echemos un vistazo más de cerca!

¿Qué es OCR?

Mientras lees estas palabras en la pantalla de tu dispositivo, ¡Tus ojos y tu cerebro están llevando a cabo el reconocimiento óptico de caracteres sin que te des cuenta! Tus ojos están reconociendo los patrones de luz y oscuridad que conforman los caracteres (letras, números y cosas como los signos de puntuación) impresos en la pantalla y tu cerebro los está utilizando para descubrir lo que estoy tratando de decir (a veces leyendo caracteres individuales, pero principalmente mediante el escaneo de palabras enteras y grupos enteros de palabras a la vez).

Los dispositivos también pueden hacer esto, pero es un trabajo muy difícil para ellos. El primer problema es que un dispositivo no tiene ojos, por lo que, si deseas que lea algo como la página de un libro antiguo, debes presentarle una imagen de esa página, generada con un escáner o una cámara digital. La página que se crea de esta manera es un archivo gráfico (a menudo en formato JPG) y, en lo que concierne a un dispositivo, no hay diferencia entre ella y una fotografía del presidente o cualquier otro gráfico: es solo un patrón de píxeles (los puntos o cuadrados de colores que conforman cualquier imagen gráfica de computadora). En otras palabras, el dispositivo tiene una imagen de la página en lugar del texto en sí; no puede leer las palabras en la página como nosotros podemos. OCR es el proceso de convertir una imagen de texto, en texto, es decir, producir algo así como un archivo TXT o DOC desde un archivo JPG escaneado de una página impresa.

ocr1blog

¿OCR en Seguridad?

Se preguntarán de qué manera es posible hacer uso de esta tecnología en temas de seguridad, bueno, aprovechando el potencial de esta herramienta es posible adaptarla para poder extraer todo tipo de texto como, por ejemplo, documentos oficiales, comprobantes de domicilio y estados de cuenta y poder aplicar un sinfín de validaciones que permitan realizar un análisis individual o en conjunto con otras tecnologías, para poder determinar si un documento es apócrifo.

ocrblog2

Conclusión

El potencial de esta tecnología es en términos generales muy amplio, el saber aplicarla o combinarla con soluciones existentes en temas de seguridad es un reto para el mundo del desarrollo, que está en constante evolución para lograr ponerle freno, en lo posible, a los ciberataques o fraudes existentes en todo tipo de sector en esta era digital.

En Latin ID conocemos el potencial de esta tecnología y podemos brindarte una solución para integrarla y ayudarte a estar preparado para los constantes cambios tecnológicos que pueden afectar la seguridad e integridad de tu negocio.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *