Desarrollo de Apps 28 julio, 2020

La posibilidad de incorporar nuevas tecnologías en los teléfonos inteligentes es cada vez mayor, es por este motivo que desde Doonamis queremos comentar en este nuevo artículo la utilidad de incorporar la tecnología del reconocimiento de caracteres sobre imagen (OCR) en una app y un caso de éxito como lo es el de Naturgy.  

¿Qué es el OCR? 

La sigas OCR hacen referencia al concepto Optical Character Recognition o en español Reconocimiento Óptico de Caracteres y hace referencia a la tecnología utilizada con la digitalización de documentos haciendo que estos sean más útiles y efectivos. 

El reconocimiento óptico de caracteres es un proceso de digitalización de textos a partir de imágenes, símbolos o caracteres que pertenecen a un mismo alfabeto. A través de esta digitalización se puede identificar y almacenar datos conocidos. 

¿Para qué se utiliza el OCR? 

La tecnología OCR puede tener diferentes aplicaciones entre las cuales destacan: 

  • Los textos que se obtienen a través del reconocimiento se almacenan en la bases de datos para poder analizarlos posteriormente. 
  • EL OCR permite a los usuarios editar los textos una vez hayan sido escaneados y reconocidos
  • También se utiliza para, a través de la digitalización de grandes textos, obtener una traducción instantánea mediante otras herramientas. 
  • Se puede utilizar el reconocimiento para motorizar la obtención de información de documentos ya estructurados como por ejemplo una factura. 

Fases del OCR

A través de la tecnología OCR se resuelve el paso fundamental del proceso de reconocimiento óptico de caracteres. 

El proceso de transformación de la imagen se divide en 4 fases:

  1. Transformación a blanco y negro: En esta primera fase el sistema interpreta y transforma todos los píxeles de la imagen a blanco y negro. Mediante esta transformación lo que se pretende es que los números y letras queden nítidas frente al fondo. En esta primera fase, el software ya puede diferenciar lo que es texto y lo que no 
  2. Fragmentación de la imagen: Esta fase es la más complicada ya que, consiste en dividir los textos en diferentes trozos haciendo que correspondan a palabras y letras. 
  3. Arreglo de los caracteres: Una vez la imagen está dividida y todos los elementos aislados, se perfila los contornos de cada símbolo para extraer las formas lo más perfectas y sencillas posibles. 
  4. Comparación con las letras: Una vez toda la imagen está nítida, limpia de cualquier otro elemento, y con todos los caracteres separados y nítidos llega el momento de comparar cada símbolo extraído con los abecedarios. Esta cuarta y última frase consiste en un proceso interactivo en el que cada carácter se compara con todos los posibles hasta que encuentra la máxima coincidencia.  

Usos del OCR en una app 

Implementar este tipo de tecnología en el desarrollo de una app permite que cualquier dispositivo inteligente pueda leer cualquier código alfanumérico, sin tener en cuenta el tamaño, la fuente o el color del texto gracias del OCR. 

Entre los usos más típicos encontramos la verificación de precios en establecimientos, las revisiones de pasaportes o identificación, números bancarios o de automoción. 

El reconocimiento OCR en la App de Naturgy 

Desde Doomanis, queremos destacar el caso de éxito de Naturgy con la aplicación YoLeoGas, una aplicación realizada para obtener información del contador del gas a través de la cámara del móvil. De esta manera, utilizando la cámara, la tecnología OCR con unos algoritmos a medida de reconocimiento óptico de texto, permiten a través de esta aplicación de Naturgy poder leer el valor del contador del gas y enviar los datos directamente a la compañía. 

¿Interesado en nuestros servicios?
¡Pídenos un presupuesto!

Pedir presupuesto