Difference between revisions of "Solución tecnológica"

From Numera Wiki
Jump to navigation Jump to search
Line 12: Line 12:
  
 
==[[Lectura de documento]]s==
 
==[[Lectura de documento]]s==
Este modulo se alimenta del [[radicado]] del [documento] por el [[usuario]] y lo envia a través de un sistema de [[colas]] a un sistema de inteligencia artificial [[OCR]]. Estamos usando el de [[AWS]] que se llama [[Textract]]. El objetivo es poder leer la factura sin intervención humana.
+
Este modulo se alimenta del [[radicado]] del [[documento]] por el [[usuario]] y lo envia a través de un sistema de [[colas]] a un sistema de inteligencia artificial [[OCR]]. Estamos usando el de [[AWS]] que se llama [[Textract]]. El objetivo es poder leer la factura sin intervención humana.
  
 
El resultado del proceso en [[Textract]] es un archivo en formato [[JSON]] que devuelve: [[Tipo de texto]], [[largo]], [[ubicación en coordenadas]], el texto en sí. A partir de esta información hemos creado un [[algoritmo]] que separa los textos y los pinta por línea en la [[herramienta de Interpretación de documentos]].
 
El resultado del proceso en [[Textract]] es un archivo en formato [[JSON]] que devuelve: [[Tipo de texto]], [[largo]], [[ubicación en coordenadas]], el texto en sí. A partir de esta información hemos creado un [[algoritmo]] que separa los textos y los pinta por línea en la [[herramienta de Interpretación de documentos]].

Revision as of 21:46, 12 April 2020

La solución tecnológica de Numera ha sido diseñada bajo un arquitectura y sigue la siguiente forma:

Radicar

Este modulo se encarga de recibir del usuario la factura o documento desde un archivo PDF o de imagen, almacenarla en S3 y entregar un radicado. Este modulo lo hemos bautizado como Ventanilla Única de Radicación Virtual o VURV. El flujo de trabajo en este módulo esta ligado al tipo de rol y proceso que se esta haciendo. Los flujos son los siguientes:

  • Recepcionista: Este rol es el principal encargado de recibir y radicar en Numera a través de la VURV los documentos recibidos. El flujo que sigue es
    • Log in.
    • Dashboard: Entra directamente a un home que le permite ir a radicar, ver un listado de estadísticas, tareas, o un buscar un filtro en la lista de documentos.
    • Radicar: Es la pantalla por la cual radica, si es que está en alguna parte del sistema y decide ir a hacer el radicado de un nuevo documento. Entra directamente debe estar de fácil acceso en la pantalla.
    • Documentos Es la pantalla en la que gestiona el radicado de sus documentos. A esta pantalla llega cada vez que hace un radicado, o si hace un filtro en el dashboard.


Lectura de documentos

Este modulo se alimenta del radicado del documento por el usuario y lo envia a través de un sistema de colas a un sistema de inteligencia artificial OCR. Estamos usando el de AWS que se llama Textract. El objetivo es poder leer la factura sin intervención humana.

El resultado del proceso en Textract es un archivo en formato JSON que devuelve: Tipo de texto, largo, ubicación en coordenadas, el texto en sí. A partir de esta información hemos creado un algoritmo que separa los textos y los pinta por línea en la herramienta de Interpretación de documentos.

Para realizar la lectura del documento hemos realizado una interpretación con Torque Mecánico en la que hemos mapeado la información desde el JSON a como la necesitamos para reconocerla contablemente. A partir de esa interpretación hemos guardado un Esquema de factura para cada tercero. Este guarda la ubicación de los ítems del Textract para el tercero sin los textos. Esto tiene como objetivo que el próximo documento recibido de este tercero por un usuario de Numera sea interpretado a partir del esquema y que se pinte en la herramienta de Interpretación de documentos

El flujo de trabajo es el siguiente por rol: