Difference between revisions of "Solución tecnológica"

Revision as of 20:53, 10 February 2020

La solución tecnológica de Numera ha sido diseñada de la siguiente forma:

Módulo de Radicar

Este modulo se encarga de recibir del usuario la factura o documento desde un archivo PDF o de imagen, almacenarla en S3 y entregar un radicado

Lectura de documentos

Este modulo se encarga de tomar el radicado por el usuario y enviarlo a través de colas a un sistema de inteligencia artificial OCR. Estamos usando el de AWS que se llama Textract. El objetivo es poder leer la factura sin intervención humana.

El resultado del proceso en Textract es un archivo en formato JSON que devuelve: Tipo de texto, largo, ubicación en coordenadas, el texto en sí. A partir de esta información hemos creado un algoritmo que separa los textos y los pinta por línea en la herramienta de Interpretación de documentos.

Para realizar la lectura del documento hemos realizado una interpretación con torque mecánicos en la que hemos mapeado la información desde el JSON a como la necesitamos para reconocerla contablemente. A partir de esa interpretación hemos guardado un Esquema de factura para cada tercero. Este guarda la ubicación de los ítems del Textract para el tercero sin los textos. Esto tiene como objetivo que el próximo documento recibido de este tercero por un usuario de Numera sea interpretado a partir del esquema y que se pinte en la herramienta de Interpretación de documentos

Revision as of 20:51, 10 February 2020 (view source) Jgarciaiguaran (talk \| contribs) (→‎Lectura de documentos) ← Older edit		Revision as of 20:53, 10 February 2020 (view source) Jgarciaiguaran (talk \| contribs) Newer edit →
Line 9:		Line 9:
	El resultado del proceso en [[Textract]] es un archivo en formato [[JSON]] que devuelve: [[Tipo de texto]], [[largo]], [[ubicación en coordenadas]], el texto en sí. A partir de esta información hemos creado un [[algoritmo]] que separa los textos y los pinta por línea en la [[herramienta de Interpretación de documentos]].		El resultado del proceso en [[Textract]] es un archivo en formato [[JSON]] que devuelve: [[Tipo de texto]], [[largo]], [[ubicación en coordenadas]], el texto en sí. A partir de esta información hemos creado un [[algoritmo]] que separa los textos y los pinta por línea en la [[herramienta de Interpretación de documentos]].

−	Para realizar la lectura del documento hemos realizado una interpretación con [[torque mecánicos]] en la que hemos mapeado la información ~~como viene en~~ el [[~~Textrac~~]] y como la necesitamos para reconocerla contablemente. A partir de esa interpretación hemos guardado un [[Esquema de factura]] para cada [[tercero]]. Este guarda la ubicación de los ítems del [[Textract]] para el tercero sin los textos. Esto tiene como objetivo que la próximo documento recibido de este [[tercero]] por un [[usuario]] de [[Numera]] sea interpretado a partir del esquema y que se pinte en la [[herramienta de Interpretación de documentos]]	+	Para realizar la lectura del documento hemos realizado una interpretación con [[torque mecánicos]] en la que hemos mapeado la información desde el [[JSON]] a como la necesitamos para reconocerla contablemente. A partir de esa interpretación hemos guardado un [[Esquema de factura]] para cada [[tercero]]. Este guarda la ubicación de los ítems del [[Textract]] para el tercero sin los textos. Esto tiene como objetivo que el próximo documento recibido de este [[tercero]] por un [[usuario]] de [[Numera]] sea interpretado a partir del [[esquema]] y que se pinte en la [[herramienta de Interpretación de documentos]]

Difference between revisions of "Solución tecnológica"

Revision as of 20:53, 10 February 2020

Módulo de Radicar

Lectura de documentos

Navigation menu

Personal tools

Namespaces

Variants

Views

More

Search

Navigation

Tools