Herramienta de Interpretación de documentos

From Numera Wiki
Jump to navigation Jump to search

Es la forma en la que en Numera hemos empezado a recopilar datos sobre el comportamiento de los documentos, especialmente factura de compra y documento equivalente a factura, para lograr leer los documentos sin intervención humana.


  • ¿Para qué sirve?

Su meta es interpretar los campos que hacen parte de un documento radicado en la VURV y que Intellectio pretende leer. Cuando decimos interpretar estamos tratando de exponer que con la herramienta esperamos encontrar guias y coincidencias que nos permitan usar el raw text que entrega Textract y que son solo datos para convertirlo en información.

  • ¿Cómo lo hace?

Cuando un usuario culmina el proceso de radicar, visualiza el raw text, que contiene los datos organizados del documento extraída por Textract. Intellectio pretende leer qué datos contiene el documento y la convierte en información al categorizarla en los campos:datos del proveedor, concepto, valor, impuestos y centros de costos.

Con la Herramienta de Interpretación de documentos esperamos construir un algoritmo que sea capaz de leer facturas en Colombia. Para que esto pase estamos llenando con torque mecánico la Interpretación máquina y la Interpretación humano

  • Interpretación máquina

Contiene lo que la Intellectio pudo extraer y categorizar de la información del documento sin ningún cambio respecto de los datos del raw text. La interpretación máquina, además, aprende de experiencias en otras facturas interpretadas y mejoras generales a Intellectio para utilizar información pasada que aumente la confiabilidad de los registros contables que se generarán.


Permite que un humano corrija la información generada por la interpretación máquina. El objetivo es darle elementos de aprendizaje a Intellectio para estandarizar la información y llevar a la contabilidad los registros con calidad.

Aprobación de Documentos:

Esta tarea se hace posterior a verificar que todos los campos habilitados para registrar la información del documento a radicar, tanto en el campo Interpretación máquina con la información que se visualiza en el raw text del documento cargado y que la Interpretación humano estén debidamente diligenciados y con la información que se visualiza en el documento cargado.



vista de la pantalla a el 10 de febrero de 2020 Herramientainterpretacion.png