Herramienta de Interpretación de documentos
Es la forma en la que en Numera hemos empezado a recopilar datos sobre el comportamiento de los documentos, especialmente factura de compra y documento equivalente a factura, para lograr leer los documentos sin intervención humana.
- ¿Para qué sirve?
Su meta es interpretar los campos que hacen parte de un documento radicado en la VURV y que Intellectio pretende leer. Cuando decimos interpretar estamos tratando de exponer que con la herramienta esperamos encontrar guias y coincidencias que nos permitan usar el raw text que entrega Textract y que son solo datos para convertirlo en información.
- ¿Cómo lo hace?
Cuando un usuario culmina el proceso de radicar, visualiza el raw text, que contiene los datos organizados del documento extraída por Textract. Intellectio pretende leer qué datos contiene el documento y la convierte en información al categorizarla en los campos:datos del proveedor, concepto, valor, impuestos y centros de costos.
Con la Herramienta de Interpretación de documentos esperamos construir un algoritmo que sea capaz de leer facturas en Colombia. Para que esto pase estamos llenando con torque mecánico la Interpretación máquina y la Interpretación humano
- Interpretación máquina
Contiene lo que la Intellectio pudo extraer y categorizar de la información del documento sin ningún cambio respecto de los datos del raw text. La interpretación máquina, además, aprende de experiencias en otras facturas interpretadas y mejoras generales a Intellectio para utilizar información pasada que aumente la confiabilidad de los registros contables que se generarán.
Permite que un humano corrija la información generada por la interpretación máquina. El objetivo es darle elementos de aprendizaje a Intellectio para estandarizar la información y llevar a la contabilidad los registros con calidad.
Aprobación de Documentos
Esta tarea se hace posterior a verificar que todos los campos habilitados para registrar la información del documento a radicar, tanto en el campo Interpretación máquina con la información que se visualiza en el raw text del documento cargado y que la Interpretación humano estén debidamente diligenciados y con la información que se visualiza en el documento cargado. Esta verificación incluye revisar que:
- Los campos de la interpretación máquina sean fiel copia de toda la línea copiada del raw text, y no de un extracto de la línea.
- Los datos de la factura que se muestran en el PDF, estén en interpretación Maquina y Humano.
- No deben haber campos vacíos en la interpretación que estén disponibles en la factura.
- Que el tercero o proveedor sea una razón social sólo si el NIT es de una empresa, de lo contrario debería ser el nombre de una persona
- Que el campo fecha tenga en interpretación humano el formato Día, Mes, Año.
- En el campo NIT si es empresa venga con 9 dígitos (no incluye Dígito de Verificación).
- Si la factura viene con diferentes conceptos en diferentes líneas, debe ir así mismo en la interpretación cada uno de los conceptos.(excepto facturas de restaurante o cafetería que tengan muchos conceptos que culminen como "cafetería y restaurante")
- Verificar como esta el Iva en la factura: Si el iva viene en la línea de cada concepto, este impuesto debe ir dentro de cada concepto, pero si el iva viene discriminado al final de la factura, este se coloca al final de la interpretación fuera del concepto.
Datos curiosos de Intellectio
vista de la pantalla a el 10 de febrero de 2020 }
Otros links