← Volver

IA GENERATIVA

Gestión de documentación
con IA Generativa

Nuestro cliente tenía una base de datos de documentación jurídica muy amplia, con documentos en formato PDF, PowerPoint o vídeo, que requiere actualizar constantemente para adecuarlo a las nuevas leyes que se van publicando, o a los cambios sobre las leyes existentes.

El proceso de actualización requiere una carga manual importante, en primer lugar para detectar los cambios en las leyes, y posteriormente para identificar, dentro de toda la base documental, aquel contenido que es necesario modificar y su actualización consiguiente, por lo que se plantea la posibilidad de automatizar este proceso de actualización en la mayor medida posible utilizando IA Generativa.

EL RETO

Hay tres retos principales que es necesario cubrir para abordar el caso de uso:

  • Detectar los cambios o las nuevas leyes, que inicialmente se publican en el BOE en documentos que tienen una gran cantidad de contenido en formato texto.
  • Identificar, dentro de la base de datos documental, aquellas partes de los documentos, o incluso de los vídeos, en los que se hace referencia a alguna ley a modificar, no pudiendo hacerse una búsqueda por indexación, ya que en los textos se referencia a las leyes de múltiples formas, o de forma ambigua.
  • Proponer las modificaciones a realizar sobre los fragmentos de texto identificados, manteniendo la coherencia y sin perder el hilo argumental que sigue.

PUNTOS CLAVE

El punto esencial del proyecto, como de cualquier caso de uso de IA Generativa, es hacer una primera PoC que permita evaluar si el estado del arte es suficiente para tener un resultado satisfactorio, así como poder analizar los riesgos que podría conllevar su uso en entornos productivos.

SOLUCIÓN

La solución desarrollada por Shaper se basa en el uso de IA Generativa, aunque requiere dos modelos o aproximaciones para poder cubrir todas las necesidades planteadas:

    • Para la detección de cambios, se ha implementado un demonio que recoge diariamente el BOE de fuentes oficiales, lo valida, almacena, y mediante un modelo de IA Generativa y el desarrollo de unos prompts, permite extraer de forma estructurado las leyes o normas actualizados o elaborados, así como su contenido.
    • Para la gestión de la base de datos documental se ha usado una solución basada en embeddings, utilizando Qdrant como base de datos que almacena la información vectorizada de todos los documentos y transcripciones de los documentos actuales. De esta manera, tras identificar los cambios en el BOE, se realiza una búsqueda vectorial dentro de la base de datos, y con los resultados se utiliza un modelo de terceros, de OpenAI, para generar el texto alternativo.

RESULTADOS

La solución es capaz de detectar de forma fiable los cambios publicados en el BOE de forma diaria y automatizada, así como detectar aquellos contenidos que es necesario actualizar.
Para minimizar los riesgos, la primera versión requiere una validación manual de un experto en Derecho de los cambios que propone la solución hasta poder validar que no hay un riesgo por contenidos mal generados.
El impacto en la eficiencia de esta tarea ha sido de órdenes de magnitud en cuanto al esfuerzo requerido para todo el proceso de detección y actualización, cifrándose la reducción de esfuerzo en torno a 2 FTEs.

La herramienta es la TECNOLOGÍA.

Nuestra vocación: las PERSONAS y el NEGOCIO.

El ingrediente más importante lo pones tú.

Queremos escucharte.

Cuéntanos que necesitas y dinos como contactar contigo.
O si lo prefieres puedes escribirnos directamente a