Ir al contenido
Volver al Blog
Guía

Detección multi-intent: cómo una transcripción única con cuatro vistas de proceso distintas se convierte en cuatro diagramas coherentes

Una transcripción típica de entrevista con partes interesadas no describe un proceso; describe cuatro simultáneamente: el estado actual, un estado futuro propuesto, pain points, y elementos wishlist: todos entrelazados. Sin detección multi-intent, acaban fusionados en un diagrama incoherente. El clasificador es lo que los mantiene separados.

7 min de lectura

Por qué una sola transcripción describe cuatro procesos, no uno

La detección multi-intent es lo que le ahorra aproximadamente dos horas por misión al consultor que entrevista a una pyme. Cualquier informe de partes interesadas contiene el estado actual, los pain points, la wishlist y el estado futuro propuesto todo revuelto, ordenarlos a mano es donde se va el tiempo. El clasificador hace el orden en una sola pasada.

Una transcripción típica de entrevista con partes interesadas para un engagement de mapeo de procesos no describe un solo proceso. Describe cuatro, entrelazados a través de la conversación de formas que son obvias para lectores humanos pero invisibles al parseo ingenuo. Las cuatro perspectivas son: el proceso as-is (cómo funcionan las cosas realmente hoy), el proceso to-be (cómo deberían funcionar o están siendo rediseñadas para funcionar), pain points (problemas específicos con el as-is que motivaron la conversación), y elementos wishlist (ideas que la parte interesada querría ver, no necesariamente ligadas a un rediseño de proceso específico).

Una frase de muestra de una entrevista real: « Entonces hoy la factura llega, finanzas la abre manualmente, la verifica contra el PO: lo que lleva una eternidad, y realmente necesitamos llegar a un lugar donde la IA la lea automáticamente, pero honestamente creo que también deberíamos simplemente eliminar la verificación PO por completo ». Esa única frase contiene as-is (« finanzas la abre manualmente, verifica contra PO »), un pain point (« lo que lleva una eternidad »), un to-be (« la IA la lee automáticamente »), y un elemento wishlist (« eliminar la verificación PO »). Un clasificador que trate todo esto como un solo proceso produce un diagrama estructuralmente incoherente: tareas que se contradicen, puertas que no tienen sentido, menciones de pain points sentadas en el flujo de secuencia como si fueran pasos.

Los cuatro tipos de intent canónicos

El clasificador multi-intent usa cuatro tipos de intent, elegidos porque son el conjunto mínimo que captura las perspectivas que realmente aparecen en documentos reales sin solaparse lo suficiente para hacer la clasificación ambigua.

  • as_is: el proceso actual tal como opera hoy. Palabras señal: « actualmente », « hoy », « hacemos », « la forma en que funciona », « ahora mismo ». Este es el intent que el diagrama debería reflejar a menos que el usuario explícitamente opte por mapear uno distinto.
  • to_be: un estado futuro target o propuesto. Palabras señal: « queremos », « debería ser », « en el futuro », « el objetivo es », « estamos rediseñando ». Este intent merece su propio diagrama junto al as-is en lugar de fusionarse en él.
  • pain_point: problemas específicos con el as-is que impulsan el deseo de cambio. Palabras señal: « el problema es », « odiamos », « es frustrante », « siempre se rompe », « lleva demasiado tiempo ». Se mantienen fuera del flujo de secuencia y se almacenan como hints de optimización en la sesión para referencia posterior (o, si eliges « Todos los procesos detectados » en el paso de desambiguación, se convierten en su propio diagrama independiente).
  • wishlist: funcionalidades o cambios aspiracionales que la parte interesada querría ver, no necesariamente ligados a un rediseño específico. Palabras señal: « sería bueno si », « deseo », « eventualmente », « sueño con ». Mismo manejo que pain_point: almacenados como hints de optimización en la sesión, no inyectados en el flujo de secuencia del diagrama seleccionado.

El umbral de confianza de 0,7 y cuándo se dispara la desambiguación

El clasificador asigna a cada intent detectado una puntuación de confianza entre 0 y 1. Cuando más de un intent tiene confianza por encima de 0,7, el flujo saca esto al usuario vía una pregunta de clarificación en lugar de silenciosamente elegir uno. El umbral de 0,7 está elegido empíricamente: por debajo, los diálogos de desambiguación aparecen demasiado frecuentemente en documentos que son genuinamente mono-intent; por encima, los documentos multi-intent reales se colapsan silenciosamente. El umbral exacto de 0,7 es estable y no ha cambiado desde que la funcionalidad fue lanzada.

Cuando se dispara la desambiguación, el usuario ve una pregunta cuyas opciones se construyen a partir de la etiqueta de proceso y el resumen de los intents detectados, no hay un menú fijo de tres opciones. Si el modelo detecta un estado actual y un estado objetivo, las opciones se leen algo como « Procesamiento de facturas (as-is) » y « Procesamiento de facturas (to-be) » más una opción « Todos los procesos detectados » que genera cada intent como su propio diagrama. El usuario elige uno o varios; los diagramas se generan después secuencialmente, no se renderizan en un solo canvas lado a lado.

Por qué la separación importa más de lo que la mayoría de usuarios se da cuenta

El modelo mental común de la detección multi-intent es « oh, desambigua entre procesos actuales y futuros ». Ese encuadre subestima lo que la funcionalidad hace. El mayor valor es prevenir la corrupción que ocurre cuando los pain points y los elementos wishlist acaban en el diagrama como si fueran pasos del proceso. Un diagrama que tiene « el cliente está frustrado por la larga espera » como tarea en el swimlane del Cliente es peor que no tener diagrama: parece autoritativo pero no representa nada que realmente sucede.

La separación también habilita análisis aguas abajo que de otro modo serían imposibles. El diagrama as-is se convierte en la línea base para el análisis de coste y heatmap hoy. Un diagrama to-be se convierte en un objetivo de comparación natural. Los pain points y los elementos wishlist se capturan como hints de optimización separados en la sesión, disponibles como contexto para trabajo posterior. Un bucle de feedback más profundo, donde los pain points priorizan automáticamente las recomendaciones ESSII y los elementos wishlist informan el diseño to-be: está descrito en el plan de transformación v2 y está diseñado pero aún no implementado. Incluso sin esa integración, mantener los cuatro intents separados es lo que permite que cada vista aguas abajo permanezca interpretable; los intents fusionados producen un artefacto único que no puede servir a ninguno de los roles bien.

El multi-intent es un alimentador del diagnóstico para el plan de transformación IA. El diagrama as-is ancla el análisis del estado actual, los pain points van directo a las recomendaciones ESSII, y los elementos wishlist emergen como candidatos para el estado target. Para un consultor que asesora a una pyme, tener las cuatro perspectivas limpiamente separadas es lo que hace que el plan que viene después sea coherente en vez de un revuelto de todo lo que la parte interesada dijo durante la entrevista.

Preguntas frecuentes

¿Puedo sobreescribir la clasificación de intent si no estoy de acuerdo?

Indirectamente. El diálogo de desambiguación es el punto principal de corrección: cuando el clasificador detecta más de un intent por encima del umbral de 0,7, eliges cuál (o cuáles) mapear, así que una atribución errónea se resuelve ahí. No hay UI de reclasificación frase por frase, no puedes mover una frase específica de « to_be » a « as_is » después del hecho. Si el diagrama generado contiene tareas que pertenecen a otro intent (por ejemplo una tarea de estado futuro que acabó en el diagrama de estado actual), la corrección es usar el panel de chat: « quita la tarea X: esto es parte del rediseño to-be, no del proceso actual ». El diagrama se recalcula sin esa tarea. La detección multi-intent es una funcionalidad tier-gated: el clasificador se ejecuta durante el análisis del documento, lo que requiere una suscripción activa.

¿Funciona el clasificador en documentos en idiomas distintos al inglés?

Está soportado para francés y español además de inglés. Esos son los tres locales que la configuración del prompt del sistema cubre efectivamente: el system prompt instruye explícitamente al modelo a responder en el locale seleccionado. El modelo Gemini en sí puede leer documentos fuente en muchos otros idiomas, así que una transcripción en alemán enviada con locale=en se procesará de todos modos, pero la salida del clasificador (labels, pregunta de desambiguación, summaries) se produce en el locale elegido (fr, es o en). Para documentos donde el idioma fuente no es francés, español ni inglés, el diagrama generado sigue siendo siempre revisable y corregible, así que una detección multi-intent perdida aflora como un problema estructural que el analista atrapa durante el refinado.

¿Qué pasa con los pain points y los elementos wishlist: simplemente se descartan?

Se separan, no se descartan. Cuando se selecciona un solo intent (por ejemplo as_is), el clasificador filtra el diagrama para mantener solo los identificadores de pasos relacionados de ese intent: los pain points y elementos wishlist detectados en la transcripción quedan fuera de los nodos de flujo de secuencia. Los intents no seleccionados se preservan como hints de optimización en la sesión: cada hint lleva el tipo de intent, un summary, y la lista de pasos que habrían pertenecido a él. Si en cambio eliges « Todos los procesos detectados » en el paso de desambiguación, los intents pain_point y wishlist se convierten en sus propios diagramas independientes junto al as_is y el to_be. Lo que la UI actual NO hace es superponer esos hints como anotaciones al pasar el ratón sobre el diagrama seleccionado: viven en los datos de sesión para referencia futura, no como overlays visuales sobre el canvas. Alimentar hints en un análisis ESSII futuro es una integración planificada (el pipeline ESSII v2 está diseñado pero aún no implementado).

¿Puede una sola frase pertenecer a varios intents simultáneamente?

Efectivamente sí, pero el mecanismo no es una puntuación de confianza frase por frase. El clasificador corre sobre el documento entero y produce un intent detectado por cada intent identificado, cada uno con su propia puntuación de confianza y una lista de identificadores de pasos relacionados: los IDs de paso que contribuyeron a ese intent. Una frase como « actualmente hacemos X manualmente (lo que lleva una eternidad), pero queremos automatizarlo » aflora como tres intents separados (as_is, pain_point, to_be), cada uno con su propia confianza y sus propias referencias de paso. Si el mismo step ID aparece en los identificadores de pasos relacionados de varios intents, así es como una única frase subyacente acaba informando más de un diagrama. No hay una puntuación fraccional por frase como « 0,6 as_is, 0,7 pain_point »; la confianza está adjunta al intent detectado en su conjunto, no a las frases individuales.

¿Cuál es el modo de fallo si el clasificador pierde un escenario multi-intent?

El fallo más común es que un elemento to-be se clasifique como as-is y acabe en el diagrama de estado actual como una tarea que aún no existe. El analista revisando el diagrama de primera pasada lo nota porque la tarea no coincide con lo que las partes interesadas describieron como realidad actual. La corrección es una corrección en la interfaz de chat: « quita la tarea "la IA revisa la solicitud" del diagrama as-is: esto es parte del rediseño to-be, no del proceso actual ». El diagrama se recalcula sin la tarea mal clasificada. Esta es una parte normal del paso de refinado y no un fallo serio: el coste de una clasificación multi-intent perdida es un minuto de tiempo de refinado, no un artefacto corrupto.

Artículos relacionados

¿Qué es BPMN? La guía completa 2026 de Business Process Model and NotationTransformación IA de procesos: de flujos de trabajo manuales a agentes autónomos, sin el año de transición entremediasCinco procesos que toda PyME debería automatizar con IA primero, y por qué en ese orden

¿Listo para co-construir tu plan de transformación IA?

Sube cualquier documento de proceso y co-construye un plan de transformación IA con recomendaciones de herramientas reales y proyecciones de ROI — en minutos, no en semanas.

Probar LucidFlow gratis