Los agentes autónomos actúan en pos de objetivos complejos sin necesidad de dirección humana en cada paso. En entornos empresariales, la implementación de estos agentes plantea una serie de retos más exigentes: deben gestionar sistemas de datos heterogéneos, cumplir con los requisitos de cumplimiento normativo, auditoría y soberanía de los datos, y mantener todos los datos dentro de los límites operativos de la organización.
Los agentes de amplio alcance representan una nueva clase de IA autónoma que va más allá de las tareas individuales y persigue objetivos a lo largo de decenas de decisiones secuenciales, ejecutando flujos de trabajo durante horas o días sin perder nunca el contexto. A escala empresarial, cada uno de estos retos se multiplica.
Cloudera diseñó Cloudera Agent Studio (parte de Cloudera AI Studios) en colaboración con NVIDIA para abordar precisamente estos desafíos.
NVIDIA Nemotron proporciona la base del modelo: está diseñado específicamente para IA con capacidad de agencia y las demandas de alta capacidad de inferencia de flujos de trabajo de amplio alcance.
Cloudera Agent Studio proporciona la capa de orquestación que se basa en esa base a través de cuatro pilares arquitectónicos: planificación dinámica en varios pasos, colaboración transparente entre múltiples agentes, ingeniería de contexto para mayor precisión y ejecución en un entorno aislado. Cada pilar aborda un requisito específico que surge cuando los agentes autónomos operan a escala empresarial.
Figura 1: Cloudera Agent Studio coordina flujos de trabajo autónomos mediante una planificación iterativa en varias etapas, la colaboración entre múltiples agentes con herramientas y habilidades, la ingeniería de contexto basada en artefactos y la ejecución en entornos aislados, todo ello sobre la base de la implementación de modelos con Cloudera AI Inference, que utiliza la tecnología de NVIDIA NIM, y los modelos de Nemotron para la IA agéntica.
La IA empresarial comienza con la gobernanza de datos. Las indicaciones, los datos propietarios y las salidas del modelo deben mantenerse dentro de los límites operativos de la organización y cumplir con los mandatos de cumplimiento sin comprometer la arquitectura. Este es el requisito fundamental de la IA privada: la pila completa de inferencia que se ejecuta dentro de la empresa, no fuera de ella.
El servicio Cloudera AI Inference, basado en los microservicios NVIDIA NIM, permite ejecutar modelos escalables y de alto rendimiento directamente en el entorno empresarial, manteniendo las entradas, los datos y los resultados dentro del perímetro de seguridad. Acelerado por la plataforma de IA de NVIDIA, que incluye las GPU Blackwell y Dynamo-Triton, el servicio soporta una amplia gama de modelos, incluida la familia de modelos Nemotron de NVIDIA para la IA agéntica con razonamiento avanzado, uso de herramientas y flujos de trabajo de amplio alcance. Esta base permite a las organizaciones crear y ejecutar agentes de IA empresarial directamente en sus datos, de forma segura y a escala.
Los entornos de datos empresariales no están limpios. Las implementaciones reales implican docenas de bases de datos con esquemas incoherentes, documentación escasa y sin una ruta clara que lleve de una pregunta empresarial a la fuente de datos adecuada. El agente debe construir esa ruta en tiempo de ejecución.
El orquestador de Agent Studio trata la exploración como parte de la ejecución. Descompone las solicitudes complejas en planes de varios pasos, los ejecuta de forma iterativa y se autoevalúa tras cada paso antes de decidirse por una vía. Este ciclo de planificación autocorrectivo hace que los agentes sean fiables en entornos en los que nunca han encontrado y mantiene los flujos de trabajo de amplio alcance en muchos pasos secuenciales.
Los flujos de trabajo empresariales complejos abarcan varios dominios y cada uno requiere estrategias de razonamiento distintas y herramientas especializadas. Un único agente que intente abarcar todas estas necesidades no podrá optimizarse adecuadamente para ninguna de ellas, y cuanto mayor sea su alcance, más difícil resultará comprender y controlar el comportamiento del agente.
Agent Studio se basa en agentes especializados, cada uno dedicado a un dominio específico y equipado con las herramientas adecuadas, coordinados por un orquestador que sabe cómo delegar. Lo que hace que esta colaboración sea transparente y reutilizable es cómo se comunican los agentes: cada agente escribe salidas estructuradas en el contexto compartido del proyecto, y los agentes posteriores consumen esas salidas como entradas explícitas e inspeccionables. La cadena completa de razonamiento es trazable en cada paso, lo que proporciona la auditabilidad que requieren las empresas y la reutilización para aprovechar el trabajo previo en distintas ejecuciones.
A escalas de datos empresariales, pasar los datos en bruto directamente al modelo no funciona. Las ventanas de contexto son finitas y, a medida que el contexto desestructurado crece, la precisión se degrada mucho antes de que se alcance el límite de ventanas.
Agent Studio trata la ventana contextual como un instrumento de precisión: en cada paso, solo llega al modelo la información relevante para la tarea específica de ese agente. Este diseño basado en artefactos reduce el consumo de tokens, los costes de inferencia y la latencia, a la vez que mejora la precisión. Esa combinación es lo que hace que los flujos de trabajo a largo plazo sean manejables a escala empresarial.
Lo que hace que los agentes autónomos sean realmente potentes es su capacidad para generar dinámicamente herramientas, habilidades y código ejecutable según lo requieran los flujos de trabajo, capacidades que Agent Studio soporta de forma nativa. Pero sin aislamiento, el código generado por agentes y las herramientas que se ejecutan directamente contra los sistemas de la empresa presentan un riesgo inaceptable.
Diseñamos la capa de ejecución de Agent Studio en torno al aislamiento por defecto. Todo el código generado por los agentes y la ejecución de herramientas se llevan a cabo en un entorno de ejecución aislado, sin acceso a sistemas fuera de su ámbito definido. Los agentes comienzan sin permiso alguno, y cada acción se aplica mediante políticas en la capa de infraestructura, no dentro del propio proceso del agente. Esto otorga a las industrias reguladas la auditabilidad que requieren, sin restringir lo que pueden hacer los agentes.
Cloudera gestiona más de 30 exabytes de datos estructurados en toda su base de clientes, lo que convierte el análisis de datos estructurados en el área donde esta arquitectura genera un impacto inmediato. Una importante empresa del sector de los medios de comunicación y el entretenimiento lo implementó para ofrecer a los usuarios empresariales y a los analistas una interfaz de lenguaje natural con la que poder acceder a sus datos operativos. Su entorno de datos abarcaba petabytes en docenas de bases de datos, a menudo con metadatos contradictorios y escasa documentación.
Cloudera Agent Studio orquestó agentes especializados respaldados por NVIDIA Nemotron que operaban dentro de la red privada del cliente. Una consulta analítica realizada por un usuario empresarial desencadenó un ciclo de planificación iterativo: el coordinador exploró el conjunto de datos, resolvió las ambigüedades de los esquemas e identificó de forma autónoma las fuentes de datos adecuadas. Cuando el análisis requirió un cálculo estadístico más allá de lo que SQL podía expresar, el orquestador lo delegó en el agente de ejecución de código correspondiente. Los resultados intermedios se registraron como artefactos y se transmitieron a lo largo del flujo de trabajo a largo plazo. Todo el código generado se ejecutó en un entorno aislado, manteniendo un registro de auditoría completo en todo momento.
Los flujos de trabajo que antes requerían la intervención secuencial de un ingeniero de datos, un desarrollador y un analista pasaron a estar al alcance de cualquier usuario empresarial. Los resultados de los agentes, incluidos los comandos SQL, el código generado y las visualizaciones, se escribieron en un contexto de proyecto compartido en todo momento, cada uno de los cuales era inspeccionable y auditable. Esos artefactos también se podían exportar como pipelines de producción. Como el código que generan los agentes es determinista, incluso cuando los modelos subyacentes no lo son, esos pipelines son fiables y reproducibles sin ingeniería adicional.
Cada pilar de esta arquitectura se basa en el anterior. Una capa de inferencia privada proporciona la base y sustenta los volúmenes de llamadas y la fiabilidad que requieren los flujos de trabajo a largo plazo. La planificación iterativa permite a los agentes navegar por entornos que nunca han visto. La colaboración entre varios agentes aporta precisión de dominio al razonamiento en varios pasos. La gestión del contexto basada en artefactos mejora la precisión y reduce los costes de inferencia y la latencia. La ejecución en formato sandbox garantiza que los agentes operen de forma segura dentro de límites definidos, con cada acción gobernada y auditable.
Cloudera y NVIDIA dan vida a esta arquitectura a través de Cloudera Agent Studio, Cloudera AI Inference, impulsado por NVIDIA NIM, y la familia de modelos NVIDIA Nemotron. Juntos, proporcionan la base de la orquestación de la construcción y del razonamiento agéntico necesarios para ejecutar agentes de IA empresariales directamente sobre los datos empresariales, de forma segura, privada y a gran escala.
Para obtener más información, consulta Cloudera Agent Studio en acción.
This may have been caused by one of the following: