La arquitectura del lakehouse se desarrolló con el objetivo de combinar la escala no estructurada del lago de datos con el rendimiento estructurado del data warehouse. Este cambio unificó los datos empresariales y proporcionó la primera "fuente única de verdad" auténtica. Pero en 2026, el objetivo se ha ampliado. A medida que entramos en la era de la IA agéntica, el lakehouse está pasando de ser un repositorio para la elaboración de informes retrospectivos que respaldan la toma de decisiones a convertirse en una capa contextual de alto rendimiento que impulsa a los agentes empresariales autónomos para que puedan actuar de forma autónoma e inmediata. Su base abierta, flexible y fiable se ve reforzada por la interoperabilidad, el manejo de datos en tiempo real, la seguridad, el gobierno, la portabilidad entre nubes y en el entorno local, y las automatizaciones de IA integradas para todas las funciones administrativas y operativas.
En Cloudera, estamos asistiendo a una transformación fundamental en la forma en que los líderes de las empresas de la lista Fortune 2000 ven sus entornos de datos. La presión proviene de su necesidad de alimentar de manera eficiente a los agentes de IA autónomos. Están utilizando el lakehouse de Cloudera para unificar datos estructurados, semiestructurados y no estructurados con el fin de permitir la "copia cero", el "ETL cero", el ajuste fino de modelos casi en tiempo real y la inferencia en tiempo real. El lakehouse permite canalizaciones RAG, almacenes de características de IA y canalizaciones de transmisión en tiempo real, proporcionando marcos de gobierno, capas de contexto semántico e inteligencia operativa para los agentes empresariales.
En la era de la IA, tus datos son tu mayor ventaja competitiva. Por eso es lógico que tu estrategia de datos defina qué herramienta utilizas o dónde entrenas y ejecutas tu IA, y no al revés. Sin embargo, muchos proveedores siguen impulsando un modelo de "consolidación primero", que te obliga a trasladar o copiar tus datos a su entorno de gobierno o nube propietario antes de poder utilizarlos. Esto no solo añade costes, complejidad y riesgos adicionales a tu estrategia de datos, sino que a menudo también te obliga a ceder la propiedad y el control de tus datos.
Tu data lakehouse debe ser abierto, flexible, portátil, interoperable y adaptable, de modo que si tu estrategia de datos cambia, tu lakehouse se adapte a ella. Por eso, los formatos de tabla abiertos (Apache Iceberg), los catálogos abiertos (Apache Polaris), los motores de consulta abiertos, las API REST y el acceso federado se están convirtiendo en la nueva norma y constituyen los pilares fundamentales del lakehouse de Cloudera.
Los LLM se entrenan en internet. No conocen tu empresa. El éxito de la IA ya no viene determinado por la calidad del modelo. Depende de los flujos de trabajo que estés automatizando y de la precisión del contexto empresarial que proporciones a los modelos: registros de ERP, transacciones financieras, registros de la cadena de suministro, etc.
Cloudera Data Lakehouse proporciona una capa segura y bien protegida, contextual, para tus agentes:
Contexto de 360 grados: unifica y pon a disposición datos del edge, de los centros de datos y de la nube con una única capa de gobierno que proporciona un contexto completo de 360 grados.
Datos multimodales: transforma, limpia y unifica datos no estructurados como registros, vídeos e imágenes, mejorando el análisis y el razonamiento junto con tablas estructuradas.
Semántica compartida: combina metadatos técnicos, empresariales y operativos para facilitar a los agentes el descubrimiento, la comprensión y el uso de tus datos en el contexto empresarial correcto.
Linaje de espectro completo: cuando un agente de IA toma una decisión de compra de 1 millón de dólares, necesitas un "registro documental" o explicabilidad. Cloudera proporciona esta explicabilidad a través de la trazabilidad de principio a fin y el linaje automatizado desde el sensor edge hasta el resultado final del modelo.
El lakehouse de Cloudera ofrece contexto en tiempo real en entornos distribuidos y heterogéneos, lo que permite a las empresas mantener el control sobre sus datos, modelos y reglas de negocio, a la vez que proporciona un contexto completo a los sistemas de IA.
Cloudera te permite llevar el análisis y la IA a los datos, independientemente de dónde residan. Tanto si tus datos residen en un almacén de objetos local, en una nube privada o en varias nubes públicas, nuestro lakehouse ofrece IA portátil con una arquitectura unificada y de copia cero. Puedes desarrollar en la nube y realizar inferencias en tu entorno local (sin ningún coste de refactorización) para mantener el control de tus datos y evitar la fuga de propiedad intelectual. Para instituciones financieras globales, como OCBC Bank, esta apertura de la arquitectura les permite escalar las capacidades de IA/ML en todo el grupo, a la vez que cumplen con los estrictos requisitos regionales de residencia y soberanía de datos.
Los sistemas de IA son muy sensibles a la calidad, la actualidad y la coherencia de los datos. A medida que los volúmenes de datos y los flujos de trabajo de IA crecen exponencialmente, la optimización manual se vuelve insostenible. Cloudera integra automatizaciones impulsadas por IA directamente dentro de la plataforma lakehouse para:
Acceso a los datos
Optimización de datos
Compactación
Evolución del esquema
Etiquetado y clasificación
Ajuste de la carga de trabajo
Monitorización de la calidad
Aplicación del gobierno
Lineage
Gestión del ciclo de vida
Se autooptimiza continuamente a la vez que reduce la complejidad operativa para los equipos de datos e IA. Con Cloudera Agent Studio, nuestros clientes están implementando agentes que monitorizan, transforman y mueven datos de forma autónoma según la intención empresarial.
La distinción entre "transmisión" y "por lotes" se está desvaneciendo. Para dar soporte a los flujos de trabajo agénticos, los datos no pueden tener minutos u horas de antigüedad: deben ser continuos.
Cloudera Open Data Lakehouse funciona como un lakehouse de transmisión, tratando cada punto de datos como un evento, lo que permite a los agentes de IA responder a interrupciones en la cadena de suministro o anomalías financieras en el milisegundo en que se producen. Procesa estos eventos justo donde se originan y realiza análisis complejos sobre los datos en transmisión antes de ingerirlos en el lakehouse para la toma de decisiones casi en tiempo real. También entrega los datos en transmisión preprocesados a los agentes en la fase de inferencia para la acción en tiempo real. El lakehouse también incluye capacidades de intercambio y federación de datos, lo que garantiza que se pueda actuar sobre los datos de otras fuentes con una latencia mínima, sin movimientos ni transformaciones de datos innecesarios.
El lakehouse no es un monolito centralizado. A medida que proliferan el IdC, las fábricas inteligentes y las aplicaciones móviles, la inferencia en el edge se ha vuelto crítica. Cloudera amplía el lakehouse hacia el exterior, permitiendo el análisis y la acción allí donde se generan los datos (en el edge) mientras sincroniza las perspectivas con el centro de operaciones. En Navistar: al procesar en tiempo real los datos de los sensores de miles de camiones conectados, han reducido los costes de mantenimiento en un 30 % al activar automáticamente acciones de mantenimiento proactivas.
En Cloudera, estamos viendo una convergencia de las arquitecturas de lakehouse y tejido. Mientras que el lakehouse unifica los datos, el tejido activa los metadatos (captura automatizada en la incorporación: linaje, etiquetas de sensibilidad y más). Juntos, esto ayuda a automatizar la detección, la integración y el gobierno de los datos. Esto simplifica el acceso a los datos desde cualquier lugar con seguridad de copia cero, ETL cero y redundancia cero.
La primera ola de IA se centró en la conversación. La próxima ola se centra en los agentes. En esta era, el éxito no lo obtendrán quienes simplemente "almacenen" la mayor cantidad de datos, sino aquellos que puedan proporcionar un contexto fiable, continuo y multimodal a los sistemas autónomos, ofreciendo recomendaciones y decisiones claras. Al proporcionar a los agentes de IA un acceso gobernado y federado a cualquier dato, Cloudera está ayudando a las empresas más grandes del mundo a pasar de "hablar" a "actuar".
Tanto si tus datos están en el centro de datos, en la nube o en el edge, Cloudera Open Data Lakehouse actúa como un lakehouse híbrido para garantizar que estén preparados para el futuro agéntico.
Mira el vídeo para descubrir cómo funciona Cloudera Open Data Lakehouse.
Visite Cloudera Open Data Lakehouse para obtener más información.
This may have been caused by one of the following: