ClouderaNOW Descubre los agentes de IA, la expansión a la nube y las estructuras de datos para IA  |  8 de abril

Registrarse
  • Cloudera Cloudera
  • | Técnico

    La próxima evolución de la analítica empresarial: la plataforma de inteligencia de datos

    Laura Blewitt headshot
    Carretera de noche

    Los lakehouses resolvieron muchos problemas empresariales al unificar y simplificar el almacenamiento de datos. Pero el panorama operativo a nivel empresarial ha cambiado. Hoy en día, las organizaciones coordinan más herramientas, gestionan más datos, ponen en práctica la IA y se enfrentan a un escrutinio normativo cada vez mayor. 

    Como resultado, los datos ya no pueden tratarse como algo que se consulta de forma ocasional o aislada. Ahora deben ser operativos, es decir, estar listos para su uso en tiempo real, la toma de decisiones automatizada y los flujos de trabajo impulsados por la IA en toda la organización. Este cambio está impulsando las arquitecturas más allá de los lakehouses y hacia una plataforma de inteligencia de datos más dinámica. 

    ¿Qué ha cambiado? El análisis se ha vuelto multiplataforma. 

    Las empresas modernas dependen de múltiples plataformas de análisis para admitir una amplia gama de cargas de trabajo, incluidas la business intelligence y los informes, el análisis en tiempo real, la observabilidad, el aprendizaje automático y la IA. 

    Cada equipo tiene sus propias necesidades en cuanto a los datos, y en la práctica, la elección de la plataforma viene determinada por la productividad y la velocidad, más que por la pureza arquitectónica. Gran parte de esos datos también permanecen en el entorno local o en entornos regulados, donde trasladarlos a la nube no es práctico ni está permitido. 

    El modelo original de lakehouse partía de la convergencia en un número reducido de plataformas de análisis. La realidad demostró lo contrario: las herramientas, los usuarios y las cargas de trabajo divergían. El reto ahora es dar soporte a esa diversidad sin sacrificar la coherencia ni el control. 

    El coste de tratar los datos como propiedad de la plataforma 

    A pesar de las implementaciones de lakehouse, los datos empresariales suelen permanecer estrechamente vinculados a la plataforma que los gestiona. Cuando otra plataforma necesita acceder a ellos, los datos suelen copiarse, transformarse o exportarse para adaptarse a ese entorno. 

    Con el tiempo, el simple hecho de mantener la coherencia y la accesibilidad de los datos en estas diversas plataformas se convierte en un reto. Los conjuntos de datos duplicados, las canalizaciones frágiles, los retrasos en la obtención de información y la falta de coherencia en el gobierno introducen riesgos operativos y aumentan los costes. 

    El resultado es un patrón familiar: aumento del gasto, mayor complejidad y disminución de la confianza en los datos y sus resultados.

    De lakehouse a la infraestructura de inteligencia 

    El lakehouse ayudó a dar estructura a un panorama analítico fragmentado, facilitando la colaboración de los sistemas de datos. A medida que las empresas entran en la era de las plataformas de inteligencia de datos a gran escala, el enfoque cambia. 

    En lugar de que las herramientas individuales den forma a los datos y sean propietarias de ellos, estos se convierten en la base de la arquitectura, en cualquier lugar donde residan físicamente. Todas las herramientas se sitúan sobre una capa de datos compartida, en lugar de extraer datos hacia entornos aislados y generar resultados compartimentados. 

    Este cambio permite a los equipos elegir el motor de cálculo adecuado para cada carga de trabajo, ya sea análisis SQL, procesamiento a gran escala o IA, con la confianza de operar sobre la misma base de datos gobernada y fiable. 

    ¿Qué es una plataforma de inteligencia de datos? 

    Una plataforma de inteligencia de datos es una infraestructura compartida para los datos. Piensa en ello como en la infraestructura de una ciudad: las carreteras, las líneas eléctricas y las tuberías que se encuentran bajo una ciudad y a las que todos los edificios se conectan y de las que dependen  

    De la misma manera, una plataforma de inteligencia de datos proporciona una base centralizada que impulsa muchas herramientas, motores de cálculo y aplicaciones diferentes, con el gobierno y el contexto integrados desde el diseño en lugar de añadirse a posteriori. 

    Se caracteriza por: 

    • Una capa de datos compartida creada sobre formatos de datos abiertos 

    • Un rico linaje de metadatos que capta la estructura, el significado y la historia 

    • Gobierno integrado que viaja con los datos 

    • Soporte para varios motores de análisis e IA 

    • La capacidad de evolucionar sin rediseñar desde cero 

    Las bases abiertas hacen posible la inteligencia de datos 

    Una plataforma como esta solo funciona si los datos se pueden compartir de forma segura en todas las herramientas y entornos, ya sea en local, en la nube, en el edge o una combinación de todos ellos. Los formatos de tablas abiertas son la base común que hace posible la interoperabilidad entre motores (siguiendo con nuestra metáfora de la ciudad: los códigos de construcción y las normas de calles que hacen que la ciudad sea navegable para todos). 

    Sin ellos, conectar herramientas a menudo significa lidiar con formatos incompatibles, latencias inconsistentes, bloqueos propietarios o datos que deben gestionarse más allá de las fronteras geográficas. Esto puede dar lugar a problemas habituales: menor capacidad de auditoría, visiones inconsistentes de los datos y retos crecientes en torno a la confianza. 

    Por el contrario, los formatos abiertos reducen el bloqueo y admiten un ecosistema de herramientas en crecimiento (es decir, se configuran una vez y se dejan crecer con tu pila tecnológica a lo largo del tiempo). Facilitan la definición de políticas de gobierno una sola vez y su aplicación en todas partes (incluso donde los datos no se pueden mover fácilmente), independientemente del motor que necesite acceder a ellos. Esto también crea una "capa de memoria" coherente para los sistemas basados en IA, lo que los hace más fiables, auditables y adaptables mediante la trazabilidad y el contexto histórico integrados. 

    Sin formatos abiertos ni un gobierno integrado, la inteligencia se fragmenta rápidamente en silos, lo que erosiona las ventajas que ofrecen las plataformas de inteligencia de datos.  

    Mira cómo funciona
     

    ¿Quieres ver cómo es una plataforma de inteligencia de datos en la práctica?
    Mira cómo Snowflake y Databricks pueden consultar las tablas de Iceberg gestionadas por Cloudera sin copiar los datos ni comprometer el gobierno.

    Cómo cambiar a una plataforma centrada en la inteligencia 

    La adopción de una plataforma de inteligencia representa un cambio fundamental no solo en la infraestructura, sino también en la forma en que las organizaciones piensan y confían en sus datos. El periodo de transición es especialmente crítico porque establece las expectativas de fiabilidad, integración y adopción entre los equipos. Los errores iniciales pueden generar retos persistentes y resistencia a la adopción a largo plazo. 

    Si se hace bien, este cambio equilibra la estabilidad y el progreso, manteniendo en funcionamiento los procesos críticos para la misión y, al mismo tiempo, proporcionando beneficios iniciales que generan confianza e impulso. 

    El equipo de Servicios Profesionales y Transformación (PS&T) de Cloudera ayuda a las organizaciones a afrontar este cambio con cuidado, evitando los errores arquitectónicos más comunes y creando una base sólida que admita futuros casos de uso de análisis e IA. 

    Más información sobre nuestras capacidades de PS&T aquí.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.