Hace tres años, los clientes de Cloudera comenzaron a explorar la IA generativa para transformar las interacciones con los datos: construir asistentes inteligentes, resumir documentos complejos y generar información bajo demanda. Y hoy en día, nuestros clientes gestionan más de 25 exabytes (¡es decir, 25 000 millones de gigabytes!) de datos empresariales en entornos locales y en la nube.
La manera en que las organizaciones gestionan sus datos es fundamental: en la era de la IA, el contexto no solo es útil, sino que es la diferencia entre decisiones precisas y alucinaciones. Los modelos de IA necesitan un acceso sin fisuras a los datos propietarios para generar conocimientos, responder preguntas o automatizar flujos de trabajo. Sin embargo, en la mayoría de las organizaciones, estos datos permanecen fragmentados en almacenes de objetos aislados, tablas de Iceberg, flujos de Kafka y bases de datos operativas. Los desarrolladores pierden un tiempo valioso escribiendo conectores personalizados y manteniendo pipelines frágiles, un impuesto a la innovación que ralentiza el tiempo de obtención de valor.
Ahí es donde entran en juego los servidores del Model Context Protocol (MCP) de Cloudera. Nuestros servidores están construidos sobre MCP y ofrecen una pasarela universal para gobernar los datos empresariales. MCP es un estándar abierto que tiene como objetivo estandarizar la integración de la IA de la misma manera que Microsoft Open Database Connectivity (ODBC) estandarizó las bases de datos relacionales (más sobre MCP en la siguiente sección).
Para apoyar esta misión, lanzamos el servidor MCP de Cloudera para Apache Iceberg mediante Impala. Apache Iceberg es la columna vertebral de los lakehouses modernos, que ofrece gestión a escala de petabytes, conformidad ACID, viaje en el tiempo y gobierno granular. Es el punto de partida perfecto para cerrar la brecha entre los datos y la IA.
Al comenzar con Apache Iceberg, abordamos un desafío crítico: las aplicaciones de IA necesitan acceso gobernado y en tiempo real a los datos analíticos sin necesidad de código personalizado adicional. Nuestro servidor MCP permite a los desarrolladores consultar las tablas de Iceberg en lenguaje natural, integrarse sin problemas con frameworks como CrewAI, Microsoft AutoGen, LangChain o LangGraph, LlamaIndex, y kits de herramientas de IA agéntica que funcionan con estos frameworks, como el kit de herramientas de NVIDIA Agent Intelligence (AIQ), mientras mantienen una sólida seguridad con las políticas de Cloudera SDX. Y esto es solo el principio: los futuros servidores MCP de Cloudera ampliarán el soporte a datos en transmisión, bases de datos operacionales y almacenes de archivos/objetos.
Figura 1: Dos escenarios de agentes de IA accediendo a datos para el contexto de IA:
A medida que las organizaciones se apresuran a adoptar arquitecturas agénticas, una capa de integración coherente es más importante que nunca.
El frenesí en torno a la adopción de arquitecturas agénticas está impulsando a las organizaciones a lanzar múltiples iniciativas en paralelo. Aunque este impulso es alentador, también corre el riesgo de crear el equivalente moderno del código espagueti, algo que ya hemos visto en los primeros días de la ingeniería de software. Lo que las empresas realmente necesitan es una arquitectura simplificada y basada en estándares que garantice la interoperabilidad entre los diversos sistemas que participan en el ecosistema agéntico. El MCP de Anthropic está emergiendo como un estándar prometedor en este ámbito, ya viendo una amplia adopción por parte de los proveedores de IA.”
- Sanjeev Mohan, director en SanjMo y exanalista de Gartner
MCP no es una herramienta exclusiva de Cloudera; es un estándar ampliamente adoptado que evita la dependencia de un proveedor y, al mismo tiempo, aprovecha un ecosistema de herramientas en crecimiento. El enfoque de Cloudera hacia los servidores MCP se alinea con la filosofía de MCP de apertura, sencillez y control. Los servidores MCP de Cloudera se ejecutan de forma nativa dentro de la plataforma unificada de Cloudera, eliminando el movimiento arriesgado de datos y permitiendo una implementación fluida tanto en entornos multinube como locales.
El poder transformador de la IA depende de la calidad de los datos que la alimentan. Cuando los datos y los sistemas de IA funcionan de forma aislada, la información desconectada retrasa los conocimientos, crea pipelines frágiles y deja a los modelos sin el contexto necesario para tomar decisiones precisas.
Cloudera une los datos y la IA en un ciclo de vida cohesivo. Los datos fluyen sin problemas en los flujos de trabajo de IA, regidos por metadatos compartidos, políticas de seguridad y recursos informáticos optimizados. Este enfoque elimina la duplicación y el movimiento costosos de datos, al mismo tiempo que hace que cada predicción sea rastreable hasta su origen, asegurando la transparencia, la confianza y el cumplimiento.
¿Estás listo para eliminar la fricción de la integración? Explora el servidor MCP de Cloudera para Apache Iceberg aquí, actualmente disponible en versión preliminar, y descubre cómo puedes potenciar tus aplicaciones de IA con el contexto que necesitan, justo donde residen tus datos. Para poner esto en práctica hoy, pruébalo sin coste durante cinco días.
This may have been caused by one of the following: