ClouderaNOW Descubre los agentes de IA, la expansión a la nube y las estructuras de datos para IA  |  8 de abril

Registrarse
  • Cloudera Cloudera
  • | Business

    Incorpora modelos de IA a los datos con Cloudera AI Inference Service

    Pamela Pan headshot
    Navita Sood Headshot
    paisaje urbano

    Hemos entrado en una nueva fase de adopción de la IA: el 88 % de los proyectos de IA empresariales se estancan antes de llegar a la fase de producción, no por ideas deficientes o modelos débiles, sino porque la infraestructura no puede seguir el ritmo. Las API en la nube se encarecen rápidamente. El gobierno es una cuestión secundaria. La latencia se acumula. Y para los sectores regulados, trasladar datos confidenciales a un endpoint público simplemente no es una opción. 

    Para cerrar la brecha entre una prueba piloto de IA y la producción a gran escala, es necesario llevar la inteligencia directamente a la fuente. Cloudera AI Inference Service ofrece a los equipos empresariales una capa de servicio de modelos de producción segura, eficaz y rentable, que se ejecuta directamente donde residen los datos. 

    En lugar de enviar los datos a la nube como contexto para los modelos, Cloudera te lleva los modelos a ti, desbloqueando la inteligencia exactamente donde se necesita, protegiéndola por diseño y escalándola con confianza detrás de tu propio firewall.

    3 razones por las que es importante llevar la IA a los datos: privacidad, coste y elección a escala

    Mantenga los datos privados y protegidos

    La mayoría de los servicios de IA requieren que se envíen los datos a la nube, lo que crea riesgos en torno al cumplimiento, el coste y la latencia. Cloudera adopta el enfoque de llevar los modelos al lugar donde ya residen los datos. Ya sea en una nube privada virtual (VPC) segura o en un entorno local desconectado (sin conexión y aislado por completo), esta estrategia de modelos a datos garantiza que la información siga siendo privada y esté gobernada, a la vez que permite una inferencia de alto rendimiento para impulsar la IA en producción. 

    Economía predecible a largo plazo

    Ejecutar la IA en la nube 24/7 genera gastos impredecibles y en espiral. Estas tarifas por solicitud crean un presupuesto que fluctúa con el uso, lo que dificulta las previsiones a largo plazo. Al trasladar la inferencia a la infraestructura que la organización ya posee y controla, los equipos pueden eludir estas tarifas de uso externas. Una vez que la IA pasa a una producción estable, los costes se vuelven más predecibles, lo que permite un mayor retorno de la inversión a medida que aumentan las cargas de trabajo.

    Control y elección

    La mayoría de los proveedores de IA en la nube dirigen a los clientes hacia su ecosistema propietario, lo que dificulta el cambio, la ampliación o el control total de los modelos. Con Cloudera AI Inference Service, puedes implementar una amplia gama de capacidades de IA, desde LLM de IA generativa de código abierto como Nemotron de NVIDIA hasta modelos predictivos tradicionales, sin renunciar al control ni a la propiedad intelectual. Acelerado por la pila de IA de NVIDIA (GPU NVIDIA Blackwell, NVIDIA Dynamo-Triton y microservicios NVIDIA NIM para un servicio de modelos escalable y de alto rendimiento), Cloudera AI Inference Service permite innovar libremente mientras la infraestructura de IA sigue siendo flexible, portátil y apta para el futuro

    Figura 1: Arquitectura de Cloudera AI Inference Service Figura 1: Arquitectura de Cloudera AI Inference Service

    Historias de éxito: adopción temprana de Cloudera AI Inference Service en el entorno local

    Cloudera AI Inference Service está abriendo nuevas posibilidades de uso de la IA en lugares donde la nube no puede llegar: entornos sin conexión, infraestructuras soberanas y operaciones en las que la latencia es crítica. A continuación se presentan tres escenarios reales que ahora son posibles gracias a Cloudera AI Inference Service y que ya están en marcha con los primeros usuarios.

    Seguridad nacional: inteligencia desconectada que nunca duerme ni se filtra

    En la defensa nacional, la velocidad y la seguridad son innegociables. Pero hasta hace poco, los oficiales de inteligencia dedicaban miles de horas a examinar de forma manual documentos confidenciales sin conexión, ralentizados por el proceso, abrumados por el volumen e incapaces de aprovechar las herramientas de IA públicas sin correr el riesgo de exponerse.

    Ahora, con Cloudera AI Inference Service funcionando en entornos desconectados, los organismos de defensa pueden implementar potentes asistentes LLM que escanean y resumen enormes colecciones de documentos en cuestión de segundos. Estos modelos funcionan completamente sin conexión: sin internet, sin dependencias de la nube y sin fugas de datos, ayudando a los analistas a tomar decisiones con mayor rapidez sin comprometer la seguridad.

    Finanzas globales: operaciones instantáneas, cero exposición de datos

    Las finanzas transfronterizas se desarrollan en docenas de idiomas. Antes, traducir documentos como contratos, informes de fraude o actualizaciones de cumplimiento significaba utilizar herramientas externas, lo que suscitaba serias preocupaciones sobre la exposición de los datos y la auditabilidad.

    En la actualidad, uno de los principales proveedores mundiales de tarjetas de crédito está explorando Cloudera AI Inference Service y probando la implementación en el entorno local de modelos multilingües para traducir comunicaciones confidenciales en más de 200 mercados en tiempo real y bajo control interno total. Al ejecutar la inferencia en su propia infraestructura, está agilizando las operaciones internas y los tiempos de respuesta a los clientes, a la vez que evita los riesgos de cumplimiento de las API de terceros.

    Sector público: agentes de IA para cada empleado

    Los organismos gubernamentales están sometidos a la presión de atender a más personas y con mayor rapidez, pero los empleados suelen depender de portales obsoletos y manuales de políticas densos. Las herramientas de IA generativa públicas no son una opción debido a las normas de privacidad y a los costes impredecibles.

    Las primeras implementaciones de Cloudera AI Inference Service están dando soporte a chatbots de IA en el entorno local, entrenados con documentación interna de los organismos. Estos agentes ayudan al personal y a los ciudadanos a navegar por temas complejos con rapidez y confianza, proporcionando respuestas al instante, a la vez que mantienen un control total sobre los datos, los prompts y los resultados.

    Mirando hacia adelante: el futuro de la IA está allí donde residen los datos

    Al llevar el modelo al lugar donde residen los datos, Cloudera AI Inference Service ayuda a las organizaciones a escalar la inteligencia según sus propios términos, con un coste predecible y la flexibilidad de elegir entre una amplia gama de modelos de producción. Tanto si se trata de cumplir con requisitos de seguridad desconectados como de optimizar operaciones globales de gran volumen, el camino hacia la IA de nivel de producción ya está abierto.

    Cloudera AI es la base de confianza para crear, implementar y gestionar todo tipo de IA, desde la IA generativa y agéntica hasta el aprendizaje automático tradicional, en todo el patrimonio de datos. 

    ¿Todo listo para escalar? No dejes que la infraestructura limite la estrategia de IA. Visita la página web de Cloudera AI Inference Service para ver demos de casos de uso, obtén más información al respecto en este webinar o solicita una demo para ver cómo convertir la "IA en cualquier lugar" en una realidad.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.