La reciente interrupción global de TI experimentada por un hiperescalador en la nube fue un recordatorio de una verdad universal en tecnología: aunque sea mínimo, el tiempo de inactividad y las interrupciones del servicio son inevitables. Aunque el impacto fue generalizado, interrumpiendo los servicios en retail, banca, sanidad y otros sectores, no fue un fallo exclusivo de un proveedor o de una sola nube. Ilustra que la interrupción puede ocurrir en cualquier lugar: en cualquier región en la nube, con cualquier proveedor.
La conclusión clave está clara: las organizaciones pueden y deben tomar el control mediante la creación de una arquitectura de datos resiliente que pueda adaptarse y prosperar en un entorno de cambios constantes. En este blog, compartiremos cómo los clientes de Cloudera están en una posición única para garantizar la continuidad empresarial gracias a la flexibilidad de nuestra arquitectura portátil y a las herramientas que garantizan una conmutación por error y una recuperación fluidas. Cloudera es la única empresa de plataformas de datos e IA que lleva la IA a los datos en cualquier lugar: en las nubes, en los centros de datos y en el borde.
La resiliencia de los datos es la capacidad de una organización para resistir, recuperarse rápidamente y minimizar el impacto de las interrupciones o fallos relacionados con los datos. Es un enfoque proactivo para la continuidad del negocio, que va más allá de la copia de seguridad o la recuperación ante desastres para asegurar que los datos críticos permanezcan siempre:
Disponible: accesible para usuarios y aplicaciones cuando sea necesario (minimizando el objetivo de tiempo de recuperación o RTO)
Intacto/preciso (integridad de los datos): sin daños ni alteraciones (lo que minimiza el objetivo del punto de recuperación o RPO)
Seguro: protegido contra acceso no autorizado, pérdida o robo
La arquitectura para una verdadera resiliencia implica dos pilares básicos interconectados: una tecnología que permita la portabilidad y un proceso examinado para la conmutación por error.
Depender de un solo proveedor, una sola nube o incluso una sola región dentro de una nube crea una vulnerabilidad empresarial crítica o un punto único de fallo. Las interrupciones se producen por fallos de hardware, problemas de software, errores humanos, desastres naturales o ciberataques. El objetivo de la resiliencia es garantizar que, cuando un entorno deja de funcionar, tus operaciones puedan continuar sin problemas y automáticamente en otro lugar.
Esto significa que debes ser capaz de realizar una conmutación por error en cualquier lugar: entre regiones en la nube, entre proveedores en la nube e incluso de vuelta a un centro de datos. Las operaciones comerciales deben continuar y los sistemas críticos deben permanecer en funcionamiento, independientemente de dónde se haya producido la interrupción inicial.
La tecnología puede proporcionar capacidad de resiliencia, pero el proceso es esencial para una continuidad empresarial exitosa. Muchos planes de recuperación ante desastres se redactan una sola vez y rara vez se revisan, incluso cuando las personas y la tecnología evolucionan. Un plan bien estudiado se documenta, se practica y se revisa periódicamente para garantizar que la organización pueda ejecutarlo en caso de fallo. Algunos elementos del plan incluyen:
Priorización de las cargas de trabajo para garantizar que las operaciones críticas, como el procesamiento de transacciones en el comercio minorista y la supervisión remota en el sector sanitario, tengan los acuerdos de nivel de servicio (SLA) más bajos para RTO y RPO.
Garantizar la redundancia y la alta disponibilidad mediante el establecimiento de la capacidad de conmutación por error entre entornos para mantener las operaciones.
Realizar copias de seguridad de datos y metadatos críticos y establecer políticas de retención y gobierno.
Cloudera es el único proveedor de plataformas de datos e IA que ofrece una experiencia en la nube coherente para los datos en cualquier lugar. Esto da a las empresas la libertad de mover cargas de trabajo de datos e IA entre nubes y centros de datos, sin fricciones ni vinculación de proveedores, de modo que ya no estés atado a una sola infraestructura. Como resultado, las organizaciones pueden reducir el riesgo empresarial al aprovechar Cloudera para diseñar y mantener las operaciones y el cumplimiento consistentes sin importar dónde residan los datos.
La plataforma Cloudera apoya la alta disponibilidad y la tolerancia a los desastres a través de nuestras soluciones y servicios, que incluyen:
Servicios de datos portátiles: la plataforma de Cloudera, que incluye servicios de datos nativos en la nube y lago de datos, funciona de forma consistente en cualquier nube (AWS, Azure, Google Cloud) y en Kubernetes en las instalaciones propias. La independencia de la infraestructura subyacente permite a los clientes configurar una variedad de sitios disponibles, combinando diferentes nubes y recursos locales, para reducir drásticamente la dependencia de una única plataforma o proveedor.
Datos en movimiento: Cloudera Data Flow, Cloudera Streaming Analytics y Cloudera Streams Messaging permiten a los clientes capturar, procesar y distribuir datos en cualquier lugar en tiempo real. Para las cargas de trabajo críticas y en tiempo real, como la detección de fraudes y la supervisión de la red, una posible interrupción puede tener un impacto empresarial significativo. Cloudera garantiza que estos servicios mantengan una alta disponibilidad y se puedan replicar en todos los entornos.
Replication Manager: este componente central de Cloudera ofrece un enfoque simplificado para la copia de seguridad y recuperación. Replica no solo los datos, sino también los metadatos y las políticas críticas de seguridad y gobierno vinculadas a esos datos. Esta replicación permite una migración sencilla, sincronización continua y, lo más importante, la capacidad de hacer una conmutación rápida mediante la promoción de un entorno replicado secundario junto al entorno operativo principal con una pérdida mínima de datos.
Open Data Lakehouse: el lakehouse de datos abierto de Cloudera ofrece una gestión segura de datos y análisis de datos nativos en la nube con un enfoque de escribir una vez y ejecutar en cualquier lugar. Esto elimina el tiempo y los costes asociados a la refactorización de aplicaciones o cargas de trabajo al pasar de una infraestructura a otra.
Figura 1. Cloudera ofrece la experiencia de la nube en cualquier lugar para la IA en todas partes
En conjunto, estas capacidades permiten a los clientes de Cloudera ejecutar cargas de trabajo de datos y IA de misión crítica con confianza, garantizando un tiempo de inactividad y una pérdida de datos prácticamente nulos para sus procesos empresariales más importantes, incluso durante una interrupción a nivel de infraestructura.
Para muchas empresas, la reciente interrupción del servicio fue solo un parpadeo. Pero, ¿y si la perturbación fuera un verdadero desastre, como una guerra? Con sede en Ucrania, AM-BITS, proveedor de soluciones de TI para los sectores bancario, telecomunicaciones y minorista, se enfrentó a una necesidad urgente de asegurar y migrar los datos críticos de sus clientes tras la disrupción geopolítica que obligó a las organizaciones a acelerar rápidamente su transición de los sistemas locales a la nube. Una migración típica en la nube podría tardar seis meses o más, un plazo que muchas empresas no podían permitirse.
Para abordar esta crisis de continuidad, AM-BITS construyó una plataforma moderna de datos e IA multiempresa impulsada por Cloudera. Al aprovechar Cloudera Shared Data Experience (Cloudera SDX), AM-BITS proporcionó rápidamente un “puerto seguro técnico” para los activos de datos de sus clientes, reduciendo drásticamente el tiempo para migrar de forma segura los datos a la nube en un 50 %. Como Cloudera opera de forma fluida en cualquier entorno, los clientes de AM-BITS obtuvieron verdadera flexibilidad: podían migrar rápidamente a la nube, pero también mantenían la opción de trasladarse a otra nube o traer datos de vuelta a las instalaciones. Al aprovechar Cloudera, AM-BITS convirtió la portabilidad en una herramienta poderosa para la continuidad del negocio.
Las interrupciones y cortes relacionados con los datos pueden deberse a fallos de hardware, problemas de software, errores humanos, desastres naturales, ciberataques, etc. Es fundamental que las organizaciones diseñen sus sistemas teniendo en cuenta esos puntos de fallo y dispongan de un plan para recuperar sus sistemas TI y sus datos con rapidez y sin interrupciones significativas.
Para saber más sobre cómo puedes diseñar la resiliencia con Cloudera, consulta nuestra lista de verificación y recursos de recuperación ante desastres, o contacta con nuestro equipo de servicios profesionales que puede ayudarte a diseñar un plan de resiliencia.
This may have been caused by one of the following: