¿Qué es la computación en clúster?

Una vista aérea de furgonetas en un aparcamiento

¿Qué es la computación en clúster?

La computación en clúster es un tipo de computación en la que se conectan varias computadoras para que funcionen juntas como un único sistema. El término "clúster" se refiere a la red de sistemas informáticos vinculados y programados para realizar la misma tarea. 

Los clústeres informáticos suelen estar formados por servidores, estaciones de trabajo y computadoras personales (PC) que se comunican a través de una red de área local (LAN) o una red de área amplia (WAN).

La computación en clúster es un tipo de computación distribuida, que conecta computadoras en una red para realizar una tarea computacional, aumentar la potencia computacional y funcionar como una sola computadora. Cada computadora o “nodo” en una red de computadoras tiene un sistema operativo (SO) y un núcleo de unidad central de procesamiento (CPU) que maneja las tareas necesarias para que el software se ejecute correctamente.

Debido a su rendimiento y disponibilidad, la computación en clúster tiene muchas aplicaciones, incluyendo computación en la nube, inteligencia artificial (IA), investigación científica y analytics de big data.

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

¿Cómo funciona la computación en clúster?

En su nivel más fundamental, la computación en clúster utiliza una LAN para conectar varias computadoras independientes en una red. En la arquitectura del clúster, cada computadora de la red se denomina "nodo" y está controlada por middleware, un software que permite la comunicación entre cada máquina. Los usuarios del clúster pueden usar los recursos de cada equipo como si fueran una sola máquina, en lugar de máquinas individuales conectadas a través de una LAN.

Un clúster informático puede conectar tan solo dos nodos o hasta miles. Por ejemplo, un clúster Beowulf suele utilizar PC de grado comercial conectadas a través de una red de área local y puede ser una alternativa relativamente asequible a una supercomputadora para ciertas tareas.1

Kubernetes, por otro lado, una tecnología relacionada con los contenedores y adyacente a los clústeres que es esencial para la computación en la nube, admite clústeres de hasta 5000 nodos separados, pero conectados. Kubernetes se utiliza en muchos tipos de despliegues en la nube, incluidas las arquitecturas de nube híbrida y multinube, así como en DevOps y la modernización de aplicaciones.

Arquitectura de computación en clúster

Las arquitecturas de computación en clúster consisten en un grupo de computadoras individuales interconectadas que trabajan juntas como una sola máquina. Cada recurso está conectado a través de una conexión de alta velocidad, como una LAN, y se denomina en la arquitectura del sistema como un solo nodo. Cada nodo tiene un sistema operativo, memoria y funciones de entrada y salida (E/S).

Existen dos tipos de arquitecturas de clúster, abiertas o cerradas. En un clúster abierto, cada computadora tiene su propia dirección IP. En un clúster cerrado, cada nodo está oculto detrás de un nodo de puerta de enlace. Dado que el nodo de puerta de enlace controla el acceso a los nodos y las direcciones IP se pueden encontrar en Internet, los clústeres cerrados son menos riesgosos para la seguridad que los clústeres abiertos.

Otros tipos de computación distribuida

Además de la computación en clúster, existen otros dos tipos de computación distribuida de uso común que también tienen la característica de redes de computadoras conectadas: la computación en red y la computación entre pares.

Computación en red: en informática, se configura una infraestructura de computación en red para combinar recursos informáticos que se encuentran en diferentes ubicaciones físicas. Los recursos informáticos disponibles de las diferentes máquinas se combinan y utilizan conjuntamente para resolver un problema. Al igual que la agrupación en clústeres, la computación en red utiliza los recursos de múltiples computadoras interconectadas.

Sin embargo, a diferencia de la agrupación en clústeres, solo se emplean los recursos no utilizados en las computadoras conectadas a través de la arquitectura de red. SETI, la búsqueda de inteligencia extraterrestre, fue un ejemplo famoso de computación en red, donde los recursos informáticos no utilizados de muchas computadoras se utilizaron para analizar señales de radio del espacio profundo en busca de signos de vida extraterrestre.2

Computación entre pares: la computación entre pares (P2P) o las redes requieren que dos o más computadoras estén conectadas como "pares" en una red, lo que significa que tienen la misma potencia y permisos. A diferencia de la computación en clúster, una arquitectura P2P no requiere un enfoque de gestión centralizada.

En una red P2P, cada nodo actúa como máquina cliente (una computadora que necesita acceso a un servicio) y servidor (una computadora que proporciona un servicio). Cada nodo del mismo nivel pone recursos a disposición de otros en la red, incluido el almacenamiento, la memoria, el ancho de banda y más.

Tecnologías adyacentes

La computación en clúster se inventó en la década de 1960 como un método para distribuir tareas informáticas y almacenamiento de datos en varias computadoras. En la década de 1980, los avances en varias tecnologías adyacentes, como las computadoras personales, los procesadores versátiles y las redes de área local (LAN), tuvieron importantes repercusiones en la computación en clúster.

Quizás la más grande fue el uso de nodos informáticos multiprocesador en la computación de alto rendimiento (HPC). A medida que crecían los casos de uso de HPC, también lo hicieron los casos de uso para la computación en clúster. Hoy en día, esos usos incluyen las industrias automotriz y aeronáutica, el análisis de datos de satélites y telescopios y el diagnóstico de enfermedades peligrosas, entre otros.

Actualmente, la computación en clúster se utiliza en muchas de las tecnologías más avanzadas que impulsan nuestro mundo, como la inteligencia artificial (IA), machine learning (ML) y la computación en la nube. Las empresas más grandes del mundo utilizan la computación en clúster para mover las cargas de trabajo a la nube, aumentar la velocidad de procesamiento, mejorar la integridad de los datos y más. A nivel empresarial, a los clústeres de computadoras se les suele asignar una tarea específica, por ejemplo, el equilibrio de carga, la alta disponibilidad o el procesamiento a gran escala de datos en un centro de datos.

Computación de alto rendimiento

4ª generación de procesadores Intel Xeon Scalable en IBM Cloud

Conozca el compromiso de Intel e IBM con la próxima generación de microarquitectura para la industria de la nube.

Beneficios empresariales de la computación en clúster

Los clústeres informáticos están diseñados principalmente para tener un mayor rendimiento y ser más confiables que otros tipos de arquitecturas informáticas, lo que los hace indispensables para la empresa moderna. Por ejemplo, los clústeres modernos tienen tolerancia a fallas incorporada, un término que se refiere a su capacidad para continuar funcionando incluso cuando falla un solo nodo en una red.

Además, los grandes clústeres informáticos dependen de sistemas de archivos distribuidos (DFS) y una matriz redundante de discos independientes (RAID) que permiten almacenar los mismos datos en diferentes ubicaciones en varias unidades de disco duro. La computación en clúster beneficia a la empresa moderna de muchas maneras. Estos son algunos ejemplos: 

Desempeño

Debido a su dependencia del paralelismo, los clústeres informáticos se consideran de alto rendimiento y, por lo general, pueden procesar datos más rápidamente y manejar cargas de trabajo más grandes que una sola computadora.

Confiabilidad

La computación en clúster se considera altamente confiable debido a su incorporación de tecnologías DFS y RAID. En un clúster de computadoras, incluso si falla un solo nodo, la red continúa funcionando y DFS y RAID continuarán garantizando que los datos estén respaldados en múltiples lugares. 

Disponibilidad

Además de ser altamente confiable, la computación en clúster también se considera altamente disponible debido a su capacidad para recuperarse rápidamente de la falla de un solo nodo. Si un clúster funciona correctamente, cuando un nodo falla, su trabajo se transfiere perfectamente a otro en el clúster sin interrupción del servicio.

Escalabilidad

La computación en clúster es altamente escalable porque se pueden agregar nodos al clúster en cualquier momento para aumentar el rendimiento. La capacidad de ajustar dinámicamente los recursos dentro de un clúster significa que el clúster puede escalar de manera ascendente o descendente, dependiendo de la demanda. 

Costo

La computación en clúster es más rentable que otros tipos de computación. Muchas empresas modernas confían en la computación en clúster para mejorar el rendimiento, la escalabilidad y la disponibilidad de su infraestructura de TI a un precio asequible.

Tipos de clústeres

Los clústeres informáticos varían mucho tanto en complejidad como en propósito. Los clústeres relativamente simples de doble nodo, por ejemplo, conectan solo un par de computadoras, mientras que la supercomputadora Aurora, por otro lado, conecta más de 10 000.3

Los clústeres tienen muchos casos de uso empresarial debido a su alto rendimiento, escalabilidad y flexibilidad, pero también son utilizados por universidades y facultades de medicina para la investigación científica. Según sus características, los clústeres informáticos se dividen en tres tipos diferentes: alta disponibilidad, equilibrio de carga y alto rendimiento. 

Clústeres de alta disponibilidad

Los clústeres de alta disponibilidad transfieren automáticamente tareas de un nodo que ha fallado inesperadamente a otro nodo de la red que sigue funcionando. Esta capacidad para adaptarse rápida y fácilmente cuando falla un nodo los hace ideales para cargas de trabajo en las que es fundamental evitar la interrupción del servicio.

Clústeres de equilibrio de carga

Los clústeres de equilibrio de carga, o simplemente equilibradores de carga, garantizan que el trabajo se distribuya de manera equitativa entre los nodos de un clúster. Sin el equilibrio de carga, los nodos se verían desbordados por las tareas que se les asignaran y fallarían con mayor frecuencia. Hay diferentes tipos de equilibrio de carga para diferentes propósitos. Uno de los más famosos, Linux Virtual Server, es gratuito y de código abierto, y se utiliza para desarrollar servidores de alto rendimiento y alta disponibilidad basados en tecnología de clústeres.

Clústeres de computación de alto rendimiento

Los clústeres HPC son una red de potentes procesadores que pueden procesar conjuntos de datos multidimensionales masivos, también conocidos como big data, a una velocidad extremadamente alta. Requieren redes de alta potencia y latencia ultrabaja para mover archivos entre nodos.

A diferencia de los clústeres de equilibrio de carga y alta disponibilidad, los clústeres HPC tienen más potencia de procesamiento y están especialmente diseñados para el análisis de datos, como el diagnóstico de enfermedades, el análisis de grandes cantidades de datos financieros y la secuenciación de genomas. Además, los clústeres HPC utilizan Message Passing Interface (MPI), un protocolo para arquitecturas informáticas paralelas que permite la comunicación entre nodos.

Clústeres de inteligencia artificial

Los clústeres de IA son clústeres de cómputo construidos especialmente para cargas de trabajo de IA y ML, como el reconocimiento facial y de voz, el procesamiento de lenguaje natural (PLN) y la conducción autónoma. Los clústeres de IA están especialmente diseñados para los algoritmos en los que se entrenan los modelos de IA.

Casos de uso de la computación en clúster

Los clústeres informáticos tienen una amplia gama de usos. Desde aplicaciones como la computación en la nube y el analytics de datos, hasta software que ayuda a crear efectos especiales en 3D para las películas, aquí hay algunos ejemplos:

Analytics de big data

La computación en clúster puede procesar grandes volúmenes de datos de forma rápida y eficiente, lo que la convierte en una herramienta ideal para el análisis de big data. Desde el potente motor de búsqueda de Google hasta el software que analiza el mercado de valores y el análisis de sentimientos en las redes sociales, las aplicaciones de la computación en clúster en el espacio de analytics de datos son excelentes y variadas.

Gráficos 3D

Las capacidades de procesamiento paralelo de la computación en clúster potencian los gráficos más avanzados en videojuegos y películas. Mediante un clúster de nodos independientes, cada uno con su propia unidad de procesamiento gráfico (GPU), la representación informática en clúster (o representación en clúster) genera una imagen única calibrada en varias pantallas. Este proceso reduce considerablemente la cantidad de tiempo que lleva crear imágenes 3D de alta calidad.

Inteligencia artificial y machine learning

En las cargas de trabajo de IA y ML, la computación en clúster ayuda a procesar y analizar grandes conjuntos de datos de forma rápida y precisa, lo cual es esencial para el entrenamiento de potentes modelos de IA que impulsan aplicaciones populares como ChatGPT.

Análisis de riesgos

Las compañías de seguros y las empresas de comercio financiero utilizan la computación en clúster para analizar datos y cuantificar los riesgos de comprar determinadas acciones o proporcionar seguros a determinados clientes. La computación en clúster se utiliza para analizar big data y extraer insights significativos que se pueden utilizar para tomar decisiones comerciales más informadas.

Soluciones relacionadas
IBM Spectrum LSF Suites 

La suite IBM Spectrum LSF es una plataforma de gestión de carga y programación de trabajos para computación distribuida de alto rendimiento (HPC).

Explorar las suites de Spectrum LSF
Soluciones de almacenamiento y servidor de computación de alto rendimiento (HPC) | IBM

Las soluciones HPC de nube híbrida de IBM ayudan a abordar desafíos a gran escala y de uso intensivo de cómputo y aceleran el tiempo de obtención de insights.

Explorar las soluciones HPC
Soluciones de infraestructura en la nube

Encuentre una solución de infraestructura en la nube que sea adecuada para las necesidades de su negocio y escale los recursos bajo demanda.

Soluciones en la nube
Dé el siguiente paso

Potencie sus cargas de trabajo de IA y computación intensivas más exigentes con las soluciones HPC de IBM. Aproveche la flexibilidad de la nube híbrida y la infraestructura de vanguardia para acelerar su camino hacia la innovación.

Explore las soluciones HPC