¿Qué es la computación acelerada?

Mujer usando una tableta digital en un centro de datos

¿Qué es la computación acelerada?

La computación acelerada se refiere al uso de hardware y software especialmente diseñados para acelerar las tareas informáticas. 

La computación acelerada depende de una amplia gama de hardware y software (también conocidos como aceleradores), incluidas unidades de procesamiento de gráficos (GPU), circuitos integrados específicos de la aplicación (ASIC) y matrices de puertas programables de campo (FPGA). 

Las soluciones de computación acelerada tienen una gran demanda en muchas industrias porque pueden realizar cálculos de manera más rápida y eficiente que las unidades centrales de procesamiento (CPU) tradicionales. A diferencia de las CPU, los aceleradores se basan en la computación paralela, un método de resolución de problemas computacionales en el que las tareas se dividen en problemas más pequeños y se resuelven simultáneamente, en lugar de en serie. 

Debido a sus velocidades de procesamiento de datos, la computación acelerada se volvió crítica para el avance de muchas tecnologías de punta y aplicaciones, incluyendo inteligencia artificial (IA), IA generativa, machine learning (ML) y computación de alto rendimiento (HPC). Hoy en día, es un componente clave de las estrategias de muchas de las empresas tecnológicas más exitosas del mundo, incluidas Google, Amazon Web Services (AWS) y Microsoft.

Aceleradores frente a CPU

El procesamiento central, las unidades o CPU, consisten en varios circuitos electrónicos que ejecutan el sistema operativo (SO) y las aplicaciones de una computadora. Durante muchos años, la CPU sirvió como el cerebro de una computadora, transformando la entrada de datos en salida de información. Sin embargo, a medida que las aplicaciones se volvían más avanzadas, necesitaban procesar los datos de forma más rápida y eficiente de lo que podían gestionar las CPU. Ingrese a los aceleradores y tecnologías de computación acelerada con sus capacidades de procesamiento paralelo, baja latencia y alto rendimiento. Desde la década de 1980, cuando ganaron prominencia, muchos de los mayores avances tecnológicos en informática han dependido de los aceleradores.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

¿Por qué es importante la computación acelerada?

Desde los nuevos videojuegos más emocionantes y las experiencias inmersivas de realidad virtual (VR) hasta ChatGPT, el entrenamiento de modelos de IAel análisis de big data, los aceleradores son una parte esencial de nuestro mundo hiperconectado en rápida evolución. Muchas empresas modernas dependen de aceleradores para impulsar sus aplicaciones y arquitecturas de infraestructura más valiosas, incluyendo computación en la nube, centros de datos, computación de borde y modelos de lenguaje grande (LLM). Por ejemplo, los líderes empresariales y los desarrolladores que buscan explorar la IA generativa están invirtiendo en aceleradores para ayudar a optimizar sus centros de datos y procesar más información más rápido1.

Los aceleradores se usan en una amplia gama de aplicaciones empresariales para acelerar el procesamiento de datos, especialmente a medida que se amplía la cobertura 5G, aumentando las oportunidades de Internet de las cosas (IoT) y computación en el borde. Las aplicaciones de IoT dependen de aceleradores para procesar datos de dispositivos inteligentes como refrigeradores, sensores de flujo de tráfico y más. La computación perimetral puede ofrecer insights más profundos, tiempos de respuesta más rápidos y mejores experiencias del cliente, pero solo con las velocidades de procesamiento que ofrecen los aceleradores.  

Cuando se trata de IA, muchas de sus aplicaciones más avanzadas, como el procesamiento de lenguaje natural (PLN), la visión artificial y el reconocimiento de voz, dependen del poder de la computación acelerada para funcionar. Por ejemplo, las redes neuronales que sustentan muchas aplicaciones de IA de vanguardia necesitan aceleradores de IA para clasificar y agrupar datos a alta velocidad.

Por último, a medida que más empresas buscan formas de transformar digitalmente y acelerar la innovación, las soluciones de computación acelerada ofrecen un costo total de propiedad relativamente bajo. La capacidad de los aceleradores para procesar grandes cantidades de datos de forma rápida y precisa significa que pueden utilizarse en muchas aplicaciones diferentes con el potencial de crear valor empresarial, incluidos chatbots de IA, analytics de datos financieros, computación en la nube y más.

Computación de alto rendimiento

4ª generación de procesadores Intel Xeon Scalable en IBM Cloud

Conozca el compromiso de Intel e IBM con la próxima generación de microarquitectura para la industria de la nube.

¿Cómo funciona la computación acelerada?

La computación acelerada utiliza una combinación de hardware, software y tecnologías de red para ayudar a las empresas modernas a potenciar sus aplicaciones más avanzadas. Los componentes de hardware que son críticos para los aceleradores incluyen GPU, ASIC y FPGA. El software y las interfaces de programación de aplicaciones (API) son igual de importantes, con CUDA y OpenCL desempeñando un papel importante. 

Finalmente, las soluciones de red, como PCI express (PCIe) y NV link, ayudan a las unidades de procesamiento a comunicarse con los dispositivos de memoria y almacenamiento donde se guardan los datos. Aquí hay una mirada más cercana a cómo los aceleradores de hardware, los aceleradores de software y las soluciones de red trabajan juntos para hacer posible la computación acelerada.

Aceleradores de hardware

Los aceleradores de hardware modernos pueden procesar datos significativamente más rápido que las CPU tradicionales debido a sus capacidades de procesamiento paralelo. Sin ellos, muchas de las aplicaciones más importantes de la computación acelerada no serían posibles.

GPU

Las GPU o unidades de procesamiento de gráficos son aceleradores de hardware diseñados para acelerar el procesamiento de imágenes y gráficos por computadora en varios dispositivos, incluidas tarjetas de video, placas del sistema, teléfonos móviles y computadoras personales (PC). Los aceleradores de GPU reducen significativamente la cantidad de tiempo que una computadora necesita para ejecutar múltiples programas. La computación acelerada por GPU se utiliza en una amplia gama de aplicaciones informáticas aceleradas, incluidas la IA y blockchain.

ASIC

Los ASIC o circuitos integrados específicos de la aplicación son aceleradores de hardware creados con un propósito o función específicos, como el aprendizaje profundo, en el caso del acelerador WSE-3 ASIC, considerado uno de los aceleradores de IA más rápidos del mundo2. A diferencia de otros aceleradores de hardware, los ASIC no se pueden reprogramar. Sin embargo, debido a que se construyen con un propósito singular, suelen superar a los aceleradores que se han creado para tareas informáticas de uso más general. Otro ejemplo de un acelerador ASIC es la unidad de procesamiento de tensores (TPU) de Google, que se desarrolló para machine learning (ML) de redes neuronales en el propio software TensorFlow de Google.

FPGA

Los FPGA o matrices de puertas programables en campo son aceleradores de IA altamente personalizables que dependen de conocimientos especializados para ser reprogramados para un propósito específico. A diferencia de otros aceleradores de hardware, los FPGA tienen un diseño único que se adapta a una función específica, que a menudo tiene que ver con el procesamiento de datos en tiempo real. Los FPGA son reprogramables a nivel de hardware, lo que permite un nivel mucho mayor de personalización. A menudo se utilizan en aplicaciones aeroespaciales, IoT y soluciones de redes inalámbricas. 

API y software

Las API y el software desempeñan un papel crítico en el funcionamiento de los aceleradores, ya que interactúan entre el hardware y las redes necesarias para ejecutar aplicaciones aceleradas. 

API

Las API o interfaces de programación de aplicaciones son conjuntos de reglas que permiten que las aplicaciones se comuniquen e intercambien datos. Las API son críticas para la computación acelerada, ya que ayudan a integrar datos, servicios y funcionalidad entre aplicaciones. Simplifican y aceleran el desarrollo de aplicaciones y software al permitir a los desarrolladores integrar datos, servicios y capacidades de otras aplicaciones y permitir que se compartan en toda la organización. Las API ayudan a optimizar el flujo de datos entre los aceleradores de hardware y software y brindan a los desarrolladores acceso a bibliotecas de software que son críticas para el desarrollo de aplicación y software.

CUDA

Compute Unified Device Architecture (CUDA), creada por NVIDIA en 2007, es un software que brinda a los desarrolladores acceso directo a las capacidades de computación paralela de las GPU de NVIDIA. CUDA permite a los programadores utilizar la tecnología de GPU para una gama de funciones mucho más amplia de lo que antes era posible. Desde entonces, sobre la base de lo que CUDA hizo posible, los aceleradores de hardware de GPU han adquirido aún más capacidades, quizás la más significativa es el trazado de rayos, la generación de imágenes de computadora al rastrear la dirección de la luz de una cámara y los núcleos tensoriales que permiten el DL.

OpenCL

OpenCL es una plataforma de código abierto diseñada para computación paralela y admite muchos tipos de aceleradores de hardware, incluidas GPU y FPGA. Su alta compatibilidad la convierte en una herramienta ideal para desarrolladores que necesitan usar diferentes tipos de componentes en sus cargas de trabajo informáticas aceleradas. Algunos ejemplos de casos de uso de OpenCl son los juegos, el modelado 3D y la producción multimedia.

Tecnología de redes

Las tecnologías son críticas para la computación acelerada, permitiendo una comunicación rápida y eficaz entre las diferentes unidades de procesamiento y los dispositivos de memoria y almacenamiento donde se almacenan los datos. Estos son algunos de los diferentes tipos de redes en las que se basa la computación acelerada.

Ethernet

Ethernet es un tipo de tecnología que se utiliza ampliamente para proporcionar una transferencia de datos rápida y flexible entre servidores en un centro de datos (o simplemente entre computadoras que se encuentran en el mismo espacio físico). Si bien está muy extendida y es asequible, no es tan rápida como algunos de los otros tipos de redes, como NVLink o InfiniBand.

PCI Express (PCIe)

PCIe es un bus de expansión de computadora de alta velocidad que conecta dos dispositivos con una fuente de memoria externa. Los aceleradores utilizan PCIe para conectar GPU u otros tipos de aceleradores de hardware a un sistema informático central.

NVLink

NVLink es la tecnología de interconexión de NVIDIA y puede ofrecer un ancho de banda mucho mayor que PCIe. Fue creado para permitir un intercambio de datos altamente eficiente entre GPU y otros dispositivos.

InfiniBand

InfiniBand es una especificación de comunicaciones que define la arquitectura de tejido conmutado en servidores interconectados, almacenamiento u otros dispositivos en un centro de datos. Creada por InfiniBand Trade Association, la tecnología se distingue por su alto rendimiento y baja latencia, lo que la hace ideal para cargas de trabajo de alto rendimiento.

Computer Express Link (CXL)

CXL es un estándar de Interconnect abierta que ayuda a lograr una baja latencia y aumentar el ancho de banda entre las CPU y los aceleradores mediante la combinación de varias interfaces en una única conexión PCIe. 

Casos de uso de computación acelerada

Con la difusión de la Tecnología de IA y la expansión de las redes 5G que permiten velocidades de transferencia rápida de datos, el número de casos de uso de computación acelerada crece cada día. Estos son algunos de los más comunes. 

Inteligencia Artificial (IA)

La inteligencia artificial (IA) y sus numerosas aplicaciones empresariales no serían posibles sin aceleradores como las GPU y los ASIC. Estos dispositivos informáticos acelerados permiten a las computadoras realizar cálculos altamente complejos de manera más rápida y eficiente que las CPU tradicionales. Aceleradores como la supercomputadora de IA nativa de la nube de IBM Vela impulsan muchas aplicaciones líderes de IA que dependen de su capacidad para entrenar modelos de IA con conjuntos de datos cada vez mayores.

Machine learning (ML) y aprendizaje profundo (DL)

Tanto el machine learning (ML) como el aprendizaje profundo (DL), un campo de la IA relacionado con el uso de datos y algoritmos para imitar la forma en que los humanos aprenden y deciden, dependen de las capacidades de procesamiento de datos de los aceleradores. La computación acelerada impulsa el entrenamiento de modelos de aprendizaje profundo que aprenden a hacer inferencias a partir de datos de manera similar a la del cerebro humano. 

Blockchain

Blockchain, el popular libro de contabilidad utilizado para registrar transacciones y rastrear activos en redes empresariales, depende en gran medida de la computación acelerada. Un paso vital llamado Prueba de trabajo (PoW), en el que una transacción se valida y se agrega a una Blockchain, depende de los aceleradores. En las criptomonedas, por ejemplo, PoW significa que cualquier persona con la máquina adecuada puede extraer una criptomoneda, como Bitcoin.

Internet de las cosas (IoT)

Los aceleradores manejan los grandes conjuntos de datos generados por las aplicaciones de Internet de las cosas (IoT) de manera mucho más eficiente que una CPU con capacidades de procesamiento en serie. IoT depende de dispositivos conectados a Internet que recopilan datos constantemente para su procesamiento. Los aceleradores de hardware, como las GPU, ayudan a procesar datos rápidamente para aplicaciones de IoT, como automóviles autónomos y sistemas que monitorean el tráfico y el clima.

Edge computing

Edge computing, un marco de computación distribuida que acerca las aplicaciones empresariales a las fuentes de datos, depende en gran medida de los aceleradores para funcionar. La expansión de la conectividad 5G ha provocado que los conjuntos de datos crezcan exponencialmente. La computación acelerada, con sus capacidades de procesamiento paralelo, ayuda a las empresas a benficiarse de todas las posibilidades de la computación edge, como un tiempo más corto para insight, mejores tiempos de respuesta y un ancho de banda mejorado.

Soluciones relacionadas
IBM Spectrum LSF Suites 

La suite IBM Spectrum LSF es una plataforma de gestión de carga y programación de trabajos para computación distribuida de alto rendimiento (HPC).

Explorar las suites de Spectrum LSF
Soluciones de almacenamiento y servidor de computación de alto rendimiento (HPC) | IBM

Las soluciones HPC de nube híbrida de IBM ayudan a abordar desafíos a gran escala y de uso intensivo de cómputo y aceleran el tiempo de obtención de insights.

Explorar las soluciones HPC
Soluciones de infraestructura en la nube

Encuentre una solución de infraestructura en la nube que sea adecuada para las necesidades de su negocio y escale los recursos bajo demanda.

Soluciones en la nube
Dé el siguiente paso

Potencie sus cargas de trabajo de IA y computación intensivas más exigentes con las soluciones HPC de IBM. Aproveche la flexibilidad de la nube híbrida y la infraestructura de vanguardia para acelerar su camino hacia la innovación.

Explore las soluciones HPC
Notas de pie de página

1. GPU Force los director de sistemas de información (CIO) a repensar el centro de datos, Semana de Información, 23 de abril de 2024.

2. La CPU de IA gigantesca tiene casi un millón de núcleos, Tech Radar, 16 de marzo de 2024.