¿Qué es una unidad de procesamiento gráfico (GPU)?

6 de enero de 2025

Autores

Mesh Flinders

Author, IBM Think

Ian Smalley

Senior Editorial Strategist

¿Qué es una unidad de procesamiento gráfico (GPU)?

Una unidad de procesamiento de gráficos (unidad gráfica de procesamiento, GPU) es un circuito electrónico diseñado para acelerar los gráficos por computadora y el procesamiento de imágenes en varios dispositivos. Estos dispositivos incluyen tarjetas de video, placas de sistema, teléfonos móviles y computadoras personales (PC).

Al realizar cálculos matemáticos rápidamente, una GPU reduce el tiempo que necesita una computadora para ejecutar múltiples programas. Esto lo convierte en un facilitador esencial de tecnologías emergentes y futuras, como el machine learning (ML)la inteligencia artificial (IA) y el blockchain.

Antes de la invención de las GPU en la década de 1990, los controladores gráficos en las computadoras personales y en los controladores de juegos de video dependían de la unidad central de procesamiento (CPU) de una computadora para ejecutar tareas. Desde principios de la década de 1950, las CPU han sido los procesadores más importantes de una computadora, ya que ejecutan todas las instrucciones necesarias para ejecutar programas, como lógica, control y entrada/salida (E/S).

Sin embargo, con la llegada de los juegos personales y el diseño asistido por computadora (CAD) en la década de 1990, la industria necesitaba una manera más rápida y eficiente de combinar píxeles rápidamente.

En 2007, Nvidia creó CUDA™ (Compute Unified Device Architecture), una plataforma de software e interfaz de programación de aplicaciones (API) que brindaba a los desarrolladores acceso directo a las capacidades de computación paralela de las GPU, lo que les permitía utilizar la tecnología de GPU para una gama más amplia de funciones que antes.

En la década de 2010, la tecnología de GPU adquirió aún más capacidades, quizás el más significativo fue el trazado de rayos (la generación de imágenes de computadora al rastrear la dirección de la luz de una cámara) y los núcleos tensoriales (diseñados para permitir aprendizaje profundo).

Gracias a estos avances, las GPU han desempeñado un papel crucial en la aceleración de la IA y los procesadores de aprendizaje profundo, lo que ha ayudado a acelerar el desarrollo de aplicaciones de IA y ML. Hoy en día, además de impulsar las consolas de juegos y el software de edición, las GPU potencian funciones informáticas de vanguardia críticas para muchas empresas.

¿Cómo funciona una GPU?

Una GPU tiene su propia memoria de acceso rápido (RAM), una memoria electrónica que se utiliza para almacenar códigos y datos a los que el chip puede acceder y modificar según sea necesario. Las GPU avanzadas suelen tener RAM diseñada específicamente para contener grandes volúmenes de datos requeridos para tareas de computación intensiva, como la edición de gráficos, juegos o casos de uso de IA/ML.

Dos tipos populares de memoria GPU son Graphics Double Data Rate 6 Synchronous Dynamic Random-Access Memory (GDDR6) y GDDR6X, una generación posterior. GDDR6X emplea un 15 % menos de energía por bit transferido que GDDR6, pero su consumo total de energía es mayor porque es más rápido. Las iGPU pueden integrar en la CPU de una computadora o insertar en una ranura junto a ella y conectarse mediante un puerto PCI Express.

¿Cuál es la diferencia entre una GPU y una CPU?

Las CPU y las GPU comparten un diseño similar, que incluye un número similar de núcleos y transistores para procesar tareas, pero las CPU son más polivalentes en sus funciones que las GPU. Las GPU suelen centrarse en una tarea informática única y específica, como el procesamiento de gráficos o el machine learning.

Las CPU son el corazón y el cerebro de un sistema o dispositivo informático. Reciben instrucciones generales o solicitudes relacionadas con una tarea de un programa o aplicación de software. Por otro lado, una GPU tiene una tarea más específica, que generalmente implica el procesamiento rápido de imágenes y videos de alta resolución. Las GPU realizan constantemente cálculos matemáticos complejos necesarios para representar gráficos u otras funciones de uso intensivo de cómputo para realizar su tarea.

Una de las mayores diferencias es que las CPU tienden a usar menos núcleos y realizan sus tareas en un orden lineal. Sin embargo, las GPU tienen cientos, incluso miles, de núcleos, lo que permite el procesamiento paralelo que impulsa sus capacidades de procesamiento ultrarrápido.

Las primeras GPU se crearon para acelerar el procesamiento de gráficos en 3D, lo que hace que las escenas de películas y videojuegos parezcan más realistas y atractivas. El primer chip GPU, GeForce de Nvidia, salió al mercado en 1999 y fue seguido por un rápido periodo de crecimiento en el que las capacidades de la GPU se expandieron a otras áreas gracias a su rápido procesamiento paralelo.

El procesamiento paralelo, o computación paralela, es un tipo de computación que se basa en dos o más procesadores para realizar diferentes subconjuntos de una tarea informática general.

Antes de las GPU, las computadoras de generaciones anteriores solo podían ejecutar un programa a la vez, a menudo tardando horas en completar una tarea. La función de procesamiento paralelo de las GPU realiza muchos cálculos o tareas simultáneamente, lo que las hace más rápidas y eficientes que las CPU de las computadoras más antiguas.

Vista aérea de una autopista

Mantenga su cabeza en la nube


Reciba el boletín semanal Think para obtener orientación de expertos sobre cómo optimizar la configuración multinube en la era de la IA.

¿Cuáles son los diferentes tipos de GPU?

Hay tres tipos de GPU:

  • GPU discretas
  • GPU integradas
  • GPU virtuales

GPU discretas

Las GPU discretas, o dGPU, son procesadores gráficos que están separados de la CPU de un dispositivo, donde se toma y procesa la información, lo que permite que una computadora funcione. Las GPU discretas se utilizan típicamente en aplicaciones avanzadas con requisitos especiales, como la edición, la creación de contenido o los juegos de alto nivel. Son chips distintos con conectores a placas de circuitos separadas y unidos a la CPU mediante un slot expreso.

Una de las GPU discretas más utilizadas es la marca Intel Arc, construida para la industria de los juegos de PC.

GPU integradas

Una GPU integrada, o iGPU, está integrada en la infraestructura de una computadora o dispositivo y, por lo general, se coloca junto a la CPU. Diseñadas en la década de 2010 por Intel, las GPU integradas se hicieron más populares a medida que fabricantes como MSI, ASUS y Nvidia notaron el poder de combinar las GPU con las CPU en lugar de requerir que los usuarios agregaran las GPU a través de una ranura PCI Express. Sigue siendo una opción popular para los usuarios de computadoras portátiles, jugadores y otras personas que ejecutan programas de uso informático intensivo en sus PC.

GPU virtuales

Las GPU virtuales, o vGPU, tienen las mismas capacidades que las GPU discretas o integradas, pero sin el hardware. Son versiones basadas en software de GPUs creadas para instancias en la nube y se pueden usar para ejecutar las mismas cargas de trabajo. Además, debido a que no tienen hardware, son más simples y baratos de mantener que sus contrapartes físicas.

Academia de IA

Cómo lograr la preparación para la IA con la nube híbrida

Dirigido por los principales líderes de opinión de IBM, el plan de estudios está diseñado para ayudar a los líderes empresariales a obtener los conocimientos necesarios para priorizar las inversiones en IA que pueden impulsar el crecimiento.

¿Qué es una GPU en la nube?

Una GPU en la nube hace referencia al acceso a una GPU virtual por parte de un proveedor de servicios en la nube (CSP). En los últimos años, el mercado de servicios de GPU basados en la nube creció, impulsado por el aceleramiento de la computación en la nube y la creciente adopción de aplicaciones basadas en IA/machine learning (ML). En un reporte de Fortune Business Insights, se prevé que el mercado de la GPU como servicio (GPUaaS), valorado en 3.230 millones de dólares en 2023, crezca de 4.310 millones de dólares en 2024 a 49.840 millones de dólares en 2032. 1

Muchos CSP, incluidos Google plataforma en la nube, Amazon Web Services (AWS), Microsoft e IBM Cloud, ofrecen acceso bajo demanda a servicios Escalable de GPU para optimizar el rendimiento de la carga de trabajo. Los CSP proporcionan recursos de GPU virtualizados de pago por uso en sus centros de datos. Suelen emplear hardware de GPU de los principales fabricantes de GPU, como Nvidia, AMD e Intel, para alimentar su infraestructura basada en la nube.

Las ofertas de GPU basadas en la nube suelen venir con configuraciones previas y se pueden desplegar fácilmente. Estas características ayudan a las organizaciones a evitar los costos iniciales y el mantenimiento asociados con las GPU físicas. Además, a medida que las empresas buscan integrar cargas de trabajo de IA generativa para realizar tareas computacionales avanzadas (por ejemplo, creación de contenido, generación de imágenes), la escalabilidad y rentabilidad proporcionadas por las GPU basadas en la nube se han vuelto cruciales para los negocios empresariales.

¿Qué son los puntos de referencia de GPU?

Los puntos de referencia de GPU proporcionan un proceso para evaluar el rendimiento de GPU en diversas condiciones. Estas herramientas de software especializadas permiten a los usuarios (por ejemplo, jugadores, artistas 3D, desarrolladores de sistemas) obtener insights sobre sus GPU y abordar problemas de rendimiento, como cuellos de botella, latencia y compatibilidad con otro software y hardware.

Hay dos tipos principales de puntos de referencia de GPU: puntos de referencia sintéticos y del mundo real. Los puntos de referencia sintéticos prueban el rendimiento bruto de una GPU en un entorno estandarizado. Los puntos de referencia del mundo real prueban el rendimiento de una GPU en aplicaciones específicas.

Las herramientas de evaluación comparativa de GPU analizan métricas de rendimiento como velocidades, velocidades de cuadros y ancho de banda de memoria. También analizan la eficiencia térmica y el uso de energía para ayudar a los usuarios a lograr un rendimiento óptimo en función de sus necesidades específicas. Algunas plataformas de punto de referencia de GPU también incorporan pruebas que miden qué tan bien una unidad de estado sólido (SSD) interactúa con una GPU.

Casos de uso de GPU modernas

A medida que las GPU se fueron desarrollando con el tiempo, las mejoras técnicas las hicieron más programables y se descubrieron más capacidades. En concreto, su capacidad para dividir las tareas entre más de un procesador, procesamiento paralelo, las hizo indispensables para una amplia gama de aplicaciones, como los juegos de PC, la informática de alto rendimiento (HPC), las estaciones de trabajo de renderizado 3D, la informática de centros de datos y muchas otras.

He aquí un vistazo más de cerca a algunas de las aplicaciones más importantes y modernas de la tecnología de GPU, que incluyen:

  • Inteligencia artificial
  • Machine learning (ML) y aprendizaje profundo (DL)
  • Blockchain
  • Dispositivo de juegos
  • Edición de video
  • Creación de contenido
  • Computación de alto rendimiento (HPC)
  • Visualización y simulación
Inteligencia artificial

Podría decirse que la IA y sus múltiples aplicaciones serían imposibles sin la computación GPU. La capacidad de las GPU para resolver problemas altamente técnicos de manera más rápida y eficiente que las CPU tradicionales las hace indispensables. Las GPU son componentes cruciales de muchas supercomputadoras, particularmente de las supercomputadoras de IA.

Las GPU potencian muchas aplicaciones líderes de IA, como la supercomputadora de IA nativa de la nube de IBM Velaque requieren altas velocidades para entrenar en conjuntos de datos cada vez más grandes. Los modelos de IA se entrenan y ejecutan en GPU de centros de datos, generalmente operadas por empresas que realizan investigaciones científicas u otras tareas de uso informático intensivo.

Aprendizaje automático (ML) y aprendizaje profundo (DL)

El machine learning (ML) se refiere a una disciplina específica de IA que se ocupa del uso de datos y algoritmos para imitar la forma en que aprenden los humanos. El aprendizaje profundo, o DL, es un subconjunto de ML que utiliza redes neuronales para simular el proceso de toma de decisiones del cerebro humano. La tecnología de GPU es crítica para ambas áreas de avance tecnológico.

Cuando se trata de ML y DL, las GPU potencian la capacidad de los modelos para clasificar conjuntos de datos masivos y hacer inferencias a partir de ellos de manera similar a los humanos. Las GPU mejoran específicamente las áreas de memoria y optimización porque pueden realizar múltiples cálculos al mismo tiempo. Además, las GPU empleadas en ML y DL emplean menos recursos que las CPU sin disminuir la potencia o la precisión.

Blockchain

Blockchain, el libro mayor utilizado para registrar transacciones y rastrear activos en redes empresariales, depende en gran medida de la tecnología GPU, especialmente cuando se trata de un paso llamado "prueba de trabajo"En muchas Blockchain ampliamente utilizadas, como las criptomonedas, el paso de prueba de trabajo es vital para la validación de una transacción, lo que permite agregarla a la Blockchain.

Dispositivo de juegos

La industria de los videojuegos aprovechó por primera vez la potencia de las GPU en la década de 1990 para mejorar la experiencia general de juego con más velocidad y precisión gráfica. Hoy en día, los juegos personales son altamente exigentes en términos de procesamiento debido a escenarios hiperrealistas, interacciones en tiempo real y mundos de juego vastos e inmersivos.

Las tendencias en los juegos, como la realidad virtual (RV), las mayores frecuencias de actualización y las pantallas de mayor resolución dependen de las GPU para ofrecer gráficos con rapidez en entornos informáticos más exigentes. Las GPU para juegos incluyen AMD Radeon, Intel Arc y Nvidia GeForce RTX.

Edición de video

Tradicionalmente, los largos tiempos de representación han sido un obstáculo significativo en las aplicaciones de software de edición tanto para el consumidor como para las profesionales. Desde su invención, las GPU han reducido constantemente los tiempos de procesamiento y los recursos informáticos en productos de edición de video como Final Cut Pro y Adobe Premiere.

Hoy en día, las GPU equipadas con procesamiento paralelo e IA incorporada aceleran significativamente las capacidades de edición para todo, desde suites de edición profesionales hasta aplicaciones para teléfonos inteligentes.

Creación de contenido

Las mejoras en el procesamiento, el rendimiento y la calidad de los gráficos hicieron que las GPU sean esenciales para transformar la industria de creación de contenido. Hoy en día, los creadores de contenido equipados con una tarjeta gráfica de alto rendimiento e Internet de alta velocidad pueden generar contenido realista, aumentarlo con IA y machine learning, y editarlo y transmitirlo a una audiencia en vivo más rápido que nunca, todo en gran medida gracias a los avances en la tecnología de GPU.

Computación de alto rendimiento

En los sistemas HPC, las GPU utilizan capacidades de procesamiento paralelo para acelerar tareas computacionalmente intensivas, como cálculos matemáticos complejos y análisis de grandes datos en campos como el descubrimiento de fármacos, la producción de energía y la astrofísica.

Visualización y simulación

Las GPU tienen una gran demanda en muchas industrias para mejorar la experiencia y las capacidades de entrenamiento de aplicaciones profesionales complejas, como los tutoriales de productos, los dibujos de CAD y las imágenes médicas e sísmicas o geofísicas. Las GPU son críticas en las visualizaciones avanzadas (p. ej., entrenamiento profesional de bomberos, astronautas, maestros) con animación 3D, IA y ML, representación avanzada y experiencias de realidad virtual (VR) y realidad aumentada (AR) hiperrealistas.

Asimismo, ingenieros y científicos especializados en climatología emplean aplicaciones de simulación basadas en GPU para predecir las condiciones meteorológicas, la dinámica de fluidos, la astrofísica y el comportamiento de los vehículos en determinadas condiciones. La Nvidia RTX es una de las GPU más poderosas disponibles para la visualización científica y la exploración energética.

GPU, NPU y FPGA

Con la proliferación de aplicaciones de IA y gen IA, merece la pena examinar otros dos dispositivos de procesamiento especializado y su comparación con la GPUS. Las compañías actuales emplean los tres tipos de procesadores (CPU, GPU y FPGA) en función de sus necesidades específicas.

¿Qué es una unidad de procesamiento neural (NPU)?

Una unidad de procesamiento neuronal (NPU) es un microprocesador informático especializado diseñado para imitar la función de procesamiento del cerebro humano. También conocido como acelerador de IA,  chip de IA o procesador de aprendizaje profundo, una NPU es un acelerador de hardware creado para acelerar las redes neuronales de IA, el aprendizaje profundo y el machine learning.  

Tanto las NPU como las GPU mejoran la CPU de un sistema, aunque presentan notables diferencias. Las GPU contienen miles de núcleos para realizar las tareas de cálculo rápidas y precisas necesarias para el renderizado de gráficos y los juegos. Las NPU están diseñadas para acelerar las cargas de trabajo de IA y gen IA, priorizando el flujo de datos y la jerarquía de memoria en tiempo real, con bajo consumo y latencia.

¿Qué es una matriz de puertas programables en campo (FPGA)?

Las GPU de alto rendimiento son adecuadas para aplicaciones de aprendizaje profundo o IA, ya que pueden manejar un gran volumen de cálculos en múltiples núcleos con grandes cantidades de memoria disponible. Las matrices de puertas programables en campo (FPGA) son tipos versátiles de circuitos integrados que pueden reprogramar para diferentes funciones. En comparación con las GPUS, las FPGA pueden proporcionar flexibilidad y rentabilidad para ofrecer un mejor rendimiento en aplicaciones de aprendizaje profundo que requieren baja latencia, como imágenes médicas y computación edge.

Notas de pie de página

Todos los enlaces se encuentran fuera de IBM.

1 GPU as a Service Market Size, Share & Industry Analysis, Fortune Business Insights, Fortune Business Insights, 9 de diciembre de 2024

Soluciones relacionadas
Servicios de consultoría en la nube

Utilice nuestros servicios en la nube, impulsados por nuestra plataforma IBM Consulting Advantage, para acelerar su transición hacia la nube híbrida, generar rentabilidad, aumentar la productividad y la sostenibilidad y acelerar el tiempo de comercialización.

Conozca los servicios de nube
Soluciones de alojamiento en servidores dedicados

El alojamiento en servidores dedicados de IBM proporciona aislamiento, control y seguridad totales para cargas de trabajo de misión crítica con opciones personalizables.

Explorar las soluciones de servidores dedicados
IBM Cloud Virtual Server for VPC

IBM Cloud Virtual Server for VPC es una familia de servidores virtuales Intel x86, IBM Z e IBM LinuxONE creados en IBM Cloud Virtual Private Cloud.

Explorar Cloud Virtual Server
Dé el siguiente paso

Potencie su presencia web con soluciones de alojamiento web fiables y seguras de IBM Cloud. Desde sitios web con mucho tráfico hasta aplicaciones empresariales, IBM Cloud Bare Metal Servers ofrece flexibilidad, transferencia de datos ilimitada y un alcance global adaptado a sus necesidades de alojamiento.

Explorar el alojamiento web de IBM Cloud Cree su cuenta gratuita de IBM Cloud