Minha IBM Faça login Inscreva-se

O que é uma unidade de processamento gráfico (GPU)?

6 de janeiro de 2025

Autores

Mesh Flinders

Author, IBM Think

Ian Smalley

Senior Editorial Strategist

O que é uma unidade de processamento gráfico (GPU)?

Uma unidade de processamento gráfico (GPU) é um circuito eletrônico projetado para acelerar o processamento de imagens e gráficos de computador em vários dispositivos. Esses dispositivos incluem placas de vídeo, placas de sistema, telefones móveis e computadores pessoais (PCs).

Ao realizar cálculos matemáticos rapidamente, uma GPU reduz o tempo necessário para um computador executar vários programas. Isso a torna um facilitador essencial de tecnologias emergentes e futuras, como aprendizado de máquina (ML)inteligência artificial (IA)blockchain.

Antes da invenção das GPUs na década de 1990, os controladores gráficos em PCs e em controladores de videogames dependiam da unidade central de processamento (CPU) de um computador para executar tarefas. Desde o início da década de 1950, as CPUs têm sido os processadores mais importantes em um computador, executando todas as instruções necessárias para executar programas, como lógica, controle e entrada/saída (E/S).

Entretanto, com o advento dos jogos pessoais e do projeto auxiliado por computador (CAD) na década de 1990, o setor necessitava de uma maneira mais rápida e eficiente de combinar pixels rapidamente.

Em 2007, a Nvidia criou o CUDA (Compute Unified Device Architecture), uma plataforma de software e interface de programação de aplicativos (API) que deu aos desenvolvedores acesso direto às capacidades de computação paralela das GPUs, permitindo que elas usassem a tecnologia de GPU para uma gama maior de funções do que antes.

Na década de 2010, a tecnologia de GPU ganhou ainda mais recursos, talvez o mais significativo sendo o traçado de raios (a geração de imagens de computador rastreando a direção da luz a partir de uma câmera) e núcleos tensores (projetados para permitir o deep learning).

Devido a esses avanços, as GPUs têm desempenhado papéis importantes na aceleração de IA e nos processadores de deep learning, ajudando a acelerar o desenvolvimento de aplicações de IA e ML. Atualmente, as GPUs não apenas impulsionam consoles de jogos e softwares de edição, como também funções de computação de ponta críticas para diversas empresas.

Como funciona uma GPU?

Uma GPU tem sua própria memória de acesso rápido (RAM), uma memória eletrônica usada para armazenar código e dados que o chip pode acessar e alterar conforme a necessidade. As GPUs avançadas normalmente têm RAM construída para armazenar os grandes volumes de dados necessários para tarefas com uso intenso de computação, como edição de gráficos, jogos ou casos de uso de IA/ML.

Dois tipos populares de memória de GPU são a Graphics Double Data Rate 6 Synchronous Dynamic Random-Access Memory (GDDR6) e a GDDR6X, uma geração posterior. A GDDR6X consome 15% menos energia por bit transferido do que a GDDR6, mas seu consumo geral de energia é maior, pois ela é mais rápida. As iGPUs podem ser integradas à CPU de um computador ou inseridas em um slot ao lado dela e conectadas por meio de uma porta PCI Express.

Qual é a diferença entre uma GPU e uma CPU?

CPUs e GPUs compartilham um projeto semelhante, incluindo um número semelhante de núcleos e transistores para tarefas de processamento, mas as funções das CPUs são mais gerais do que as das GPUs. As GPUs tendem a se concentrar em uma única tarefa de computação específica, como processamento gráfico ou aprendizado de máquina.

As CPUs são o coração e o cérebro de um sistema ou dispositivo computacional. Elas recebe instruções ou solicitações gerais relacionadas a uma tarefa de um programa ou aplicação de software. E a GPU tem uma tarefa mais específica — que normalmente envolve o processamento rápido de imagens e vídeos de alta resolução. As GPUs executam constantemente cálculos matemáticos complexos necessários para renderizar gráficos ou outras funções com uso intenso de computação a fim de cumprir sua tarefa.

Uma das maiores diferenças é que as CPUs tendem a usar menos núcleos e executar suas tarefas em uma ordem linear. As GPUs, no entanto, têm centenas (até milhares) de núcleos, permitindo o processamento paralelo que impulsiona seus recursos de processamento extremamente rápido.

As primeiras GPUs foram criadas para acelerar a renderização de gráficos 3D, tornando as cenas de filmes e videogames mais realistas e envolventes. O primeiro chip de GPU, o GeForce da Nvidia, foi lançado em 1999 e foi rapidamente seguido por um rápido período de crescimento que viu as capacidades das GPUs se expandirem para outras áreas devido a seus recursos de processamento paralelo em alta velocidade.

Processamento paralelo, ou computação paralela, é um tipo de computação que depende de dois ou mais processadores para realizar diferentes subconjuntos de uma tarefa de computação geral.

Antes das GPUs, os computadores de gerações mais antigas só conseguiam executar um programa de cada vez, muitas vezes levando horas para concluir uma tarefa. A função de processamento paralelo das GPUs executa muitos cálculos ou tarefas simultaneamente, tornando-as mais rápidas e eficientes do que as CPUs dos computadores mais antigos.

Vista aérea de rodovias

Fique por dentro da nuvem 


Receba o boletim informativo semanal do Think para ver orientações especializadas sobre a otimização das configurações multinuvem na era da IA.

Quais são os diferentes tipos de GPUs?

Há três tipos de GPUs:

  • GPUs discretas
  • GPUs integradas
  • GPUs virtuais

GPUs discretas

As GPUs discretas, ou dGPUs, são processadores gráficos separados da CPU de um dispositivo, onde as informações são recebidas e processadas, permitindo que o computador funcione. As GPUs discretas normalmente são usadas em aplicações avançadas com requisitos especiais, como edição, criação de conteúdo ou jogos de última geração. Elas são chips distintos com conectores para separar placas de circuito e conectadas à CPU por meio de um slot expresso.

Uma das GPUs discretas mais usadas é a marca Intel Arc, construída para o setor de jogos para PC.

GPUs integradas

Uma GPU integrada, ou iGPU, é incorporada à infraestrutura de um computador ou dispositivo e normalmente encaixada em um slot ao lado da CPU. Projetadas na década de 2010 pela Intel, as GPUs integradas ganharam popularidade quando fabricantes como MSI, ASUS e Nvidia perceberam o poder de combinar GPUs com CPUs, em vez de exigir que os usuários adicionassem GPUs por meio de um slot PCI Express. Elas continuam sendo uma opção popular para usuários de notebooks, jogadores e outros que executam programas com uso intenso de computação em seus PCs.

GPUs virtuais

GPUs virtuais, ou vGPUs, têm os mesmos recursos que GPUs discretas ou integradas, mas sem o hardware. Elas são versões baseadas em software de GPUs criadas para instâncias de nuvem e podem ser usadas para executar as mesmas cargas de trabalho. Além disso, como não têm hardware, são mais simples e baratas de manter do que seus equivalentes físicos.

AI Academy

Preparando-se para a IA com a nuvem híbrida

Guiado pelos principais líderes da IBM, o conteúdo foi desenvolvido para ajudar líderes empresariais a terem o conhecimento necessário para priorizar os investimentos em IA que podem estimular o crescimento.

O que é uma GPU de nuvem?

Uma GPU de nuvem se refere ao acesso a uma GPU virtual por um provedor de serviço de nuvem (CSP). Nos últimos anos, o mercado de serviços de GPU baseados em nuvem cresceu, impulsionado pela aceleração da computação em nuvem e pelo aumento da adoção de aplicações baseadas em IA/ML. Em um relatório da Fortune Business Insights, projeta-se que o mercado de GPU como serviço (GPUaaS), avaliado em US$ 3,23 bilhões em 2023, cresça de US$ 4,31 bilhões em 2024 para US$ 49,84 bilhões em 2032. 1

Muitos CSPs, incluindo Google Cloud Platform, Amazon Web Services (AWS), Microsoft e IBM Cloud, oferecem acesso sob demanda a serviços de GPU escaláveis para desempenho otimizado das cargas de trabalho. Os CSPs fornecem recursos de GPU virtualizadas pré-pagas em seus data centers. Eles frequentemente usam hardware de GPUs dos principais fabricantes de GPUs, como Nvidia, AMD e Intel, para impulsionar sua infraestrutura baseada na nuvem.

As ofertas de GPUs baseadas na nuvem geralmente vêm com pré-configurações e podem ser implementadas com facilidade. Essas funcionalidades ajudam as organizações a evitar os custos iniciais e a manutenção associados às GPUs físicas. Além disso, como as empresas buscam integrar cargas de trabalho de IA generativa para executar tarefas computacionais avançadas (por exemplo, criação de conteúdo, geração de imagens), a escalabilidade e a economia proporcionadas pelas GPUs baseadas na nuvem se tornaram cruciais para os negócios das empresas.

O que são benchmarks de GPUs?

Os benchmarks de GPUs fornecem um processo para avaliar o desempenho das GPUs sob várias condições. Essas ferramentas de software especializadas permitem que usuários (por exemplo, jogadores, artistas de 3D, desenvolvedores de sistemas) obtenham insights de suas GPUs e lidem com problemas de desempenho, como gargalos, latência e compatibilidade com outros softwares e hardwares.

Existem dois tipos principais de benchmarks de GPUs: benchmarks sintéticos e benchmarks do mundo real. Os benchmarks sintéticos testam o desempenho bruto de uma GPU em um ambiente padronizado. Os benchmarks do mundo real testam o desempenho de uma GPU em aplicações específicas.

As ferramentas de benchmarking de GPUs analisam métricas de desempenho, como velocidades, taxas de quadros e largura de banda de memória. Elas também analisam a eficiência térmica e o uso de energia para ajudar os usuários a obter o desempenho ideal com base em necessidades específicas. Algumas plataformas de benchmarks de GPUs também incorporam testes que medem a qualidade com a qual uma unidade de estado sólido (SSD) interage com uma GPU.

Casos de uso modernos das GPUs

À medida que as GPUs se desenvolveram ao longo do tempo, melhorias técnicas as tornaram mais programáveis e mais recursos foram descobertos. Especificamente, sua capacidade de dividir tarefas em mais de um processador (processamento paralelo) as tornou indispensáveis para uma ampla gama de aplicações, como jogos para PC, computação de alto desempenho (HPC), estações de trabalho de renderização 3D, computação de data center e muitas outras.

Aqui está uma análise mais detalhada de algumas das mais importantes aplicações modernas da tecnologia GPU , incluindo:

  • Inteligência artificial
  • Aprendizado de máquina (ML) e deep learning (DL)
  • Blockchain
  • Jogos
  • Edição de vídeo
  • Criação de conteúdo
  • Computação de alto desempenho (HPC)
  • Visualização e simulação
Inteligência artificial

A IA e suas muitas aplicações seriam impossíveis, segundo alguns, sem a computação de GPUs. A capacidade das GPUs de resolver problemas altamente técnicos de forma mais rápida e eficiente do que as CPUs tradicionais as torna indispensáveis. As GPUs são componentes cruciais de muitos supercomputadores, especialmente para supercomputadores de IA.

As GPUs impulsionam muitas das principais aplicações de IA, como o supercomputador de IA nativo da nuvem da IBM, o Velaque exigem altas velocidades para treinar em conjuntos de dados cada vez maiores. Os modelos de IA treinam e são executados em GPUs de data centers , normalmente operados por empresas que realizam pesquisas científicas ou outras tarefas com uso intenso de computação.

Aprendizado de máquina (ML) e deep learning (DL)

Aprendizado de máquina, ou ML, refere-se a uma disciplina específica da IA relacionada ao uso de dados e algoritmos para imitar a maneira como os seres humanos aprendem. Deep learning, ou DL, é um subconjunto do ML que usa redes neurais para simular o processo de tomada de decisão do cérebro humano. A tecnologia de GPU é crítica para ambas as áreas de avanço tecnológico.

Quando se trata de ML e DL, as GPUs impulsionam a capacidade dos modelos de classificar conjuntos de dados maciços e fazer inferências a partir deles de forma semelhante aos seres humanos. GPUs aprimoram especificamente as áreas de memória e otimização porque podem realizar muitos cálculos simultâneos ao mesmo tempo. Além disso, as GPUs usadas em ML e DL usam menos recursos do que CPUs sem perdas na potência ou precisão.

Blockchain

Blockchain, o livro-razão usado para registrar transações e rastrear ativos em redes de negócios, depende muito da tecnologia de GPU , especialmente quando se trata de uma etapa chamada "prova de trabalho". Em muitas blockchains amplamente utilizadas, como criptomoedas, a etapa de prova de trabalho é vital para a validação de uma transação, permitindo que ela seja adicionada à blockchain.

Jogos

O setor de jogos começou a utilizar o poder das GPUs na década de 1990 para melhorar a experiência geral de jogos com mais velocidade e precisão gráfica. Hoje, os jogos pessoais têm um uso intenso de computação por causa de cenários hiper-reais, interações em tempo real e mundos de jogo vastos e imersivos.

Tendências de jogos, como realidade virtual (VR), taxas de atualização mais altas e telas com resoluções mais altas, dependem das GPUs para fornecer gráficos rapidamente em ambientes de computação cada vez mais exigentes. As GPUs para jogos incluem AMD Radeon, Intel Arc e Nvidia GeForce RTX.

Edição de vídeo

Tradicionalmente, longos tempos de renderização têm sido um empecilho significativo em aplicações de software de edição profissionais e de consumo. Desde sua invenção, as GPUs reduziram constantemente os tempos de processamento e os recursos de computação em produtos de edição de vídeo, como Final Cut Pro e Adobe Premiere.

Atualmente, GPUs equipadas com processamento paralelo e IA integrada aceleram drasticamente os recursos de edição em tudo, desde pacotes de edição profissionais até aplicativos para smartphones .

Criação de conteúdo

Melhorias no processamento, desempenho e qualidade gráfica tornaram as GPUs essenciais para transformar o setor de criação de conteúdo. Hoje, os criadores de conteúdo equipados com placas gráfica de alto desempenho e internet de alta velocidade podem gerar conteúdo realista, aumentá-lo com IA e aprendizado de máquina e editá-lo e transmiti-lo para uma audiência ao vivo mais rápido do que nunca — tudo graças aos avanços na tecnologia de GPU .

Computação de alto desempenho

Nos sistemas de HPC, as GPUs usam recursos de processamento paralelo para acelerar tarefas computacionalmente intensas, como cálculos matemáticos complexos e grandes análises de dados em campos como descoberta de medicamentos, produção de energia e astrofísica.

Visualização e simulação

GPUs estão em alta demanda em diversos setores para aprimorar a experiência e os recursos de treinamento de aplicações profissionais complexas, como instruções passo a passo de produtos, desenhos CAD e imagens médicas, sísmicas ou geofísicas. As GPUs são críticas em visualizações avançadas (por exemplo, treinamento profissional de bombeiros, astronautas, professores) com animação 3D, IA e ML, renderização avançada e experiências de realidade virtual (VR) e realidade aumentada (AR) hiper-realistas.

Além disso, engenheiros e cientistas climáticos usam aplicações de simulação impulsionadas por GPUs para prever condições climáticas, dinâmica de fluidos, astrofísica e como os veículos se comportam sob determinadas condições. A Nvidia RTX é uma das GPUs mais poderosas disponíveis para visualização científica e exploração de energia.

GPUs versus NPUs versus FPGAs

Com a proliferação de aplicações de IA e IA generativa, vale a pena examinar dois outros dispositivos de processamento especializados e como eles se comparam às GPUS. As empresas atuais usam todos os três tipos de processadores (CPUs, GPUs e FPGAs), dependendo de suas necessidades específicas.

O que é uma unidade de processamento neural (NPU)?

Uma unidade de processamento neural (NPU) é um microprocessador de computador especializado projetado para imitar a função de processamento do cérebro humano. Também conhecida como acelerador de IA,  chip de IA ou processador de deep learning , uma NPU é um acelerador de hardware criado para acelerar redes neurais de IA, deep learning e aprendizado de máquina.  

As NPUs e GPUs aprimoram a CPU de um sistema, mas têm diferenças notáveis. As GPUs contêm milhares de núcleos para realizar as tarefas computacionais rápidas e precisas necessárias para renderização de gráficos e jogos. As NPUs são projetadas para acelerar cargas de trabalho de IA e IA generativa, priorizando o fluxo de dados e a hierarquia de memória em tempo real, com baixo consumo de energia e latência.

O que é uma matriz de portas programáveis em campo (FPGA)?

As GPUs de alto desempenho são bem adequadas para aplicações de deep learning ou IA, pois podem lidar com um grande volume de cálculos em vários núcleos com grandes quantidades de memória disponível. As field programmable gate arrays (FPGAs) são tipos versáteis de circuitos integrados que podem ser reprogramados para diferentes funções. Em comparação com as GPUs, as FPGAs podem oferecer flexibilidade e eficiência de custo para proporcionar melhor desempenho em aplicações de deep learning que exigem baixa latência, como geração de imagens médicas e edge computing.

Notas de rodapé

Todos os links são externos à IBM.

1 GPU as a Service Market Size, Share & Industry Analysis, Fortune Business Insights, Fortune Business Insights, 9 de dezembro de 2024

Soluções relacionadas

Soluções relacionadas

IBM Cloud Virtual Server for VPC

O IBM Cloud Virtual Server for VPC é uma linha de servidores virtuais Intel x86, IBM® Z e IBM LinuxONE construídos na IBM Cloud Virtual Private Cloud.

Explore o virtual server na nuvem
Hospedagem web na nuvem 

Os servidores dedicados da IBM Cloud fornecem uma solução escalável de hospedagem na web com tráfego de backhaul ilimitado e sem custo e amplas opções de personalização.

Explore as soluções de hospedagem na web
Serviços de consultoria em nuvem 

Libere novos recursos e aumente a agilidade dos negócios com os serviços de consultoria em nuvem da IBM. Descubra como cocriar soluções, acelerar a transformação digital e otimizar o desempenho por meio de estratégias de nuvem híbrida e parcerias especializadas.

Serviço de nuvem
Dê o próximo passo

Fortaleça sua presença na web com soluções de hospedagem na web confiáveis e seguras da IBM Cloud. Desde sites de alto tráfego até aplicações corporativas, os IBM Cloud Bare Metal Servers oferecem flexibilidade, transferência ilimitada de dados e alcance global, sob medida para suas necessidades de hospedagem.

Explore a hospedagem na web do IBM Cloud Crie sua conta gratuita na IBM Cloud