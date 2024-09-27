En el mundo de la informática clásica, la unidad central de procesamiento (CPU) se considera el "cerebro" de la computadora. La CPU procesa la mayoría de las tareas informáticas tradicionales y es responsable de una amplia gama de aplicaciones potenciales. Si bien hay muchos tipos diferentes, generalmente todas las CPU realizan operaciones en orden lineal, respondiendo a las solicitudes en el orden en que llegan.

Desde la década de 1950 hasta la de 1990, las CPU soportaron la peor parte de prácticamente todo el procesamiento informático, ejecutando instrucciones para ejecutar programas, controlar sistemas y gestionar entradas/salidas (E/S).

Las aplicaciones exigentes llevaron regularmente generación tras generación de diseños de CPU a sus límites de hardware, lo que a menudo provocó una ralentización significativa o incluso fallas del sistema. Pero con la llegada de los juegos de computadora personal y el diseño asistido por computadora (CAD) en la década de 1980, la industria requirió una solución más rápida y eficiente para renderizar gráficos por computadora.

La unidad de procesamiento de gráficos (GPU) se creó inicialmente para descargar tareas exigentes de procesamiento de imágenes de la CPU principal. Si bien las GPU tienden a usar menos núcleos para realizar operaciones lineales, las GPU cuentan con cientos o miles de núcleos con la característica de realizar procesamiento paralelo, un proceso en el que las tareas grandes se dividen en problemas más pequeños que pueden resolverse simultáneamente mediante múltiples procesadores y/o núcleos.

Inicialmente desarrollado para manejar las necesidades de procesamiento de video e imágenes, las capacidades de procesamiento paralelo de las GPU han hecho que el hardware sea especialmente adecuado para otras aplicaciones informáticas exigentes, como las tareas relacionadas con blockchain y la IA. Si bien las GPU no son el único tipo de procesador capaz de realizar procesamiento paralelo o computación paralela, son muy adecuadas para el paralelismo. Sin embargo, las GPU no están exentas de limitaciones y, por lo general, requieren un consumo de energía extremadamente costoso para ejecutar operaciones más exigentes. Con las GPU, un mayor rendimiento conlleva un mayor costo de energía.

Las NPU y otros aceleradores de IA ofrecen alternativas más eficientes. Al incorporar y mejorar el paralelismo avanzado de las GPU, las NPU diseñadas específicamente para operaciones de IA proporcionan un alto rendimiento con un menor consumo de energía (y la ventaja adicional de una footprint más pequeña).