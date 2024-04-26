Las empresas que operan en dominios especializados, como las operadoras de telecomunicaciones, la sanidad o las empresas de petróleo y gas, tienen un enfoque muy específico. Aunque pueden beneficiarse y se benefician de los escenarios y casos de uso típicos de la IA generativa, les convendría más utilizar modelos más pequeños.

En el caso de las empresas de telecomunicaciones, por ejemplo, algunos de los casos de uso comunes son asistentes de IA en centros de contacto, ofertas personalizadas en la prestación de servicios y chatbots con IA para una experiencia del cliente mejorada. Los casos de uso que ayudan a las empresas de telecomunicaciones a mejorar el rendimiento de su red, aumentar la eficiencia espectral en redes 5G o a identificar cuellos de botella específicos en su red se sirven mejor con los propios datos de la empresa (en lugar de un LLM público).

Esto nos lleva a la idea de que cuanto más pequeño, mejor. En la actualidad existen modelos de lenguaje pequeños (SLM) que son “más pequeños” en tamaño en comparación con los LLM. Los SLM se entrenan con decenas de miles de millones de parámetros, mientras que los LLM se entrenan con cientos de miles de millones de parámetros. Más importante aún, los SLM se entrenan con datos relacionados con un dominio específico. Es posible que no tengan información contextual amplia, pero funcionan muy bien en el dominio elegido.

Debido a su menor tamaño, estos modelos pueden alojarse en el centro de datos de una empresa en lugar de en la nube. Los SLM podrían incluso funcionar en un único chip de GPU a escala, lo que supondría un ahorro de miles de dólares en costes anuales de computación. Sin embargo, la delimitación entre lo que solo se puede ejecutar en una nube o en un centro de datos empresarial se vuelve menos clara con los avances en el diseño de chips.

Ya sea por costes, privacidad o soberanía de datos, las empresas podrían querer ejecutar estos SLM en sus centros de datos. A la mayoría de las empresas no les gusta enviar sus datos a la nube. Otra razón clave es el rendimiento. La IA generativa en el edge realiza el cálculo y la inferencia lo más cerca posible de los datos, lo que lo hace más rápido y seguro que a través de un proveedor de servicios en la nube.

Cabe señalar que los SLM requieren menos potencia de cálculo y son ideales para su implementación en entornos con recursos limitados e incluso en dispositivos móviles.

Un ejemplo on-premises podría ser una ubicación de IBM® Cloud Satellite, que tiene una conexión segura de alta velocidad a IBM Cloud que aloja los LLM. Las empresas de telecomunicaciones podrían alojar estos SLM en sus estaciones base y ofrecer esta opción también a sus clientes. Todo es cuestión de optimizar el uso de las GPU, ya que la distancia que deben recorrer los datos disminuye, lo que se traduce en una mejora del ancho de banda.