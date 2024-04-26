Las compañías que operan en dominios especializados, como las operadoras de telecomunicaciones, la sanidad o las compañías de petróleo y gas, tienen un enfoque láser. Aunque pueden y se benefician de los escenarios y casos de uso típicos de IA generativa, les iría mejor con modelos más pequeños.

En el caso de las empresas de telecomunicaciones, por ejemplo, algunos de los casos de uso más comunes son los asistentes de IA en los centros de contacto, las ofertas personalizadas en la prestación de servicios y los chatbots impulsados por IA para una mejor experiencia del cliente. Los casos de uso que ayudan a las empresas de telecomunicaciones a mejorar el rendimiento de su red, aumentar la eficiencia espectral en las redes 5G o ayudarlas a determinar cuellos de botella específicos en su red se resuelven mejor con los propios datos de la empresa (a diferencia de un LLM público).

Esto nos lleva a la idea de que cuanto más pequeño es mejor. Ahora hay modelos de lenguaje pequeño (SLM) que son “más pequeños” en tamaño en comparación con los LLM. Los SLM se entrenan en decenas de miles de millones de parámetros, mientras que los LLM se entrenan en cientos de miles de millones de parámetros. Más importante aún, los SLM se entrenan con datos pertenecientes a un dominio específico. Es posible que no tengan información contextual amplia, pero se desempeñan muy bien en el dominio elegido.

Debido a su menor tamaño, estos modelos pueden alojarse en el centro de datos de una empresa en lugar de en la nube. Los SLM podrían incluso funcionar a escala con un solo chip de GPU, lo que supondría un ahorro de miles de dólares en costos anuales de computación. Sin embargo, la delimitación entre lo que solo se puede ejecutar en una nube o en un centro de datos empresarial se vuelve menos clara con los avances en el diseño de chips.

Ya sea por el costo, la privacidad de datos o la soberanía de los datos, es posible que las empresas deseen ejecutar estos SLM en sus centros de datos. A la mayoría de las empresas no les gusta enviar sus datos a la nube. Otra razón clave es el rendimiento. La IA generativa en el edge realiza el cálculo y la inferencia lo más cerca posible de los datos, lo que lo hace más rápido y seguro que a través de un proveedor de la nube.

Vale la pena señalar que los SLM requieren menos potencia computacional y son ideales para despliegue en entornos con recursos limitados e incluso en dispositivos móviles.

Un ejemplo on premises podría ser una ubicación de IBM Cloud Satellite que tiene una conexión segura de alta velocidad a IBM Cloud que aloja los LLM. Las empresas de telecomunicaciones podrían alojar estos SLM en sus estaciones base y ofrecer esta opción también a sus clientes. Se trata de optimizar el uso de las GPU, ya que se reduce la distancia que deben recorrer los datos, lo que se traduce en una mejora del ancho de banda.