Los modelos de lenguaje de gran tamaño (LLM) han dominado la conversación sobre IA, impulsados por la popularidad de ChatGPT y aplicaciones similares de IA generativa. Sin embargo, los modelos de lenguaje pequeño (SLM) están en aumento. Más compactos y eficientes, los SLM utilizan menos memoria y potencia de procesamiento. Esto los hace adecuados para entornos con recursos limitados.
Su capacidad para producir contenido e insights únicos a partir de vastos conjuntos de datos cautivó al mundo y estimuló nuevas herramientas y aplicaciones, consolidando aún más su impacto cultural, especialmente en la empresa. Con el Dr. Juan Bernabe Moreno, director de IBM® Research Europa para el Reino Unido e Irlanda, exploraremos cómo los SLM pueden tener un beneficio en la adopción de la IA empresarial.
La inteligencia artificial generativa (IA generativa) tiene un potencial de productividad significativo para las compañías. Sin embargo, al implementar modelos de IA, lo grande no siempre es mejor. Hay 2 problemas principales de LLM que impiden la adopción empresarial.
En primer lugar, muchos LLM son de uso general, lo que limita su valor. Los modelos de empresa “promedio” son ineficaces porque no existe una empresa “promedio”. Se deben crear, ajustar y desplegar modelos de IA eficaces que se adapten a las necesidades específicas de cada organización.
En segundo lugar, muchos LLM patentados son “cajas negras”, un modelo cerrado en el que solo la compañía que lo posee puede ver los componentes de, que carecen de transparencia de datos y dificultan el ajuste con los datos de la empresa, donde radica el verdadero valor de la IA. Esto deja a las empresas responsables del rendimiento del modelo sin insight ni control.
Estos problemas impiden la confianza y la comprensión de la seguridad del modelo. Sin elegir de manera efectiva las soluciones de IA generativa para cumplir con los requisitos de la industria, legales y reglamentarios, las empresas no pueden usar completamente el poder de la IA generativa.
Para que la IA generativa tenga éxito, las empresas necesitan tres cosas:
Para satisfacer estas necesidades y maximizar el valor de la IA, las empresas recurren a los SLM y descubren el poder de lo pequeño. Los SLM ofrecen una alternativa convincente a los LLM de uso general.
Los SLM han recibido mucha menos atención y fanfarria, pero ofrecen una opción atractiva para organizaciones de todos los tamaños. Su eficiencia energética, transparencia de datos y sólido rendimiento, que a menudo igualan o superan a los modelos más grandes, desbloquean la adopción responsable de la IA generativa sin obstaculizar la innovación.
En general, cualquier valor inferior a 30 000 millones de parámetros se considera un SLM. Las principales ventajas incluyen menores costos, menor consumo de energía y mayor transparencia e integridad de los datos. Una nueva generación de modelos más pequeños, como IBM® Granite, basados en conjuntos de datos limpios y filtrados para tareas específicas, reducen riesgos como el sesgo y los resultados inadecuados, al tiempo que aumentan la visibilidad de los datos.
Este modelo base fiable permite una integración segura de datos propietarios, desbloqueando el verdadero valor de la IA. IBM proporciona una indemnización de propiedad intelectual (IP) para todos los modelos Granite, lo que aumenta aún más la confianza en la fusión de sus datos con los modelos.
IBM cree que los modelos base de código abierto permiten a las organizaciones crear modelos especializados, infundidos con datos. Para respaldar esto, IBM hizo código abierto su familia Granite de SLM personalizables, entrenados en conjuntos de datos transparentes y filtrados.
La combinación de un modelo Granite pequeño con datos empresariales puede lograr un rendimiento específico de la tarea que rivaliza con modelos más grandes a una fracción del costo. Las primeras pruebas de concepto muestran que los modelos IBM Granite cuestan significativamente menos (entre 3 y 23 veces menos) que los modelos fronterizos grandes, al tiempo que superan o igualan a competidores de tamaño similar en puntos de referencia clave.
Además, las nuevas técnicas, como InstructLab,introducidas por IBM y RedHat en mayo de 2024, simplifican la infusión de datos empresariales en los LLM. InstructLab permite a las empresas personalizar los modelos de IA utilizando mucha menos información generada por humanos y recursos informáticos que el reentrenamiento tradicional.
Los SLM, incluidos los modelos Granite, ya están teniendo un impacto. Las instituciones deportivas mundiales utilizan modelos Granite, ajustados con sus propios datos de dominio, para mejorar las experiencias de los aficionados con comentarios generados por IA. Internamente, IBM emplea modelos Granite para impulsar su plataforma de servicios de recursos humanos, AskHR. Mediante el uso de instrucciones en lenguaje natural, los IBMers pueden acceder a los servicios de RR. HH. en un solo lugar, ahorrando tiempo tanto para los empleados como para los profesionales de RR. HH.
Las grandes LLM no son la única manera de obtener beneficio de la IA generativa. Los modelos más pequeños, accesibles y especializados ofrecen la eficiencia, la confianza, la flexibilidad y el rendimiento necesarios a un menor costo, tanto desde el punto de vista financiero como ambiental.
