Los grandes modelos de lenguaje (LLM) han dominado la conversación sobre IA, impulsados por la popularidad de ChatGPT y aplicaciones similares de IA generativa. Sin embargo, los modelos de lenguaje pequeño (SLM) están en auge. Más compactos y eficientes, los SLM utilizan menos memoria y potencia de procesamiento. Esto los hace muy adecuados para entornos con recursos limitados.
Su capacidad para producir contenido y conocimientos únicos a partir de vastos conjuntos de datos ha cautivado al mundo y ha impulsado nuevas herramientas y aplicaciones, consolidando aún más su impacto cultural, especialmente en el ámbito empresarial. Con el Dr. Juan Bernabé Moreno, director de IBM Research Europa para el Reino Unido e Irlanda, exploraremos cómo los SLM pueden beneficiar la adopción de la IA empresarial.
La inteligencia artificial generativa (IA generativa) tiene un potencial de productividad significativo para las empresas. Sin embargo, a la hora de implementar modelos de IA, más grande no siempre significa mejor. Hay 2 problemas principales de LLM que impiden la adopción empresarial.
En primer lugar, muchos LLM son de uso general, lo que limita su valor. Los modelos de empresa "promedio" son ineficaces porque no existe una empresa "promedio". Los modelos de IA eficaces deben construirse, ajustarse e implementarse en función de las necesidades organizativas específicas.
En segundo lugar, muchos LLM propietarios son "cajas negras", es decir, modelos cerrados en los que solo la empresa propietaria puede ver los componentes, lo que resta transparencia a los datos y dificulta la adaptación a los datos empresariales, donde reside el verdadero valor de la IA. Esto hace que las empresas sean responsables del rendimiento de los modelos sin conocimiento ni control.
Estos problemas impiden la confianza y la comprensión de la seguridad del modelo. Sin elegir eficazmente las soluciones de IA generativa para cumplir con los requisitos legales y normativos del sector, las empresas no pueden utilizar plenamente el poder de la IA generativa.
Para que la IA generativa tenga éxito, las empresas necesitan 3 cosas:
Para satisfacer estas necesidades y maximizar el valor de la IA, las empresas recurren a los SLM y descubren el poder de lo pequeño. Los SLM ofrecen una alternativa atractiva a los LLM de uso general.
Los SLM han recibido mucha menos atención y revuelo, pero ofrecen una opción atractiva para organizaciones de todos los tamaños. Su eficiencia energética, la transparencia de los datos y su sólido rendimiento, que a menudo igualan o superan a los modelos más grandes, desbloquean la adopción responsable de la IA generativa sin obstaculizar la innovación.
En general, cualquier cosa por debajo de 30 mil millones de parámetros se considera un SLM. Entre las principales ventajas se incluyen menores costes, menor consumo de energía y mayor transparencia e integridad de los datos. Una nueva generación de modelos más pequeños, como IBM Granite, construidos sobre conjuntos de datos limpios y filtrados para tareas específicas, reduce riesgos como sesgos y resultados inapropiados, al tiempo que aumenta la visibilidad de los datos.
Este modelo base fiable permite una integración segura de los datos propios, desbloqueando el verdadero valor de la IA. IBM proporciona una indemnización por propiedad intelectual (PI) para todos los modelos Granite, lo que aumenta aún más la confianza en la fusión de sus datos con los modelos.
IBM cree que los modelos base de código abierto permiten a las organizaciones crear modelos especializados e infundidos con datos. Para apoyar esto, IBM abrió el código abierto de su familia Granite de SLM personalizables, entrenados con conjuntos de datos transparentes y filtrados.
La combinación de un modelo Granite pequeño con datos empresariales puede lograr un rendimiento específico de la tarea que rivaliza con modelos más grandes a una fracción del coste. Las primeras pruebas de concepto muestran que los modelos IBM Granite cuestan significativamente menos (entre 3 y 23 veces menos) que los grandes modelos frontera, mientras que superan o igualan a competidores de tamaño similar en referencias clave.
Además, las nuevas técnicas como InstructLab, introducidas por IBM y RedHat en mayo de 2024, simplifican la infusión de datos empresariales en los LLM. InstructLab permite a las empresas personalizar los modelos de IA utilizando mucha menos información y recursos informáticos generados por humanos que el reentrenamiento tradicional.
Los SLM, incluidos los modelos Granite, ya están teniendo un impacto. Las instituciones deportivas globales utilizan modelos Granite, ajustados con sus propios datos de dominio, para mejorar la experiencia de los aficionados con comentarios generados por IA. Internamente, IBM utiliza modelos Granite para impulsar su plataforma de servicios de recursos humanos (RR. HH.), AskHR. Mediante el uso de indicaciones en lenguaje natural, los IBMers pueden acceder a los servicios de RR. HH. en un solo lugar, ahorrando tiempo tanto a los empleados como a los profesionales de RR. HH.
Los vastos LLM no son la única forma de beneficiarse de la IA generativa. Los modelos más pequeños, accesibles y especializados ofrecen la eficiencia, la confianza, la flexibilidad y el rendimiento necesarios a un coste menor, tanto desde el punto de vista financiero como medioambiental.
