Los LLM son los modelos centrales de inteligencia artificial para muchas aplicaciones comerciales, como agentes de IA, respuesta a preguntas impulsada por RAG, o chatbots de atención al cliente con generación de texto automatizada. Procesamiento de lenguaje natural (PLN) es el uso de algoritmos de machine learning para comprender y generar lenguaje humano, y los LLM son un tipo específico de modelo de procesamiento de lenguaje natural.
Los LLM notables incluyen la familia GPT de OpenAI, como GPT-4o y GPT-3.5, algunos de los modelos detrás de ChatGPT, así como Claude de Anthropic , Gemini de Google y Llama 3 de Meta. Todos los LLM son capaces de manejar tareas complejas, pero las necesidades específicas de un proyecto de machine learning pueden ayudar a dictar el LLM adecuado para el trabajo.
Elegir el LLM adecuado se reduce a una variedad de factores que incluyen:
- Caso de uso: El reto de machine learning afecta directamente al proceso de selección del LLM. Un LLM puede ser mejor para la comprensión y resumen de documentos largos, mientras que otro puede ser más fácil de ajustar para usos específicos de un dominio.
- Rendimiento: al igual que otros modelos, los LLM pueden ser puntos de referencia entre sí para evaluar el rendimiento. Los puntos de referencia de LLM incluyen métricas de razonamiento, programación, matemáticas, latencia, comprensión y conocimiento general. Sopesar las necesidades de un proyecto versus el punto de referencia puede ayudar a determinar cuál es el mejor LLM que se puede elegir para obtener resultados de alta calidad.
- Código abierto versus código cerrado: los modelos de código abierto permiten a los observadores monitorear cómo el modelo llega a sus decisiones. Diferentes LLM pueden ser propensos a sesgos y alucinaciones de varias maneras: cuando generan predicciones que no reflejan resultados del mundo real. Cuando la moderación del contenido y la prevención de sesgos son primordiales, limitar las opciones a los proveedores de código abierto puede ayudar a dar forma al proceso de selección de LLM.
- Uso y costo de los recursos: los LLM son modelos que consumen muchos recursos. Muchos LLM funcionan con un centro de datos de hiperescala lleno de cientos de miles de unidades de procesamiento de gráficos (GPU) o más. Los proveedores de LLM también cobran de manera diferente por las conexiones API a sus modelos. La escalabilidad de un modelo y su sistema de precios afecta directamente al alcance del proyecto.