As tabelas de classificação de LLMs publicam uma classificação dos LLMs com base em uma variedade de benchmarks. As tabelas de classificação oferecem uma maneira de acompanhar os diversos LLMs e comparar o desempenho. As tabelas de classificação de LLMs são especialmente úteis para tomar decisões sobre quais modelos se deve utilizar.
Cada benchmark normalmente tem sua própria tabela de classificação, mas há também tabelas de classificação de LLM independentes. Por exemplo, o Hugging Face tem uma coleção de tabelas de classificação, uma das quais é uma tabela de classificação de LLM aberta que classifica vários modelos de código aberto com base nos benchmarks de ARC, HellaSwag, MMLU, GSM8K, TruthfulQA e Winogrande.