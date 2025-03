DistilBERT é uma versão mais leve do modelo de base BERT pioneiro do Google. Ele utiliza destilação de conhecimento para ser 40% menor e 60% mais rápido que seu predecessor, mantendo 97% da capacidade de compreensão de linguagem natural do BERT.1

Outras versões reduzidas do BERT incluem tiny com 4,4 milhões de parâmetros, mini com 11,3 milhões de parâmetros, small com 29,1 milhões de parâmetros e medium com 41,7 milhões de parâmetros.2 Enquanto isso, o MobileBERT é adaptado para dispositivos móveis.3