Choix du modèle de génération

De nombreux facteurs entrent en jeu dans le choix d’un modèle adapté à votre projet.

La licence du modèle peut restreindre son utilisation. Par exemple, la licence d’un modèle peut empêcher son utilisation dans le cadre d’une application commerciale.

Le jeu de données utilisé pour entraîner le modèle affecte directement la performance de ce dernier sur une tâche donnée. Le risque que le modèle génère des réponses absurdes, offensantes ou tout simplement indésirables en dépend également. De la même manière, les modèles entraînés sur des données privées ou protégées par le droit d’auteur peuvent engager la responsabilité des utilisateurs. IBM assure une transparence totale des données d’entraînement et une indemnisation en cas de réclamation portant sur ses modèles.

La taille du modèle, le nombre de paramètres avec lesquels il est entraîné et la taille de sa fenêtre de contexte (la longueur d’un passage de texte que le modèle peut accepter) affectent les performances du modèle, ses besoins en ressources et son débit. Bien qu’il soit tentant d’adopter une philosophie du type « plus c’est grand, mieux c’est » et de choisir un modèle à 20 milliards de paramètres, les besoins en ressources et l’amélioration de la précision (quand elle est possible) ne justifient peut-être pas cette approche. Des études récentes ont montré que les modèles plus petits peuvent être nettement plus performants que les modèles plus grands pour certaines solutions

Tout réglage fin appliqué aux modèles peut affecter leur adéquation à une tâche donnée. Par exemple, IBM propose deux versions du modèle Granite : l’une adaptée aux applications de chat générales, et une autre conçue pour suivre des instructions.

Autres aspects à prendre en compte pour bien choisir votre modèle :