Autoregressive LLMs – die LLMs, die üblicherweise für die Textgenerierung verwendet werden – sind grundsätzlich so konzipiert, dass sie sich von links nach rechts verschieben. Sie werden durch selbstüberwachtes Lernen darauf trainiert, anhand der Informationen der vorangegangenen Token iterativ den nächsten Token in einer Sequenz vorherzusagen, bis die Sequenz als abgeschlossen angesehen wird. Während sich dieses Design für eine beeindruckende Vielfalt an generativen Aufgaben eignet, ist es bei einer anderen Art von Aufgabe zwangsläufig zu kurz: die Vorhersage der richtigen Token auf der Grundlage der davor und danach kommenden Token. Mit anderen Worten: Herkömmliche autoregressive LLMs können nicht „die Mitte ausfüllen“.

Die Anpassung autoregressiver Modelle an das Ausfüllen erfordert eine Neugestaltung der Trainingsaufgaben, um das LLM im Wesentlichen dazu zu „täuschen“, Token in der Mitte vorherzusagen, indem es seine intrinsische Fähigkeit zur Vorhersage von links nach rechts nutzt. Dies erfordert im Allgemeinen die Aufteilung einer Beispielpassage in Präfix (die vorangegangenen Token), Suffix (die Token, die danach kommen) und Mitte (die Token, die durch das Ausfüllen vorhergesagt werden sollen) und anschließend die Passagierung so neu anordnen, dass dem Modell sowohl das Präfix als auch das Suffix vorher zur Verfügung stehen gebeten, mittlere Token vorherzusagen. Granite 3.3 verwendet spezielle Token, damit das Modell Inhalte generieren kann, die sowohl vom Präfix als auch vom Suffix abhängig sind.

Obwohl FIM eine Vielzahl von Anwendungsfallen hat, eignet es sich besonders für Codierungsaufgaben, von der Codereparatur und der Fehlerverbindung über das Refactoring bis hin zur schnellen Erstellung von Standardcode und dem Einfügen von Funktionsargumenten oder Docstrings.