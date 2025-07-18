Il chunking semantico utilizza modelli di embedding per creare rappresentazioni matematiche di ogni frase. Quindi, l'algoritmo di chunking crea blocchi di frasi semanticamente simili, creando un nuovo blocco che rileva un cambiamento nella semantica. Il chunking semantico è attribuito a Greg Kamradt, che ha discusso la tecnica su Github.1

La suddivisione in blocchi semantici è consapevole del contesto, che costruisce blocchi attorno al flusso naturale e al significato semantico del documento. Quando l'argomento cambia, viene creato un nuovo blocco. Tuttavia, possono emergere problemi quando i paragrafi trattano più argomenti o se la soglia di suddivisione in blocchi non è impostata correttamente per il tipo e la struttura del documento.

Il chunking semantico è più intensivo dal punto di vista computazionale rispetto al chunking ricorsivo e a dimensione fissa e richiede modelli avanzati per identificare il contenuto semantico all'interno del testo.