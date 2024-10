Il processo inizia con la raccolta dei dati conversazionali. Questo può coinvolgere più fonti di dati, tra cui registri di chat, registrazioni delle chiamate, interazioni e-mail, messaggi sui social e interazioni con l'assistente vocale. Una volta raccolti i dati dei clienti (la trascrizione è necessaria per i dati vocali), vengono pre-elaborati per pulire e normalizzare il testo, rimuovendo il rumore e le informazioni non pertinenti. Questo passaggio prevede attività come la tokenizzazione (suddivisione del testo in parole o frasi), lo scrivere in minuscolo e la rimozione delle parole interrotte (parole comuni come "e", "il", ecc...).