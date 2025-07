Per la fase di trasformazione, la funzionalità fornisce operatori di qualità precostituiti per gestire funzioni come l'estrazione del testo e la deduplica. Vengono anche rimossi contenuti sensibili come informazioni di identificazione personale (PII) e odio, linguaggio offensivo e blasfemia (HAP). Queste trasformazioni sono alimentate da un motore scalabile in grado di elaborare centinaia di milioni di pagine, accelerando esponenzialmente l'elaborazione dei dati non strutturati. L'integrazione dei dati non strutturati si integra anche con framework open source come LangChain per estendere ulteriormente le funzionalità di trasformazione.