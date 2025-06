Gomstyn: Puoi approfondire la sfida della scalabilità e cosa occorre fare per affrontarla?

Nirmal: I dati non strutturati sono più complessi, nel senso che possono avere centinaia di campi e alcuni di questi potrebbero essere campi massivi o campi sicuri. Quando si inseriscono quei documenti, è fondamentale che tale inserimento sia regolamentato e che i dati siano memorizzati in un archivio controllato, come un data lakehouse.

È inoltre necessaria la governance nella pipeline di dati. Come si fa ad aggiungere observability e monitoraggio? Se si verifica una deriva o un cambiamento nella pipeline, come si fa a identificarli rapidamente e a risolverli? Queste pipeline possono essere lunghe e complesse ed è opportuno assicurarsi di ottenere risultati, tempi di esecuzione, prestazioni e accuratezza corretti in ogni fase. Sono necessari strumenti precisi per assicurarsi di poter costruire, governare e osservare le pipeline.

Per le aziende, si tratta anche di sicurezza. La sicurezza dei dati diventa un elemento critico per assicurarsi che non perdano quei dati. Disponiamo di strumenti di sicurezza dei dati per assicurarci che i dati siano crittografati. Pertanto, con la crescita, è fondamentale garantire che la governance e la sicurezza adottate per i dati strutturati vengano estese anche ai dati non strutturati.