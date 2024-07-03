Le organizzazioni devono concentrarsi sulla costruzione di una base di dati aperta e affidabile per accedere a dati affidabili per l'AI. Open sta creando una base per memorizzare, gestire, integrare e accedere ai dati basati su funzionalità aperte e interoperabili che spaziano da distribuzione cloud ibride, data storage, formati dati, motori di query, governance e metadati. Questo consente una più facile Integrazione con i suoi investimenti tecnologici esistenti, eliminando al contempo i silos di dati e accelerando la trasformazione basata sui dati.

Creare una base di dati affidabile significa consentire una gestione di dati e metadati di alta qualità, affidabile, sicura e governati, in modo che possa essere fornita per applicazioni di analytics e AI, soddisfacendo al contempo le esigenze di privacy dei dati e di conformità normativa. I seguenti quattro componenti aiutano a costruire una base di dati aperta e affidabile.

1. Modernizzare l'infrastruttura dati verso il cloud ibrido per applicazioni, analytics e gen AI

L'adozione di strategie multicloud e ibride sta diventando obbligatoria, richiedendo database che supportino distribuzione flessibili nel cloud ibrido. Gartner prevede che il 95% (link esterno a ibm.com) delle nuove iniziative digitali sarà sviluppato su piattaforme cloud-native, essenziali per le tecnologie AI che richiedono enormi data storage e scalabilità.

2. Potenziare le applicazioni basate sui dati, l'analytics e l'AI con i database giusti e la strategia di open data lakehouse

Per memorizzare e analizzare i dati, è necessario utilizzare il database giusto per il workload, i tipi di dati e il prezzo prestazioni. In questo modo avrai a disposizione una base di dati che cresce insieme alle tue esigenze, ovunque risiedano i tuoi dati. La tua strategia dovrebbe incorporare database progettati per componenti aperti e integrati, che consentano un'unificazione e un accesso ininterrotto ai dati per analytics avanzata e applicazioni AI all'interno di una piattaforma di dati. Questo permette alla tua organizzazione di estrarre insight preziosi e guidare il processo decisionale.

Per esempio, le organizzazioni hanno bisogno di database transazionali ad alte prestazioni, sicuri e resilienti per gestire i dati operativi più critici. Con la disponibilità dell'hybrid cloud, le organizzazioni possono utilizzare i loro database per modernizzare le app legacy, costruire nuove app cloud-native e alimentare gli assistenti AI e le applicazioni aziendali.

Man mano che i tipi di dati e le applicazioni si evolvono, potresti aver bisogno di database NoSQL specializzati per gestire strutture dati diverse e requisiti applicativi specifici. Questi includono serie temporali, documentazione, messaggistica, key-value, ricerca a testo completo e database in memoria, che soddisfano varie esigenze, come IoT, gestione dei contenuti e applicazioni geospaziali.

Per alimentare i workload di AI e analytics nei tuoi database transazionali e appositamente costruiti, devi assicurarti che possano integrarsi perfettamente con un'architettura open data lakehouse senza duplicazioni o processi aggiuntivi di estrazione, trasformazione, caricamento (ETL). Con un open data lakehouse, puoi accedere a una singola copia dei dati, ovunque risiedano.

Un open data lakehouse gestisce più formati aperti (come Apache Iceberg su cloud object storage) e combina dati provenienti da varie fonti e repository esistenti nel cloud ibrido. Il data lakehouse più conveniente consente anche la separazione di storage e compute con più motori di query open source e Integrazione con altri motori di analytics per ottimizzare workload e ottenere prestazioni superiori in termini di prezzo.

Ciò include l'Integrazione con i suoi motori di data warehouse, che ora devono bilanciare il trattamento dei dati e il processo decisionale in tempo reale con l'object storage conveniente, le tecnologie open source e un livello di metadati condiviso per condividere i dati senza problemi con il tuo data lakehouse. Con un'architettura open data lakehouse, ora puoi ottimizzare i workload del tuo data warehouse per prestazioni e prezzo e modernizzare i data lake tradizionali con migliori prestazioni e governance per AI.

Le aziende potrebbero anche avere petabyte, se non addirittura exabyte, di dati preziosi memorizzati nel mainframe che devono essere sbloccati per ottenere nuovi insight e modelli di ML/AI. Con un data lakehouse che supporta la sincronizzazione dei dati tra mainframe e formati aperti come Iceberg, le organizzazioni possono identificare meglio le frodi, comprendere il comportamento dei componenti e costruire modelli AI per comprendere, anticipare e influenzare risultati aziendali avanzati.

Prima di costruire un'AI generativa affidabile per la tua azienda, è necessaria la giusta architettura dei dati per preparare e trasformare questi dati eterogenei in dati di qualità. Per l'AI generativa, la giusta base di dati potrebbe includere vari knowledge store che abbracciano database NoSQL per conversazioni, database transazionali per dati contestuali, un'architettura di data lakehouse per accedere e preparare i dati per AI e analytics e capacità di incorporamento vettoriale per memorizzare e recuperare embedding per la retrieval-augmented generation (RAG). Uno strato di metadati condiviso, la governance per catalogare i tuoi dati e la data lineage consentono output AI affidabili.

3. Stabilire una base di fiducia: qualità dei dati e governance per l'AI aziendale

Poiché le organizzazioni si affidano sempre più all'intelligenza artificiale (AI) per guidare i processi decisionali critici, l'importanza della qualità dei dati e della governance non può essere sopravvalutata. Secondo Gartner, si prevede che il 30% dei progetti di AI generativa sarà abbandonato entro il 2025 a causa di qualità dei dati, controlli del rischio inadeguati, costi crescenti o un valore aziendale poco chiaro. Le conseguenze dell'uso di dati di scarsa qualità sono di vasta portata, tra cui l'erosione della fiducia dei clienti, la mancata conformità normativa e danni finanziari e reputazionali.

Una gestione efficace della qualità dei dati è fondamentale per mitigare questi rischi. Una strategia di architettura dei dati ben progettata è essenziale per raggiungere questo obiettivo. Un Data Fabric fornisce un framework per i leader dei dati per profilare i dati, progettare e applicare regole di qualità dei dati, scoprire violazioni della qualità dei dati, purificare i dati e potenziare i dati. Questo approccio garantisce che le iniziative sulla qualità dei dati garantiscano accuratezza, accessibilità, tempestività e rilevanza.

Inoltre, un data fabric abilita un monitoraggio continuo dei livelli di qualità dei dati attraverso capacità di osservabilità, consentendo alle organizzazioni di identificare problemi di qualità dei dati prima che degenerino in problemi più grandi. Questa trasparenza nei flussi di dati consente anche ai leader del dati e dell'AI di identificare potenziali problemi, assicurando che i dati corretti vengano utilizzati per il processo decisionale.

Dando priorità alla qualità dei dati e alla governance, le organizzazioni possono costruire fiducia nei loro sistemi AI, minimizzare i rischi e massimizzare il valore dei propri dati. È fondamentale riconoscere che la qualità dei dati non è solo una questione tecnica, ma un imperativo aziendale critico che richiede attenzione e investimenti. Adottando la giusta strategia di architettura dei dati, le organizzazioni possono sbloccare tutto il potenziale delle loro iniziative AI e guidare il successo aziendale.

4. Gestione e fornitura di dati per AI

I dati sono fondamentali per l'AI, dalla costruzione di modelli AI con i set di dati giusti al perfezionamento dei modelli AI con dati aziendali specifici per il settore, fino all'uso di embedding vettoriali per costruire applicazioni AI di RAG (inclusi chatbot, sistemi di raccomandazione personalizzati e applicazioni di ricerca per la similarità di immagini).

I dati affidabili e governati sono essenziali per garantire l'accuratezza, la rilevanza e la precisione dell'AI. Per sbloccare il pieno valore dei dati per l'AI, le aziende devono essere in grado di navigare nei loro complessi panorami IT per abbattere i silo dei dati, unificare i dati e preparare e fornire dati affidabili e governati per i loro modelli AI e applicazioni.

Con un'architettura di data lakehouse alimentata da formati aperti per connettersi e accedere ai dati critici del tuo patrimonio dati esistente (inclusi data warehouse, data lake e mainframe), puoi utilizzare una singola copia dei tuoi dati aziendali per costruire e adattare modelli AI e applicazioni.

Con un livello semantico, puoi generare arricchimenti dati che permettono ai clienti di trovare e comprendere dati precedentemente criptici, strutturati efficacemente attraverso il tuo patrimonio dati in linguaggio naturale tramite ricerca semantica per accelerare la data discovery e sbloccare più velocemente gli insight, senza bisogno di SQL.

Utilizzando un database vettoriale integrato direttamente all'interno del tuo lakehouse, puoi memorizzare e interrogare i tuoi dati come embedding per casi d'uso RAG, migliorando la rilevanza e la precisione dei tuoi output dell'AI.