Man mano che Baidu lancia servizi AI innovativi, i volumi di dati crescono in modo vertiginoso. Per ridurre i costi, aumentare l'efficienza e soddisfare i requisiti di conformità dei dati, l'azienda ha incaricato IBM di sostituire lo storage su disco legacy per i dati inattivi con una nuova soluzione basata su librerie a nastro IBM® TS4500 e sul software IBM Storage Scale.

Dai veicoli autonomi all'AI e alla IoT (Internet of Things), Baidu è all'avanguardia nell'innovazione digitale. Oltre a fornire il più grande motore di ricerca Internet della Cina, la strategia dell'azienda si concentra anche su guida autonoma, Baidu AI Cloud, Baidu Netdisk e piattaforme di streaming video.

Miao Yu, Senior Manager del Cloud Storage Department presso Baidu AI Cloud, spiega: "Con il crescere dei settori che aggiornano le proprie capacità digitali, il nostro obiettivo è fornire prodotti cloud ai clienti in campi quali quello dei trasporti, della finanza e governativo. Attraverso le funzionalità cloud e di intelligence di Baidu AI Cloud, possiamo aiutare le aziende a sbloccare efficienze dei costi e creare nuove fonti di valore".

Sulla piattaforma Baidu, i dati crescono rapidamente in volume, velocità e varietà. La crescente popolarità delle offerte Baidu AI Cloud e AI dell'azienda ha innescato un massiccio aumento dei requisiti di storage. Allo stesso tempo, l'adozione da parte di Baidu delle soluzioni di città intelligente, casa intelligente e automazione dei veicoli sta crescendo notevolmente e, di conseguenza, stanno aumentando le richieste di accesso ai dati in tempo reale e di conservazione dei dati a lungo termine.

"La nostra crescita dei dati non mostra segni di rallentamento", continua Miao Yu. "Gli ultimi veicoli autonomi sono dotati di molti più sensori rispetto ai loro predecessori e la quantità di dati generata per veicolo può arrivare fino a 10 TB al giorno. Allo stesso modo, la rapida crescita del settore delle case intelligenti e la diffusa popolarità del live streaming in Cina portano alla generazione di enormi quantità di dati, con conseguenti sfide di storage. Dal 2019, i nostri volumi di dati sono più che triplicati e ora archiviamo circa 100 exabyte [EB] di dati".

In passato, Baidu si affidava allo storage su disco per la conservazione a lungo termine dei dati. Tuttavia, i suoi dischi avevano una capacità massima di 20 TB per unità, il che limitava la densità di storage, occupava spazio prezioso e faceva aumentare i costi. Realizzando che questo approccio non era ottimale, Baidu ha cercato una piattaforma di storage dei dati inattivi che fosse più resiliente, efficiente e scalabile, in grado di far fronte alla continua crescita dei dati.

Abilita un risparmio sul consumo di energia di

> 90%

sostituendo i dischi con nastri per lo storage dei dati inattivi

Taglia i costi operativi legati ai dati inattivi di

> 80%

rispetto alla precedente piattaforma di storage su disco

Taglio dei costi e rapida scalabilità

Per soddisfare le esigenze di scalabilità dei dati illimitata dei suoi clienti, Baidu AI Cloud ha coinvolto gli esperti di IBM per pianificare, progettare, implementare e configurare un'architettura di storage di dati inattivi pronta per il futuro, composta da soluzioni di librerie a nastro IBM TS4500, IBM Storage Scale e IBM Storage Defender.

"Diversi tipi di scenari di utilizzo dei dati impongono requisiti diversi al nostro sistema di storage", spiega Miao Yu. "Ad esempio, i carichi di lavoro di elaborazione ad alte prestazioni richiedono un'elevata velocità di trasmissione e un accesso in lettura e scrittura a bassa latenza. Per altri scenari di utilizzo, come l'archiviazione dei file di log generati dai nostri sistemi di monitoraggio, dobbiamo essere in grado di recuperare i dati rapidamente anche se sono trascorsi anni dalla loro archiviazione. Abbiamo cercato una soluzione di storage dei dati inattivi con maggiore efficienza in termini di costi, IOPS elevato e disponibilità 24 ore su 24, 7 giorni su 7, e IBM ce l'ha fornita".

La soluzione IBM si integra con l'architettura esistente di storage distribuito di Baidu AI Cloud. Le librerie a nastro IBM TS4500 per lo storage dei dati inattivi vengono utilizzate con le unità SSD legacy per i dati ad accesso frequente e le unità disco rigido per lo storage ad accesso frequente. I dati si spostano senza soluzione di continuità attraverso il sistema di storage su più livelli, consentendo un accesso ad alte prestazioni. Inoltre, i nastri possono essere conservati per oltre 30 anni a un costo molto inferiore rispetto ai dischi.

Immagine dall'esterno degli uffici Baidu in pieno giorno

"Siamo rimasti colpiti dalla soluzione IBM", afferma Miao Yu. "Con IBM Storage Scale, possiamo consentire ai dati di fluire liberamente nel nostro ambiente, snellendo al contempo la nostra architettura di storage così da semplificare la gestione e la manutenzione".

Per garantire che la nuova piattaforma soddisfi i requisiti di scalabilità a lungo termine di Baidu AI Cloud, gli esperti IBM hanno creato flussi di implementazione automatizzati. Questi consentono di eseguire il provisioning di 20 nodi di storage di dati inattivi in un singolo batch, accelerando in modo significativo sia l'implementazione che l'espansione.

IBM ha anche aiutato Baidu ad adattare e integrare meglio i dati della soluzione di storage su nastro IBM con la propria piattaforma, consentendole di identificare e risolvere rapidamente i problemi e attivare la soluzione. Ad oggi, Baidu ha implementato 14 librerie a nastro IBM TS4500 presso il suo data center di Yangquan, archiviando più di 2 EB di dati inattivi.

Miao Yu spiega: "IBM ha soddisfatto e superato tutti i nostri principali criteri di selezione e, dopo un modello di verifica di successo, eravamo certi che le librerie a nastro IBM TS4500 con le soluzioni IBM Storage si sarebbero dimostrate la soluzione perfetta per risolvere le pressioni in termini di costi e spazio che abbiamo affrontato con lo storage su disco. Abbiamo una lunga storia di collaborazione di successo con IBM su altri progetti, e questo ci ha dato la certezza che IBM disponesse dell'innovazione tecnica e dei servizi per affrontare le sfide legate all'implementazione di una soluzione di storage su larga scala".

Accelerazione dell'innovazione tecnologica e dei servizi

Sostituendo i dischi con i nastri, Baidu ha raggiunto e superato i criteri di successo stabiliti all'inizio dell'aggiornamento dello storage dei dati inattivi.

"Inizialmente avevamo come obiettivo un'affidabilità a 11 nove e una riduzione dei costi operativi di almeno il 50% rispetto alla precedente soluzione di storage su disco, ma la soluzione di storage di IBM ha superato entrambi questi obiettivi", commenta Miao Yu. "La soluzione IBM di storage dei dati inattivi offre un'affidabilità a 12 nove e ha ridotto i nostri costi operativi dell'80%, miglioramenti che hanno superato di gran lunga le nostre aspettative".

Con uno storage su nastro affidabile e conveniente e una piattaforma dati ad alte prestazioni che supporta i suoi carichi di lavoro di AI e big data, Baidu AI Cloud può far fronte alla rapida crescita dei dati ed espandere le sue offerte e i suoi servizi innovativi.

"Dobbiamo archiviare enormi quantità di dati su Baidu AI Cloud, nonché per la nostra ricerca, per la guida autonoma e per altri servizi, per un massimo di tre anni o più, e renderli disponibili per l'analytics e l'utilizzo della conformità ogni volta che è necessario", spiega Miao Yu.

"Oggi, questi e altri dati chiave possono essere archiviati in modo sicuro ed economico nella nostra piattaforma di storage dei dati inattivi e recuperati rapidamente on demand. Il nastro è una soluzione efficiente perché consuma pochissima elettricità, oltre il 90% in meno rispetto a uno storage su disco equivalente. In questo modo, possiamo ridurre significativamente il nostro impatto ambientale e risparmiare sui costi".

Miao Yu conclude: "La combinazione di librerie a nastro IBM TS4500 con IBM Storage Scale e il software IBM Storage Defender consente a Baidu AI Cloud di ridurre i costi ed eseguire rapidamente la scalabilità per far fronte alla crescita esplosiva dei dati. Per il futuro, abbiamo in programma di creare una piattaforma di gestione dello storage su nastro unificata per l'intera Baidu e non vediamo l'ora di lavorare con IBM per sbloccare il pieno potenziale dello storage su nastro in tutta l'organizzazione".

Junhua Jiang, Senior Account Manager – Hyperscale Solutions Sales presso IBM, afferma: "Non vediamo l'ora di lavorare con Baidu per arricchire la sua architettura di storage cloud e creare un servizio dati globale leader per Baidu Group e i clienti del settore”.

Logo Baidu

Informazioni su Baidu, Inc. e Baidu AI Cloud

Fondata nel 2000 e con sede centrale a Pechino, in Cina, Baidu, Inc. (link esterno a ibm.com) è un'azienda leader nel settore dell'AI. Baidu AI Cloud è l'infrastruttura di Baidu per l'era "smart". Con uno stack completo di funzionalità della tecnologia AI, Baidu AI Cloud offre a migliaia di clienti in più settori la sua tecnologia avanzata e le sue soluzioni complete.

Componenti della soluzione

IBM® Storage Scale
IBM Storage Defender
Libreria a nastro IBM TS4500

Scopri di più su IBM Storage

© Copyright IBM Corporation 2023. IBM Corporation, New Orchard Road, Armonk, NY 10504

Prodotto negli Stati Uniti d'America, marzo 2023.

IBM e il logo IBM sono marchi o marchi registrati di International Business Machines Corporation, negli Stati Uniti e/o in altri Paesi. Altri nomi di servizi o prodotti possono essere marchi di IBM o di altre società. Un elenco aggiornato dei marchi IBM è disponibile in ibm.com/trademark.

Questo documento è aggiornato alla data iniziale della pubblicazione e può essere modificato da IBM senza necessità di preavviso. Non tutte le offerte sono disponibili in ogni Paese in cui opera IBM.

Tutti gli esempi di clienti citati o descritti vengono presentati per mostrare come alcuni clienti utilizzano i prodotti IBM e quali risultati si possono raggiungere. I costi ambientali e le caratteristiche prestazionali effettivi variano in base alle configurazioni e alle condizioni del singolo cliente. Generalmente i risultati previsti non possono essere forniti in quanto i risultati di ciascun cliente dipenderanno interamente dai sistemi e dai servizi ordinati dal cliente. LE INFORMAZIONI CONTENUTE IN QUESTO DOCUMENTO SONO FORNITE "NELLO STATO IN CUI SI TROVANO" SENZA ALCUNA GARANZIA, ESPRESSA O IMPLICITA, SENZA GARANZIE DI COMMERCIABILITÀ O IDONEITÀ AD UNO SCOPO PARTICOLARE E SENZA ALCUNA GARANZIA O CONDIZIONE DI NON VIOLAZIONE. I prodotti IBM sono garantiti secondo i termini e le condizioni dei contratti che ne regolano la fornitura.

Qualsivoglia dichiarazione relativa a direzione e intenzioni future di IBM è suscettibile di modifiche o smentite senza preavviso e rappresenta unicamente obiettivi e scopi.

La capacità di storage effettivamente disponibile può essere indicata per dati compressi e non compressi e può variare ed essere inferiore a quella dichiarata.