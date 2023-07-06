Questi termini informatici sono spesso usati in modo intercambiabile, ma quali differenze rendono ciascuno una tecnologia unica?
La tecnologia sta diventando sempre più parte integrante della nostra vita quotidiana. Per restare al passo con le aspettative dei consumatori, le aziende si affidano maggiormente agli algoritmi di apprendimento automatico per semplificare le cose. Puoi vederne l'applicazione sui social media (tramite il riconoscimento di oggetti nelle foto) o parlando direttamente con dispositivi (come Alexa o Siri).
Sebbene intelligenza artificiale (AI), machine learning (ML), deep learning e reti neurali siano tecnologie correlate, i termini vengono spesso usati in modo intercambiabile, il che spesso crea confusione sulle loro differenze. Questo post chiarisce alcune delle ambiguità.
Il modo più semplice di comprendere l'AI, il machine learning, il deep learning e le reti neurali è pensarli come una serie di sistemi di AI dal più grande al più piccolo, ognuno dei quali comprende il successivo.
L'AI è il sistema generale. Il machine learning è un sottoinsieme dell'AI. Il deep learning è un sottocampo del machine learning e le reti neurali costituiscono la spina dorsale degli algoritmi di deep learning. È il numero di livelli di nodi, o profondità, delle reti neurali a distinguere una singola rete neurale da un algoritmo di deep learning, che deve averne più di tre.
Il termine intelligenza artificiale o AI, il più ampio dei tre, viene utilizzato per classificare le macchine che imitano l'intelligenza umana e le funzioni cognitive umane come la risoluzione dei problemi e l'apprendimento. L'AI utilizza le previsioni e l'automazione per ottimizzare e risolvere attività complesse che gli umani hanno svolto storicamente, come il riconoscimento facciale e vocale, il processo decisionale e la traduzione.
Le tre categorie principali di AI sono:
L'ANI è considerata un'AI "debole", mentre gli altri due tipi sono classificati come AI "forte". Definiamo l'AI debole in base alla sua capacità di portare a termine un compito specifico, come vincere una partita a scacchi o identificare un individuo particolare in una serie di foto. L'elaborazione del linguaggio naturale e la computer vision, che consentono alle aziende di automatizzare le attività e supportare chatbot e assistenti virtuali come Siri e Alexa, sono esempi di ANI. La computer vision è un fattore nello sviluppo delle auto a guida autonoma.
Forme più forti di AI, come AGI e ASI, incorporano in modo più evidente i comportamenti umani, come la capacità di interpretare il tono e le emozioni. L'AI forte è definita dalla sua capacità rispetto agli esseri umani. L'AGI si comporterebbe alla pari di un altro umano, mentre l'ASI, nota anche come superintelligenza, supererebbe addirittura l'intelligenza e le capacità di un umano. Nessuna delle due forme di AI forte esiste ancora, ma la ricerca in questo campo è in corso.
Un numero crescente di aziende, circa il 35% a livello globale, utilizza l'AI e un altro 42% sta esplorando questa tecnologia. Lo sviluppo dell'AI generativa, che utilizza potenti foundation model che addestrano su grandi quantità di dati senza etichetta, può essere adattato a nuovi casi d'uso e offrire flessibilità e scalabilità che probabilmente accelereranno in modo significativo l'adozione dell'AI. Nei primi test, IBM ha visto l'AI generativa portare il time to value fino al 70% più velocemente rispetto all'AI tradizionale.
Che si utilizzino applicazioni di AI basate su ML o foundation model, l'AI può offrire alla tua azienda un vantaggio competitivo. L'integrazione di modelli AI personalizzati nei workflow e nei sistemi e l'automazione di funzioni come il servizio clienti, la gestione della supply chain e la cybersecurity aiutano un'azienda a soddisfare le aspettative dei clienti, sia oggi che man mano che aumentano in futuro.
La chiave è identificare i set di dati giusti fin dall'inizio per garantire che tu utilizzi dati di qualità per ottenere il vantaggio competitivo più sostanziale. Dovrai anche creare un'architettura ibrida pronta per l'AI in grado di utilizzare con successo i dati ovunque si trovino, su mainframe, data center, nei cloud pubblici e privati e all'edge.
La tua AI deve essere affidabile, perché qualsiasi cosa di meno significa rischiare di danneggiare la reputazione dell'azienda e di incorrere in sanzioni normative. I modelli fuorvianti e quelli che contengono bias o che hanno allucinazioni possono comportare costi elevati per la privacy, i diritti dei dati e la fiducia dei clienti. La tua AI deve essere spiegabile, equa e trasparente.
Il machine learning è un sottoinsieme dell'AI che consente l'ottimizzazione. Se impostato correttamente, ti aiuta a fare previsioni che riducono al minimo gli errori che derivano dalla semplice ipotesi. Ad esempio, aziende come Amazon utilizzano il machine learning per consigliare prodotti a un cliente specifico in base a ciò che ha visto e acquistato in precedenza.
L'apprendimento automatico classico o "non profondo" dipende dall'intervento umano per consentire a un sistema informatico di identificare schemi, apprendere, eseguire attività specifiche e fornire risultati accurati. Gli esperti umani determinano la gerarchia delle caratteristiche per comprendere le differenze tra gli input di dati, che in genere richiedono dati più strutturati per l'apprendimento.
Ad esempio, supponiamo che ti abbia mostrato una serie di immagini di diversi tipi di fast food: "pizza", "hamburger" e "taco". Un esperto umano che lavorasse su queste immagini determinerebbe le caratteristiche che distinguono ciascuna immagine come uno specifico tipo di fast food. Il pane può rappresentare una caratteristica distintiva di ogni tipo di alimento. In alternativa, potrebbero utilizzare etichette come "pizza", "hamburger" o "taco" per semplificare il processo di apprendimento attraverso l'apprendimento supervisionato.
Mentre il sottoinsieme dell'AI chiamato deep machine learning può utilizzare set di dati etichettati per informare il suo algoritmo nell'apprendimento supervisionato, non richiede necessariamente un set di dati etichettato. Può inserire dati non strutturati nella loro forma grezza (ad esempio, testo, immagini) e può determinare automaticamente l'insieme di caratteristiche che distinguono "pizza", "hamburger" e "taco" l'uno dall'altro. Man mano che generiamo più big data, i data scientist utilizzano più machine learning. Per approfondire le differenze tra questi approcci, consulta Apprendimento supervisionato e non supervisionato: qual è la differenza?
Una terza categoria di machine learning è l'apprendimento per rinforzo, in cui un computer impara interagendo con l'ambiente circostante e ricevendo feedback (premi o penalità) per le sue azioni. E l'apprendimento online è un tipo di ML in cui un data scientist aggiorna il modello di ML non appena sono disponibili nuovi dati.
Per maggiori informazioni sul machine learning, guarda il seguente video:
Come spiegato nel nostro articolo dedicato, il deep learning è un sottoinsieme del machine learning. La differenza principale tra machine learning e deep learning è il modo in cui ogni algoritmo apprende e la quantità di dati utilizzata da ciascun tipo.
Il deep learning automatizza gran parte del processo di estrazione delle caratteristiche, eliminando parte dell'intervento umano manuale richiesto. Permette inoltre di utilizzare grandi set di dati, guadagnandosi il titolo di machine learning scalabile. Mentre esploriamo ulteriormente l'uso dei dati non strutturati, questa funzionalità si sta rivelando entusiasmante, in particolare perché si stima che oltre l'80% dei dati di un'organizzazione siano non strutturati.
L'osservazione dei modelli nei dati consente a un modello di deep learning di cluster gli input in modo appropriato. Riprendendo lo stesso esempio di prima, possiamo raggruppare le foto di pizze, hamburger e tacos nelle categories in base alle somiglianze o alle differenze identificate nelle immagini. Un modello di deep learning richiede più punti dati per migliorare la precisione, mentre un modello di apprendimento automatico si basa su meno dati data la struttura dei dati sottostante. Le aziende generalmente utilizzano il deep learning per attività più complesse, come assistenti virtuali o rilevamento delle frodi.
Le reti neurali, chiamate anche artificial neural networks o simulated neural network, sono un sottoinsieme del machine learning e la spina dorsale degli algoritmi di deep learning. Sono chiamate "neurali" perché imitano il modo in cui i neuroni nel cervello si inviano segnali a vicenda.
Le reti neurali sono costituite da livelli di nodi, un livello di input, uno o più livelli nascosti e un livello di output. Ogni nodo è un neurone artificiale che si connette al successivo e ognuno ha un peso e un valore di soglia. Quando l'output di un nodo è superiore al valore di soglia, quel nodo viene attivato e invia i dati al livello successivo della rete. Se è inferiore alla soglia, non passa alcun dato.
I dati di formazione insegnano alle reti neurali e aiutano a migliorarne l'accuratezza nel tempo. Una volta messi a punto, gli algoritmi di apprendimento diventano potenti strumenti informatici e di AI perché ci consentono di classificare e cluster rapidamente i dati. Utilizzando le reti neurali, le attività di riconoscimento vocale e delle immagini possono essere eseguite in pochi minuti anziché in ore se eseguite manualmente. L'algoritmo di ricerca di Google è un noto esempio di reti neurali.
Come accennato nella spiegazione delle reti neurali fornita in precedenza, il termine "deep" di Deep Learning si riferisce alla profondità degli strati in una rete neurale. Una rete neurale di più di tre livelli, inclusi gli input e gli output, può essere considerata un algoritmo di deep learning. Ciò può essere rappresentato dal seguente diagramma:
La maggior parte delle reti neurali profonde sono feed-forward, nel senso che fluiscono in una sola direzione, dall'input all'output. Tuttavia, è anche possibile addestrare il modello tramite la retropropagazione, ossia con uno spostamento nella direzione opposta, dall'output all'input. La retropropagazione ci consente di calcolare e attribuire l'errore associato a ciascun neurone, consentendoci di regolare e adattare l'algoritmo in modo appropriato.
Sebbene tutte queste aree di AI possano aiutare a semplificare le aree della tua attività e migliorare l'esperienza del cliente, raggiungere gli obiettivi di AI può essere difficile perché devi prima assicurarti di disporre dei sistemi giusti per costruire algoritmi di apprendimento per gestire i suoi dati. La gestione dei dati è molto più che la semplice creazione di modelli da utilizzare per la tua attività. Prima di iniziare a costruire qualsiasi cosa, avrai bisogno di un posto in cui memorizzare i tuoi dati e di meccanismi per pulirli e controllarne i bias.
In IBM stiamo combinando la potenza del machine learning e dell'intelligenza artificiale
