Avvio rapido: Crea un modello utilizzando SPSS Modeler
È possibile creare, addestrare e distribuire modelli utilizzando SPSS Modeler. Leggere su SPSS Modeler, poi guardare un video e seguire un tutorial adatto ai principianti e non richiede codifica.
- Servizi richiesti
- Watson Studio (che include SPSS Modeler)
- Watson Machine Learning
Il tuo flusso di lavoro di base include queste attività:
- Creare un progetto. I progetti sono dove si può collaborare con gli altri per lavorare con i dati.
- Aggiungere un flusso SPSS Modeler al progetto.
- Configurare i nodi sui canvas e eseguire il flusso.
- Rivedere i dettagli del modello e salvare il modello.
- Distribuire e testare il tuo modello.
Leggi su SPSS Modeler
Con i flussi SPSS Modeler è possibile sviluppare rapidamente modelli predittivi utilizzando le competenze aziendali e distribuirli in operazioni aziendali per migliorare il processo decisionale. Progettata intorno al software client SPSS Modeler di lunga data e al modello CRISP-DM standard del settore che utilizza, l'interfaccia dei flussi facilita l'intero processo di data mining, dai dati ai migliori risultati di business.
SPSS Modeler offre una varietà di metodi di modellazione tratti da machine learning, intelligenza artificiale e statistiche. I metodi disponibili nella palette dei nodi consentono di ricavare nuove informazioni dai dati e di sviluppare modelli predittivi. Ogni metodo ha determinati punti di forza e si presta meglio per particolari tipi di problemi.
Guarda un video sulla creazione di un modello utilizzando SPSS Modeler
Guardate questo video per vedere come creare ed eseguire un flusso SPSS Modeler per addestrare un modello di apprendimento automatico. Il video inizia con la creazione e l'esecuzione di un flusso per l'addestramento del modello di apprendimento automatico in SPSS Modeler per addestrare un modello di apprendimento automatico in watsonx.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Provare un tutorial per creare un modello utilizzando SPSS Modeler
In questo tutorial completerà questi compiti:
- Attività 1: aprire un progetto.
- Attività 2: aggiungere un dataset al progetto.
- Attività 3: creare il flusso di SPSS Modeler .
- Attività 4: aggiungere i nodi al flusso SPSS Modeler .
- Attività 5: eseguire il flusso SPSS Modeler ed esplorare i dettagli del modello.
- Attività 6: valutare il modello.
- Attività 7: distribuire e verificare il modello con nuovi dati.
Il completamento di questa esercitazione richiederà circa 30 minuti.
Dati di esempio
Il dataset utilizzato in questo tutorial è dell'Università della California, Irvine, ed è il risultato di un esteso studio basato sulle ammissioni ospedaliere in un periodo di tempo. Il modello utilizzerà tre fattori importanti per aiutare a prevedere la malattia renale cronica.
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Configurare le finestre del browser
Per un'esperienza ottimale durante lo svolgimento di questo tutorial, apri il tuo account in una finestra del browser e mantieni aperta questa pagina del tutorial in un'altra finestra del browser, in modo da poter passare facilmente da una finestra all'altra. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Attività 1: apertura di un progetto
È necessario un progetto per memorizzare il flusso SPSS Modeler . È possibile utilizzare un progetto esistente o creare un progetto.
Dal menu di navigazione
, seleziona Progetti > Tutti i progetti.
Aprire un progetto esistente. Se si desidera utilizzare un nuovo progetto:
Fare clic su Nuovo progetto.
Selezionare Crea un progetto vuoto.
Immettere un nome e una descrizione facoltativa per il progetto.
Fare clic su Crea.
Per ulteriori informazioni o per vedere un video, vedere Creazione di un progetto.
Controlla i tuoi progressi
La seguente immagine mostra il nuovo progetto.

Attività 2: Aggiungi i dati impostati al tuo progetto
Questa esercitazione utilizza un dataset di esempio. Attenersi alla seguente procedura per aggiungere il dataset di esempio al progetto:
Scaricare il file chronic_kidney_disease_full.csv (39 KB).
Aggiungere il file
chronic_kidney_disease_full.csval tuo progetto:Dal tuo progetto, clicca sull'icona Carica risorsa
nel progetto.
Nel pannello laterale che si apre, sfoglia per selezionare il file
chronic_kidney_disease_full.csve clicca su Apri. Resta sulla pagina fino a quando il carico non si completa.
Ilchronic_kidney_disease_full.csvfile viene aggiunto al progetto come asset di dati.
Dalla pagina Asset del progetto, aprire il file chronic_kidney_disease_full.csv per visualizzare un'anteprima dei dati. Ci sono tre fattori importanti che aiutano a prevedere la malattia renale cronica che sono disponibili come parte di questa analisi: l'età del soggetto del test, i risultati del test della creatinina sierica e i risultati del test del diabete. E il valore della classe indica se il paziente è stato precedentemente diagnosticato per malattia renale.
Fare clic sul nome progetto nella traccia di navigazione per ritornare alla scheda Asset .
Controlla i tuoi progressi
La seguente immagine mostra la scheda Asset nel progetto.

Attività 3: Creare il flusso SPSS Modeler
Attenersi alla seguente procedura per creare un flusso SPSS Modeler nel progetto:
Clic Nuova risorsa > Crea modelli come flusso visivo.
Digitare un nome e una descrizione per il flusso.
Fare clic su Crea. Questo apre l'editor del flusso che verrà utilizzato per creare il flusso.
Controlla i tuoi progressi
La seguente immagine mostra l'Editor del flusso.

Attività 4: Aggiungere i nodi al flusso SPSS Modeler
Dopo aver caricato i dati, è necessario trasformare i dati. Creare un flusso semplice trascinando i trasformatori e gli stimatori nell'area e collegandoli all'origine dati. Utilizzare i seguenti nodi dalla tavolozza:
Asset di dati: carica il file csv dal progetto
Partizione: divide i dati in segmenti di formazione e verifica
Tipo: imposta il tipo di dati. Utilizzalo per designare il campo
classcome tipotarget.C5.0: un algoritmo di classificazione
Analisi: visualizzare il modello e verificarne la precisione
Tabella: anteprima i dati con le previsioni
Per creare il flusso, attenersi alla seguente procedura:
Aggiungere il nodo asset di dati:
Dalla sezione Importa , trascinare il nodo Asset sui canvas.
Fare doppio clic sul nodo Asset di dati per selezionare il dataset.
Clicca su Modifica asset dati nel riquadro che si apre.
Selezionare Asset Data nella pagina che si apre.
Selezionare chronic_kidney_disease_full.csv.
Fare clic su OK.
Visualizzare le proprietà Asset Asset.
Fare clic su Salva.
Aggiungere il nodo Partizione:
Dalla sezione Operazioni di campo , trascinare il nodo Partizione sulla canvas.
Collegare il nodo Asset Asset al nodo Partizione .
Fare doppio clic sul nodo Partizione per visualizzarne le proprietà. La partizione predefinita divide la metà dei dati per la formazione e l'altra metà per i test.
Fare clic su Salva.
Aggiungere il nodo Tipo:
Dalla sezione Operazioni di campo , trascinare il nodo Type sulla canvas.
Collegare il nodo Partizione al nodo Type .
Fare doppio clic sul nodo Tipo per visualizzarne le proprietà. Il nodo Tipo specifica il livello di misurazione per ogni campo. Questo file di dati di origine utilizza quattro diversi livelli di misurazione: Continuo, Categoriale, Nominale, Ordinale e Flag.
Cerca il campo
class. Per ogni campo, il ruolo indica la parte che ogni campo gioca nella modellazione. Cambiare ilclassRuolo in Target - il campo che si desidera prevedere.Fare clic su Salva.
Aggiungere il nodo dell'algoritmo di classificazione C5.0 :
Dalla sezione Modeling , trascinare il nodo C5.0 sui canvas.
Collegare il nodo Tipo al nodo C5.0 .
Fare doppio clic sul nodo C5.0 per visualizzarne le proprietà. Per impostazione predefinita, l'algoritmo C5.0 costruisce un albero decisionale. Un modello C5.0 funziona suddividendo il campione in base al campo che fornisce il massimo guadagno informativo. Ogni sottocampione definito dalla prima split viene poi diviso di nuovo, di solito in base a un campo diverso, e il processo si ripete fino a quando i sottocampioni non possono essere suddivisi ulteriormente. Infine vengono riesaminate le suddivise di livello più basso e quelle che non contribuiscono in modo significativo al valore del modello vengono eliminate.
Attivare Utilizza impostazioni definite in questo nodo.
Per Target, selezionare classe.
Nella sezione Inputs , fare clic su Aggiungi colonne.
Deselezionare la check box accanto a Nome campo.
Selezionare age, sc, dm.
Fare clic su OK.
Fare clic su Salva.
Controlla i tuoi progressi
La seguente immagine mostra il flusso completato.

Attività 5: eseguire il flusso SPSS Modeler ed esplorare i dettagli del modello
Ora che il flusso è stato progettato, seguire questi passi per eseguire il flusso ed esaminare il diagramma della struttura ad albero per vedere i punti di decisione:
Fare clic con il tasto destro del mouse sul nodo C5.0 e selezionare Esegui. L'esecuzione del flusso genera un nuovo nugget modello sulle canvas.
Fare clic con il tasto destro del mouse sul modello nugget e selezionare Visualizza modello per visualizzare i dettagli del modello.
Visualizzare le Informazioni sul modello che fornisce un riepilogo del modello.
Clicca su Prime regole di decisione. Una tabella visualizza una serie di regole che venivano utilizzate per assegnare i singoli record ai nodi child in base ai valori di diversi campi di input.
Fare clic su Importanza della funzione. Un grafico mostra l'importanza relativa di ogni predittore nella stima del modello. Da questo, si può notare che la creatinina sierica è facilmente il fattore più significativo, con il diabete essendo il successivo fattore più significativo.
Fare clic su Struttura ad albero. Lo stesso modello viene visualizzato sotto forma di albero, con un nodo ad ogni punto di decisione.
Passare con il mouse sul nodo superiore, che fornisce un riepilogo per tutti i record nel dataset. Quasi il 40% dei casi nel set di dati sono classificati come non diagnosticati con malattia renale. L'albero può fornire ulteriori indizi su quali fattori potrebbero essere responsabili.
Notare i due rami che derivano dal nodo superiore, che indica una suddivisione per creatinina sierica.
Esaminare il ramo che mostra i record in cui la creatinina sierica è maggiore di 1.25. In questo caso il 100% di quei pazienti ha una diagnosi di malattia renale positiva.
Esaminare il ramo che mostra i record in cui la creatinina sierica è inferiore o uguale a 1.25. Quasi il 80% di quei pazienti non ha una diagnosi di malattia renale positiva, ma quasi il 20% con creatinina sierica inferiore è stato ancora diagnosticato con malattie renali.
Si noti che i rami derivano da sc<=1.250, che è suddiviso per diabete.
Esaminare il ramo che mostra i pazienti con bassa creatinina sierica (sc<=1.250) e diabete diagnosticato (dm = sì). Al 100% di questi pazienti sono stati diagnosticati anche malattie renali.
Rivedere il ramo che mostra i pazienti con creatinina sierica bassa (sc<=1.250) e nessun diabete (dm = no), l'85% non è stato diagnosticato con malattia renale, ma il 15% di loro è stato ancora diagnosticato con malattia renale.
Si noti che i rami derivano da dm = no, che è suddiviso per l'ultimo fattore significativo, età.
Esaminare il ramo che mostra i pazienti di età pari o inferiore a 14 anni (età < = 14). Questo ramo mostra che il 75% dei pazienti giovani con bassa creatinina sierica e nessun diabete era a rischio di malattia renale.
Rivedere il ramo che mostra i pazienti di età superiore a 14 anni (età> 14). Questa branca mostra che solo il 12% dei pazienti di età superiore ai 14 anni con bassa creatinina sierica e nessun diabete era a rischio di malattia renale.
Usa la navigazione breadcrumb per navigare verso il tuo modello.
Controlla i tuoi progressi
La seguente immagine mostra il diagramma della struttura ad albero.

Attività 6: Valutare il modello
Attenersi alla seguente procedura per utilizzare i nodi Analisi e Tabella per valutare il modello:
Dalla sezione Outputs , trascinare il nodo Analisi sulla canvas.
Collegare il nugget Model al nodo Analisi .
Fare clic con il tasto destro del mouse sul nodo Analisi e selezionare Esegui.
Dal pannello Output , aprire Analisi, che mostra che il modello ha previsto correttamente una diagnosi di malattia renale quasi il 95% del tempo. Chiudere l' Analisi.
Fare clic con il tasto destro del mouse sul nodo Analisi e selezionare Salva ramo come modello.
Per il Nome modello, digitare
Kidney Disease Analysis.Fare clic su Salva.
Fare clic su Chiudi.
Dalla sezione Outputs , trascinare il nodo Tabella sulla canvas.
Collegare il nugget Modello al nodo Tabella .
Fare clic con il pulsante destro del mouse sul nodo Tabella e selezionare Anteprima dati.
Quando i pannelli Preview, scorrere verso le ultime due colonne. La colonna C - Classe contiene la previsione della malattia renale e la colonna $CC - Class indica il punteggio di fiducia per quella previsione.
Chiudere la Anteprima.
Controlla i tuoi progressi
La seguente immagine mostra la tabella di anteprima con le previsioni.

Attività 7: Distribuire e testare il modello con nuovi dati
Infine, seguire questi passi per distribuire questo modello e prevedere il risultato con nuovi dati.
Tornare alla scheda Assetti del progetto.
Fare clic sulla sezione Modelli e aprire il modello Analisi della malattia renale .
Fare clic sull'icona Promuovi allo
spazio di distribuzione.
Scegli uno spazio di distribuzione esistente. Se non si dispone di uno spazio di distribuzione, è possibile crearne uno nuovo:
Fornire un nome spaziale.
Fare clic su Crea.
Fare clic su Chiudi.
Seleziona Vai al modello nello spazio dopo averlo promosso.
Clicca su Promuovere.
Quando il modello viene visualizzato nello spazio di distribuzione, fare clic su Nuova distribuzione.
Selezionare Online come Tipo di distribuzione.
Specificare un nome per la distribuzione.
Fare clic su Crea.
Quando la distribuzione è completa, fare clic sul nome della distribuzione per visualizzare la pagina dei dettagli di distribuzione.
Vai alla scheda Test . È possibile testare il modello distribuito dalla pagina dei dettagli di distribuzione in due modi: test con modulo o test con codice JSON.
Fare clic su Input JSON, quindi copiare i seguenti dati di test e incollarli per sostituire il testo JSON esistente:
{ "input_data": [ { "fields": [ "age", "bp", "sg", "al", "su", "rbc", "pc", "pcc", "ba", "bgr", "bu", "sc", "sod", "pot", "hemo", "pcv", "wbcc", "rbcc", "htn", "dm", "cad", "appet", "pe", "ane", "class" ], "values": [ [ "62", "80", "1.01", "2", "3", "normal", "normal", "notpresent", "notpresent", "423", "53", "1.8", "", "", "9.6", "31", "7500", "", "no", "yes", "no", "poor", "no", "yes", "ckd" ] ] } ] }Fare clic su Predetto per prevedere se a un bambino di 62 anni con diabete e un rapporto della creatinina sierica di 1.8 potrebbe essere diagnosticata una malattia renale. La previsione che ne deriva indica che questo paziente ha un'elevata probabilità di una diagnosi di malattia renale.
Controlla i tuoi progressi
La seguente immagine mostra la scheda Test per la distribuzione del modello con una previsione.

Passi successivi
Ora è possibile utilizzare questo dataset per ulteriori analisi. Ad esempio, è possibile eseguire attività quali:
Ulteriori risorse
Trova ulteriori tutorial SPSS Modeler
Prova questi altri metodi per costruire modelli:
Visualizza altri video
Contribuire alla comunità diSPSS Modeler