Prevedere le promozioni sulle vendite al dettaglio
Questo tutorial crea due modelli per prevedere gli effetti delle future promozioni commerciali, quindi li confronta.
Analogamente al tutorial sul monitoraggio delle condizioni, il processo di data mining consiste nelle fasi di esplorazione, preparazione dei dati, addestramento e test. Non tutti i dati contenuti nel file telco.csv di dati sono utili per prevedere il tasso di abbandono. È possibile utilizzare il filtro per selezionare solo i dati considerati importanti da utilizzare come predittori (i campi contrassegnati come Importanti nel modello).
Anteprima del tutorial
Guarda questo video per vedere in anteprima i passaggi di questo tutorial. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è pensato come complemento al tutorial scritto. Questo video offre un metodo visivo per apprendere i concetti e le attività descritti in questa documentazione.
Prova il tutorial
In questo tutorial completerai le seguenti attività:
Esempio di flusso del modellatore e set di dati
Questo tutorial utilizza il flusso Promozione vendite al dettaglio nel progetto di esempio. Il file di dati utilizzato è goods2n.csv. L'immagine seguente mostra il flusso del modellatore di esempio.


Attività 1: Aprire il progetto di esempio
Il progetto di esempio contiene diversi set di dati e flussi di modellazione di esempio. Se non disponi già del progetto di esempio, consulta l'argomento Tutorial per creare il progetto di esempio. Quindi segui questi passaggi per aprire il progetto di esempio:
- Nel menu Cloud Pak for Data Navigazione,
seleziona Progetti > Tutti i progetti.
- Clicca su Progetto " SPSS Modeler ".
- Fai clic sulla scheda Risorse per visualizzare i set di dati e i flussi del modellatore.
Controlla i tuoi progressi
L'immagine seguente mostra la scheda Risorse del progetto. Ora sei pronto per lavorare con il flusso del modellatore di esempio associato a questo tutorial.

Attività 2: Esaminare i nodi Data Asset, Derive e Type
La promozione delle vendite al dettaglio comprende diversi nodi. Seguire questi passaggi per esaminare i nodi Data Asset, Derive e Type :
Nodo Asset dati
- Dalla scheda Risorse, apri il flusso del modellatore Promozione vendite al dettaglio e attendi il caricamento dell'area di lavoro.
- Fare doppio clic sul goods1n.csv nodo. Questo nodo è un nodo Data Asset che punta al goods1n.csv file nel progetto.
- Rivedere le proprietà del formato file.
- Clicca su Anteprima dati per visualizzare l'intero set di dati.
- Si noti che ogni record contiene:
Class. Tipo di prodotto.Cost. Prezzo unitario.PromotionIndice dell'importo speso per una particolare promozione.Before. Ricavi prima della promozione.After. Ricavi dopo la promozione.
I due campi relativi alle entrate (
BeforeeAfter) sono espressi in termini assoluti. Tuttavia, sembra probabile che l'aumento delle entrate dopo la promozione (e presumibilmente come risultato di essa) possa essere un dato più utile. - Chiudi l'anteprima dei dati e il riquadro laterale delle proprietà.
Nodo Ricava
- Fai doppio clic sul nodo Aumenta (Deriva). Questo nodo ricava il valore dell'aumento delle entrate.
- Controlla le impostazioni, in particolare il campo Espressione, che contiene una formula per ricavare l'aumento come percentuale delle entrate prima della promozione:
(After - Before) / Before * 100.0. - Fare clic su Anteprima dati per visualizzare il set di dati con i valori derivati.
- Notare la colonna Aumento.
Per ciascuna classe di prodotti, esiste una relazione abbastanza lineare tra l'aumento delle entrate ed i costi della promozione. Pertanto, è probabile che una struttura ad albero delle decisioni o una rete neurale potrebbero prevedere, con ragionevole precisione, l'aumento delle entrate dagli altri campo disponibili.
- Chiudi l'anteprima dei dati e il riquadro laterale delle proprietà.
Nodo Tipo
- Fare doppio clic sul nodo Definisci tipi (Tipo). Questo nodo specifica le proprietà dei campi, come il livello di misurazione (il tipo di dati contenuti nel campo) e il ruolo di ciascun campo come destinazione o input nella modellazione. Il livello di
misurazione è una categoria che indica il tipo di dati all'interno del campo. Il file dei dati sorgente utilizza tre diversi livelli di misurazione:
- Un campo continuo (come il
Agecampo ) contiene valori numerici continui. - Un campo nominale (come il
Educationcampo ) ha due o più valori distinti, in questo casoCollegeoHigh school. - Un campo ordinale (come il
Income levelcampo ) descrive dati con più valori distinti che hanno un ordine intrinseco, in questo casoLow,Medium, eHigh.Per ogni campo, il nodo Tipo specifica anche un ruolo per indicare la parte che ciascun campo svolge nella modellazione. Il ruolo è impostato su Target per il campo
Increase, che è il campo derivato. Iltargetè il campo per il quale si desidera prevedere il valore.Il ruolo è impostato su Input per la maggior parte degli altri campi. I campi di input sono talvolta noti come
predictorscampi i cui valori vengono utilizzati dall'algoritmo di modellazione per prevedere il valore del campo di destinazione.Il ruolo del
Aftercampo è impostato su Nessuno, quindi questo campo non viene utilizzato dall'algoritmo di modellazione.
- Un campo continuo (come il
- Opzionale: fare clic su Anteprima dati per visualizzare il set di dati con i valori derivati.
Controlla i tuoi progressi
L'immagine seguente mostra il nodo Tipo. Ora sei pronto per generare e confrontare i modelli.

Compito 3: Generare e confrontare i modelli
Il flusso addestra una rete neurale ed una struttura ad albero delle decisioni per effettuare la previsione dell'aumento delle entrate. Segui questi passaggi per generare i due modelli:
Generare i modelli
- Fare doppio clic sul nodo Aumento (rete neurale) per esaminarne le proprietà.
- Espandi la sezione Nozioni di base per vedere che il Multilayer Perceptron è il tipo di modello. Questa proprietà determina il modo in cui la rete collega i predittori agli obiettivi attraverso i livelli nascosti. Il perceptron multistrato consente relazioni più complesse, con il possibile svantaggio di un aumento dei tempi di addestramento e valutazione.
- Espandi la sezione Opzioni modello per visualizzare le proprietà di valutazione e punteggio.
- Fare doppio clic sul nodo Aumento (albero C&R) per visualizzarne le proprietà.
- Fai clic su Esegui tutto
e attendi che vengano generati i nugget del modello.
- Collegare il nugget del modello Increase (C&R Tree) al modello Increase (Neural net).
- Aggiungi un nodo Analisi :
- Dalla tavolozza, espandi la sezione Output.
- Trascinare il nodo Analisi sulla tela.
- Collegare il nugget del modello Increase (Rete neurale) al nodo Analysis.
- Modifica il set di dati per utilizzare dati diversi per l'analisi:
- Fare doppio clic sul goods1n.csv nodo per visualizzarne le proprietà.
- CV lick Modifica set di dati.
- Accedere a Risorse dati > GOODS2n.csv.
- Fare clic su Seleziona.
- Fare clic su Salva.
- Passa con il mouse sul nodo Analisi e fai clic sull'icona
Esegui.
- Nel riquadro Output e modelli, fare clic sull'output denominato Analisi per visualizzare i risultati.
Dai risultati dell'analisi, in particolare dalla correlazione lineare tra l'aumento previsto e la risposta corretta, si evince che i sistemi addestrati prevedono l'aumento delle entrate con un elevato grado di successo.
Ulteriori esplorazioni potrebbero concentrarsi sui casi in cui i sistemi addestrati commettono errori relativamente grandi. È possibile identificare questi errori tracciando un grafico dell'aumento previsto delle entrate rispetto all'aumento effettivo. È quindi possibile selezionare i valori anomali su un grafico utilizzando la grafica interattiva all'interno SPSS Modeler di e, dalle loro proprietà, potrebbe essere possibile ottimizzare la descrizione dei dati o il processo di apprendimento per migliorare la precisione.
Controlla i tuoi progressi
L'immagine seguente mostra l'output del nodo Analisi.

Riepilogo
Questo esempio ti ha mostrato come prevedere gli effetti delle future promozioni commerciali. Analogamente all'esempio del monitoraggio delle condizioni, il processo di data mining consiste nelle fasi di esplorazione, preparazione dei dati, addestramento e test.
Passi successivi
Ora sei pronto per provare altri SPSS® Modeler tutorial.