JupyterLab con integrazione Git obsoleta (Watson Studio)
JupyterLab consente di lavorare con documenti e attività come i notebook Jupyter, gli script di Python , gli editor di testo e i terminali fianco a fianco in un'area di lavoro a schede. L'IDE JupyterLab , incluso in IBM Watson Studio, fornisce tutti i blocchi di costruzione per lo sviluppo di elaborazioni analitiche interattive con Python.
Accesso a JupyterLab
JupyterLab in IBM Watson Studio include l'estensione per l'accesso a un repository Git che consente di lavorare nei rami di repository. Per utilizzare JupyterLab per lavorare su notebook o Python script per esempio, è necessario creare un progetto integrato con GIT e che consente di modificare i notebook solo con l'IDE JupyterLab .
Guarda il seguente video vedere come abilitare l'integrazione Git per utilizzare il Jupyter Lab IDE.
Questo video fornisce un metodo visivo in alternativa a seguire le fasi scritte in questa documentazione.
- Creare un progetto che abbia accesso Git e consente di modificare i notebook solo con JupyterLab. Consultare Creazione di un progetto con integrazione GIT obsoleta.
- Abilitare la collaborazione del progetto in JupyterLab. Consultare Collaborazione in JupyterLab.
- Clicca su JupyterLab dal menu Launch IDE sulla barra di azione del tuo progetto.
Selezionare l'ambiente in cui avviare JupyterLab e il token di accesso Git personale.
L'estensione Git è pre - installata, consentendo l'accesso al repository che si è associato al proprio progetto al momento del lancio e aggiungendo la scheda Git alla barra laterale sinistra in JupyterLab.
Il repository Git viene clonato al momento del lancio e può essere visualizzato nella scheda Files nella barra laterale sinistra nella cartella denominata
project_git_repo/<your_git_repo>.Importante: il clone viene estratto dal ramo di repository Git selezionato nel momento in cui è stato creato il progetto.
Gestire i tuoi file nell'area di lavoro principale dell'IDE:
- Fare clic sulla scheda Browser file dalla barra laterale sinistra.
Selezionare project_git_repo (la cartella Git clonata) e navigare in
<your_git_repo>/assets/jupyterlab. Tutto il lavoro che si fa sui file in JupyterLab, si fa nel proprio clone del repository.Importante: per abilitare la condivisione delle modifiche apportate ai file presenti nel proprio clone con gli altri che lavorano sui propri cloni del repository Git , è necessario lavorare sui file nella cartella
<your_git_repo>/assets/jupyterlab(o qualsiasi sottocartella all'interno dijupyterlab). Solo le modifiche dei file effettuate in questa cartella possono essere spinte al repository Git e le modifiche apportate da altri utenti hanno tirato il tuo clone.Inizia a lavorare sui notebook da:
- Selezione della teglia del notebook nella vista launcher JupyterLab . La vista launcher viene mostrata dopo che JupyterLab è avviata e può essere aperta anche cliccando su File> Nuovo launcher dal menu File JupyterLab .
- Selezione File> Nuovo> Notebook.
- Caricamento di un file notebook dalla macchina locale.
- Creazione di un notebook da file.
Inizia a lavorare su script Python da:
- Selezione del file Python nella vista launcher JupyterLab . La vista launcher viene mostrata dopo che JupyterLab è avviata e può essere aperta anche cliccando su File> Nuovo launcher dal menu File JupyterLab .
- Selezione di File> Nuovo> Python File.
- Caricamento di uno script Python dalla tua macchina locale.
- Creazione di uno script Python da file.
Nota: è possibile lavorare e collaborare solo su script
.pyPython regolari. Non è possibile lavorare e collaborare su script di IPython (.ipyfiles). Questi file non possono essere spinti o tirati dal repository Git .
- Salva le modifiche del tuo file sul tuo clone locale prima di impegnarti nel repository Git .
Spingere le modifiche del file sul respositorio Git utilizzando la scheda Git dalla barra laterale sinistra:
- Traccia le modifiche ai tuoi file.
- Aggiungere una descrizione di modifica e impegnare le modifiche di allestimento al clone locale del proprio repository nella sessione JupyterLab .
Clicca su
dalla barra degli strumenti sulla scheda Git per spingere le modifiche al repository remoto in cui le modifiche possono essere viste e a cui si accede da altri utenti. Risolvere eventuali conflitti di unione che potrebbero essere causati da modifiche concorrenti ai file su cui si sta collaborando.Da notare che anche se un file di checkpoint non è visibile nella UI JupyterLab , viene spinto al repository Git quando le modifiche vengono spinte. Tuttavia, questo file non può essere utilizzato per tornare alle modifiche precedentemente salvate dei file in JupyterLab.
Dalla barra degli strumenti sulla scheda Git è possibile anche tirare le modifiche dei file effettuate dai collaboratori al proprio clone del repository.
Dopo aver terminato di lavorare sui notebook o sugli script Python e aver spinto le modifiche, sincronizzate le modifiche apportate al repository Git con gli asset del vostro progetto. Consultare Syncing Git cambia con il tuo progetto.
Sincronizzando il notebook Git con il progetto, si aggiorna il clone del progetto condiviso comune per riflettere ciò che è stato spinto per l'ultima volta al repository Git . Ricordati che il clone del progetto viene estratto dal ramo di repository Git selezionato nel momento in cui è stato creato il progetto.
Collaborazione in JupyterLab
Con il sytem di controllo versione Git aggiunto tramite l'estensione Git in JupyterLab, gli utenti possono condividere il loro lavoro sui file in JupyterLab. Per abilitare la condivisione quando si lavora sui file, gli utenti devono essere aggiunti al progetto come collaboratori e devono avere un token di accesso per il repository del progetto associato Git , che devono selezionare quando si aprono JupyterLab.
Per consentire agli utenti in un progetto di tracciare e condividere i cambiamenti di file in JuypterLab:
- Aggiungere gli utenti come collaboratori al progetto e assegnare loro ruolo Admin o Editor . È possibile invitare solo gli utenti che hanno un account esistente IBM Cloud Pak for Data . Consultare Aggiunta collaboratori.
- Dare a tutti i collaboratori le autorizzazioni di accesso appropriate al repository del progetto Git .
Istruire tutti i collaboratori a creare il proprio token di accesso personale per il repository del progetto associato. Consultare Creazione di token di accesso personali per i repository Git.
Quando i collaboratori aprono JupyterLab, vedranno il loro token di accesso personale Git nell'elenco dei token disponibili.
Gestione dei file
Dalla scheda Files nella barra laterale sinistra in JupyterLabè possibile lavorare con:
File di notebook e script Python
I file di notebook e gli script Python si trovano nella cartella denominata
/assets/jupyterlab(sottoproject_git_repo/<name_of_your_repo>). Il repository Git associato al progetto viene clonato in questa cartella quando si apre JupyterLab. È necessario creare, modificare o cancellare i file in questa cartella solo se si desidera pubblicare i propri committenti al repository Git e tirare le modifiche. Solo le modifiche Git apportate alla cartellajupyterlabo qualsiasi sottocartella nel repository possono essere sincronizzate con gli asset notebook nel progetto.Asset di dati di progetto
Gli asset dei dati del progetto sono elencati nella cartella denominata
assets/data_asset(sottoproject_git_repo/<name_of_your_repo>). Puoi aprire, visualizzare e lavorare con questi asset in GiuypterLab. Si noti che se si aggiunge un file regolare a questa cartella, il file non viene aggiunto automaticamente come asset di dati al progetto. Per aggiungere i file come asset dati del progetto, consultare Aggiunta di asset di progetto.Documenti in cartelle
I file creati nel file system locale della tua sessione JupyterLab sono persistenti. Se si arresta JupyterLab, e riavvii nuovamente in un altro giorno per esempio, si vedranno tutti i file delle sessioni precedenti.
Debug
A partire da ora, l'unico strumento di modifica disponibile per gli script Python in Watson Studio è JupyterLab. Gli utenti possono utilizzare il terminale per l'accesso a un runtime (solo per le kermesse locali) o il debug. Può essere utile per verificare i file di log, la memoria del contenitore o l'utilizzo della CPU per i processi di esecuzione, e l'installazione di ulteriori pacchetti Conda. L'accesso terminale ai kermesse Spark è disabilitato per motivi di sicurezza.
Supporto e limitazioni per gli script Python
Consultare la tabella delle configurazioni supportate per gli script Python .
| Ambiente | Lingua | Variabili di ambiente | Argomenti |
|---|---|---|---|
Locale -Python | Python | TRUE | FALSE Spark -Python | Python | TRUE | FALSE Jupyter Labs | N/A | N/A | N/A |
Environment variables se la personalizzazione delle variabili di ambiente è una funzione.
Arguments se gli argomenti sono consentiti per il lavoro.
Gli argomenti della riga di comando sono solo per script R e non ancora supportati per gli script Python .
Caricamento e accesso dei dati
È possibile caricare e accedere ai dati in notebook in GiuypterLab lo stesso modo in cui si fa per i notebook Jupyter nell'editor del notebook facendo clic sull'icona Trova e Aggiungi dati (
) sulla barra delle azioni JupyterLab . I file che si caricano o le connessioni che configurano vengono aggiunti come asset al proprio progetto. Dal notebook JupyterLab è anche possibile aggiungere codice generato automaticamente per accedere ai dati utilizzando la funzione Insert to code . Consultare Lettura e accesso ai dati in un notebook.
Importante: quando si utilizza la funzione Insert to code per accedere ad una connessione al database in un notebook in JupyterLabnon sono esposte le credenziali di accesso. Ciò significa che quando si impegna e si spingono le modifiche al repository Git , le proprie credenziali non saranno visibili ai collaboratori Git .
Aggiunta o eliminazione di asset dati del progetto
È necessario caricare i file di dati da utilizzare nei notebook dal reperire e aggiungere la barra degli appunti dei notebook perché questi file vengono aggiunti automaticamente come asset di dati al proprio progetto. La barra laterale dei dati si apre quando si fa clic sull'icona Trova e Aggiungi dati (
) sulla barra di azione JupyterLab .
Se hai creato file di dati in JupyterLabe vuoi aggiungere questi file al progetto come asset di dati, puoi. Da notare però che questi file devono essere collocati nella cartella project_data_assets del tuo clone repository. Per aggiungere questi file come asset dati al progetto:
- Nella pagina Asset del progetto, fare clic sull'icona Trova e Aggiungi dati (
) e selezionare la scheda File . - Selezionare i file che si desidera aggiungere al progetto come asset.
- Dall'elenco Azioni, selezionare Aggiungi come asset dati e applicare le modifiche.
Se si elimina un asset di dati dalla cartella project_data_assets in JupyterLab, è necessario indicare questo sulla pagina Asset del proprio progetto mediante:
- Selezione dell'asset di dati nella scheda Files nel pannello di ricerca e aggiunta di dati.
- Dall'elenco Azioni, selezionando Elimina e applicando le modifiche.
Utilizzo di notebook al di fuori di JuypterLab
I notebook che vengono creati in JupyterLab e vengono spinti al repository e poi sincronizzati con il progetto possono essere modificati solo in JupyterLab. Al di fuori JupyterLab, questi notebook possono essere aperti solo dalla pagina Assets del progetto in modalità di lettura (read-only).
Quando si apre il notebook nel visualizzatore del notebook è possibile:
- Condividi il link al notebook con altri utenti.
- Scaricare il notebook.
- Creare lavori in cui eseguire il notebook. Consultare Creazione di lavori per i file in un progetto con integrazione Git obsoleta.
Utilizzo di script Python esterni JupyterLab
Gli script Python creati in JupyterLab e vengono spinti al repository e poi sincronizzati con il progetto vengono aggiunti come Scripts alla pagina del progetto Assets .
È possibile:
- Creare lavori in cui eseguire gli script. Puoi farlo dalla pagina Assetti o Lavori del progetto.
- Promuovere lo script in uno spazio di distribuzione. Vedere Distribuzione di uno script Python.
Estensioni supportate
Le seguenti estensioni JupyterLab sono attualmente supportate:
- Estensione git JupyterLab
- Estensioni Jupyter nbdime
Queste estensioni Elyra sono disponibili:
- Elyra code snippet extension che consente di riutilizzare eventuali frammenti di codice nei notebook e script
- Elyra Python estensione editor che è un editor per lo sviluppo e l'esecuzione di script Python
- LSP (Language Server Protocol) estensione che migliora l'esperienza di sviluppo con funzioni quali l'autocompletamento, la navigazione in codice, i suggerimenti di hover, la lineatura del codice e la rinominazione. È possibile aprire il pannello di diagnostica in GiuypterLab mentre si lavora sul proprio codice per vedere e saltare tra la diagnostica fornita dal protocollo Language Server.
- Navigazione notebook che utilizza una tabella di contenuti generata automaticamente che migliora le funzionalità di navigazione nei notebook di grandi dimensioni. Per accedere alla tabella dei contenuti, selezionare la scheda Indice dalla barra laterale nel notebook aperto.
- Estensione di utilizzo delle risorse che ti aiuta a monitorare l'utilizzo delle risorse mostrando quanta memoria stai utilizzando mentre si codifica, e qual è il tuo limite di memoria. L'utilizzo delle risorse viene visualizzato nella parte inferiore della finestra. L'utilizzo delle risorse di monitoraggio è utile soprattutto nelle situazioni in cui non si è sicuri di quanta potenza di calcolo verrà consumata, ad esempio quando i modelli di formazione.
Vista semplice che consente di concentrarsi su un solo notebook. Per passare alla vista semplice, abilitare la scheda Indice nella barra laterale in un notebook aperto impostando Simple su on. Il centralino contenuto viene visualizzato nella parte inferiore sinistra della finestra.
Da notare che il protocollo LSP (Language Server Protocol) e le estensioni di utilizzo delle risorse sono abilitate solo per le kermesse locali (kermesse senza Spark e Hadoop).
Limitazioni
Esistono i seguenti limiti:
- Non è possibile esportare un file notebook in PDF da JupyterLab. È comunque possibile selezionare gli altri formati di file di esportazione dall'elenco.
- Gli asset dei dati del progetto elencati nella cartella denominata
assets/data_asset(sottoproject_git_repo/<name_of_your_repo>) sono di sola lettura.
Ulteriori informazioni
- Utilizzare l'ambiente JuypterLab fornito
- Creare il proprio ambiente JupyterLab
- Creare un lavoro per eseguire uno script di notebook o Python
- Eseguire il codice SAS in Carolina da Dulles Research
- Scopri cosa puoi fare in JupyterLab: Jupyter Lab: Evolution of the Jupyter Notebook
Argomento principale: Analisi dei dati e modelli di costruzione