JupyterLab con integrazione Git obsoleta (Watson Studio)

JupyterLab consente di lavorare con documenti e attività come i notebook Jupyter, gli script di Python , gli editor di testo e i terminali fianco a fianco in un'area di lavoro a schede. L'IDE JupyterLab , incluso in IBM Watson Studio, fornisce tutti i blocchi di costruzione per lo sviluppo di elaborazioni analitiche interattive con Python.

Accesso a JupyterLab

JupyterLab in IBM Watson Studio include l'estensione per l'accesso a un repository Git che consente di lavorare nei rami di repository. Per utilizzare JupyterLab per lavorare su notebook o Python script per esempio, è necessario creare un progetto integrato con GIT e che consente di modificare i notebook solo con l'IDE JupyterLab .

Guarda il seguente video vedere come abilitare l'integrazione Git per utilizzare il Jupyter Lab IDE.

Questo video fornisce un metodo visivo in alternativa a seguire le fasi scritte in questa documentazione.

  1. Creare un progetto che abbia accesso Git e consente di modificare i notebook solo con JupyterLab. Consultare Creazione di un progetto con integrazione GIT obsoleta.
  2. Abilitare la collaborazione del progetto in JupyterLab. Consultare Collaborazione in JupyterLab.
  3. Clicca su JupyterLab dal menu Launch IDE sulla barra di azione del tuo progetto.
  4. Selezionare l'ambiente in cui avviare JupyterLab e il token di accesso Git personale.

    L'estensione Git è pre - installata, consentendo l'accesso al repository che si è associato al proprio progetto al momento del lancio e aggiungendo la scheda Git alla barra laterale sinistra in JupyterLab.

    Il repository Git viene clonato al momento del lancio e può essere visualizzato nella scheda Files nella barra laterale sinistra nella cartella denominata project_git_repo/<your_git_repo>.

    Importante: il clone viene estratto dal ramo di repository Git selezionato nel momento in cui è stato creato il progetto.

  5. Gestire i tuoi file nell'area di lavoro principale dell'IDE:

    1. Fare clic sulla scheda Browser file dalla barra laterale sinistra.
    2. Selezionare project_git_repo (la cartella Git clonata) e navigare in <your_git_repo>/assets/jupyterlab. Tutto il lavoro che si fa sui file in JupyterLab, si fa nel proprio clone del repository.

      Importante: per abilitare la condivisione delle modifiche apportate ai file presenti nel proprio clone con gli altri che lavorano sui propri cloni del repository Git , è necessario lavorare sui file nella cartella <your_git_repo>/assets/jupyterlab (o qualsiasi sottocartella all'interno di jupyterlab). Solo le modifiche dei file effettuate in questa cartella possono essere spinte al repository Git e le modifiche apportate da altri utenti hanno tirato il tuo clone.

    3. Inizia a lavorare sui notebook da:

      • Selezione della teglia del notebook nella vista launcher JupyterLab . La vista launcher viene mostrata dopo che JupyterLab è avviata e può essere aperta anche cliccando su File> Nuovo launcher dal menu File JupyterLab .
      • Selezione File> Nuovo> Notebook.
      • Caricamento di un file notebook dalla macchina locale.
      • Creazione di un notebook da file.
    4. Inizia a lavorare su script Python da:

      • Selezione del file Python nella vista launcher JupyterLab . La vista launcher viene mostrata dopo che JupyterLab è avviata e può essere aperta anche cliccando su File> Nuovo launcher dal menu File JupyterLab .
      • Selezione di File> Nuovo> Python File.
      • Caricamento di uno script Python dalla tua macchina locale.
      • Creazione di uno script Python da file.

      Nota: è possibile lavorare e collaborare solo su script .py Python regolari. Non è possibile lavorare e collaborare su script di IPython (.ipy files). Questi file non possono essere spinti o tirati dal repository Git .

  6. Salva le modifiche del tuo file sul tuo clone locale prima di impegnarti nel repository Git .
  7. Spingere le modifiche del file sul respositorio Git utilizzando la scheda Git dalla barra laterale sinistra:

    1. Traccia le modifiche ai tuoi file.
    2. Aggiungere una descrizione di modifica e impegnare le modifiche di allestimento al clone locale del proprio repository nella sessione JupyterLab .
    3. Clicca su l'icona push dalla barra degli strumenti sulla scheda Git per spingere le modifiche al repository remoto in cui le modifiche possono essere viste e a cui si accede da altri utenti. Risolvere eventuali conflitti di unione che potrebbero essere causati da modifiche concorrenti ai file su cui si sta collaborando.

      Da notare che anche se un file di checkpoint non è visibile nella UI JupyterLab , viene spinto al repository Git quando le modifiche vengono spinte. Tuttavia, questo file non può essere utilizzato per tornare alle modifiche precedentemente salvate dei file in JupyterLab.

      Dalla barra degli strumenti sulla scheda Git è possibile anche tirare le modifiche dei file effettuate dai collaboratori al proprio clone del repository.

  8. Dopo aver terminato di lavorare sui notebook o sugli script Python e aver spinto le modifiche, sincronizzate le modifiche apportate al repository Git con gli asset del vostro progetto. Consultare Syncing Git cambia con il tuo progetto.

    Sincronizzando il notebook Git con il progetto, si aggiorna il clone del progetto condiviso comune per riflettere ciò che è stato spinto per l'ultima volta al repository Git . Ricordati che il clone del progetto viene estratto dal ramo di repository Git selezionato nel momento in cui è stato creato il progetto.

Collaborazione in JupyterLab

Con il sytem di controllo versione Git aggiunto tramite l'estensione Git in JupyterLab, gli utenti possono condividere il loro lavoro sui file in JupyterLab. Per abilitare la condivisione quando si lavora sui file, gli utenti devono essere aggiunti al progetto come collaboratori e devono avere un token di accesso per il repository del progetto associato Git , che devono selezionare quando si aprono JupyterLab.

Per consentire agli utenti in un progetto di tracciare e condividere i cambiamenti di file in JuypterLab:

  1. Aggiungere gli utenti come collaboratori al progetto e assegnare loro ruolo Admin o Editor . È possibile invitare solo gli utenti che hanno un account esistente IBM Cloud Pak for Data . Consultare Aggiunta collaboratori.
  2. Dare a tutti i collaboratori le autorizzazioni di accesso appropriate al repository del progetto Git .
  3. Istruire tutti i collaboratori a creare il proprio token di accesso personale per il repository del progetto associato. Consultare Creazione di token di accesso personali per i repository Git.

    Quando i collaboratori aprono JupyterLab, vedranno il loro token di accesso personale Git nell'elenco dei token disponibili.

Gestione dei file

Dalla scheda Files nella barra laterale sinistra in JupyterLabè possibile lavorare con:

Supporto e limitazioni per gli script Python

Consultare la tabella delle configurazioni supportate per gli script Python .

Ambiente Lingua Variabili di ambiente Argomenti

Locale -Python | Python | TRUE | FALSE Spark -Python | Python | TRUE | FALSE Jupyter Labs | N/A | N/A | N/A |

Environment variables se la personalizzazione delle variabili di ambiente è una funzione.

Arguments se gli argomenti sono consentiti per il lavoro.

Gli argomenti della riga di comando sono solo per script R e non ancora supportati per gli script Python .

Caricamento e accesso dei dati

È possibile caricare e accedere ai dati in notebook in GiuypterLab lo stesso modo in cui si fa per i notebook Jupyter nell'editor del notebook facendo clic sull'icona Trova e Aggiungi dati (Mostra l'icona dei dati di ricerca) sulla barra delle azioni JupyterLab . I file che si caricano o le connessioni che configurano vengono aggiunti come asset al proprio progetto. Dal notebook JupyterLab è anche possibile aggiungere codice generato automaticamente per accedere ai dati utilizzando la funzione Insert to code . Consultare Lettura e accesso ai dati in un notebook.

Importante: quando si utilizza la funzione Insert to code per accedere ad una connessione al database in un notebook in JupyterLabnon sono esposte le credenziali di accesso. Ciò significa che quando si impegna e si spingono le modifiche al repository Git , le proprie credenziali non saranno visibili ai collaboratori Git .

Aggiunta o eliminazione di asset dati del progetto

È necessario caricare i file di dati da utilizzare nei notebook dal reperire e aggiungere la barra degli appunti dei notebook perché questi file vengono aggiunti automaticamente come asset di dati al proprio progetto. La barra laterale dei dati si apre quando si fa clic sull'icona Trova e Aggiungi dati (Mostra l'icona dei dati di ricerca) sulla barra di azione JupyterLab .

Se hai creato file di dati in JupyterLabe vuoi aggiungere questi file al progetto come asset di dati, puoi. Da notare però che questi file devono essere collocati nella cartella project_data_assets del tuo clone repository. Per aggiungere questi file come asset dati al progetto:

  1. Nella pagina Asset del progetto, fare clic sull'icona Trova e Aggiungi dati (Mostra l'icona dei dati di ricerca) e selezionare la scheda File .
  2. Selezionare i file che si desidera aggiungere al progetto come asset.
  3. Dall'elenco Azioni, selezionare Aggiungi come asset dati e applicare le modifiche.

Se si elimina un asset di dati dalla cartella project_data_assets in JupyterLab, è necessario indicare questo sulla pagina Asset del proprio progetto mediante:

  1. Selezione dell'asset di dati nella scheda Files nel pannello di ricerca e aggiunta di dati.
  2. Dall'elenco Azioni, selezionando Elimina e applicando le modifiche.

Utilizzo di notebook al di fuori di JuypterLab

I notebook che vengono creati in JupyterLab e vengono spinti al repository e poi sincronizzati con il progetto possono essere modificati solo in JupyterLab. Al di fuori JupyterLab, questi notebook possono essere aperti solo dalla pagina Assets del progetto in modalità di lettura (read-only).

Quando si apre il notebook nel visualizzatore del notebook è possibile:

Utilizzo di script Python esterni JupyterLab

Gli script Python creati in JupyterLab e vengono spinti al repository e poi sincronizzati con il progetto vengono aggiunti come Scripts alla pagina del progetto Assets .

È possibile:

Estensioni supportate

Le seguenti estensioni JupyterLab sono attualmente supportate:

Limitazioni

Esistono i seguenti limiti:

Ulteriori informazioni

Argomento principale: Analisi dei dati e modelli di costruzione