RStudio

O R é um pacote popular de análise estatística e aprendizado de máquina que permite o gerenciamento de dados e inclui testes, modelos, análises e gráficos. RStudio, incluído no IBM watsonx.ai Studio, fornece um ambiente de desenvolvimento integrado para trabalhar com scripts R.

Informações e limitações de uso

  • RStudio está disponível somente em watsonx implantações em IBM Cloud. watsonx as implantações em AWS não podem usar RStudio.
  • RStudio está integrado aos projetos do IBM watsonx.ai Studio. Você pode iniciá-lo depois de criar um projeto.
  • Você pode acessar e usar arquivos de dados armazenados no IBM Cloud Object Storage associado ao seu projeto.
  • Você pode usar o RStudio IDE para criar aplicativos Shiny, mas não pode implementá-los no IBM watsonx.

Iniciando o IDE RStudio

Para iniciar o IDE RStudio em seu projeto:

  1. Clique em RStudio a partir do menu Ativar IDE na barra de ações do projeto.

  2. Selecione um ambiente.

  3. Clique em Ativar.

    O tempo de execução do ambiente é iniciado e o ambiente de desenvolvimento é aberto.

    Se você tiver problemas ao iniciar o RStudio, consulte Solução de problemas ao iniciar o RStudio.

Solução de problemas com a inicialização do RStudio IDE

Você pode encontrar os seguintes problemas ao iniciar o RStudio :

Estado RStudio corrompido de uma sessão anterior

Questão:
Às vezes, quando você inicia uma sessão RStudio, pode ocorrer um estado corrompido de RStudio de uma sessão anterior e a sessão não será iniciada.
Solução:
Após iniciar o IDE RStudio, na etapa em que você seleciona o ambiente RStudio, selecione Redefinir o espaço de trabalho. RStudio é iniciado usando as configurações padrão com um espaço de trabalho limpo RStudio.

Trabalhando com arquivos de dados

No RStudio, é possível trabalhar com arquivos de dados de diferentes origens:

  • Arquivos na estrutura de arquivos do servidor RStudio, que podem ser visualizados ao clicar em Arquivos na seção inferior direita do RStudio. Esse é o local onde é possível criar pastas, fazer upload de arquivos de seu sistema local e excluir arquivos.

    Para acessar esses arquivos no R, é necessário configurar o diretório de trabalho para o diretório com os arquivos. Para fazer isso, é possível navegar para o diretório que contém os arquivos e clicar em Mais > Configurar como Diretório ativo.

    Esteja ciente de que os arquivos armazenados no diretório Home da instância do RStudio são persistentes apenas dentro da instância e não podem ser compartilhados entre ambientes ou internamente no projeto.

    Renúncia de responsabilidade de vídeo: algumas etapas menores e elementos gráficos nos vídeos nesta página podem ser diferentes de sua implementação.

    Assista a este vídeo para ver como carregar os dados para o RStudio.

    Este vídeo fornece um método visual para aprender os conceitos e tarefas nesta documentação.

  • Os ativos de dados do projeto armazenados no depósito do IBM Cloud Object Storage associado ao projeto. Quando o RStudio é ativado, o conteúdo do depósito do IBM Cloud Object Storage é montado no diretório do project-objectstorage em seu diretório Home do RStudio.

    Caso queira que os arquivos de dados apareçam no diretório project-objectstorage, você deve incluí-los como ativos em seu projeto. Consulte Incluindo arquivos como ativos de projetos.

    Caso novos ativos de dados sejam incluídos no projeto enquanto você estiver no RStudio e você queira acessá-los, é necessário atualizar a pasta do project-objectstorage.

    Veja como ler e gravar dados no e a partir do Cloud Object Storage.

  • Os dados armazenados em um sistema de banco de dados.

    Assista a este vídeo para ver como se conectar a origens de dados externas no RStudio.

    Este vídeo fornece um método visual para aprender os conceitos e tarefas nesta documentação.

  • Arquivos armazenados no armazenamento local que são montados para /home/rstudio. O diretório home tem um limite de armazenamento de 2 GB e é usado para armazenar o espaço de trabalho da sessão RStudio. Observe que são alocados 2 GB para o armazenamento do diretório home em todos os seus projetos, independentemente de você usar ou não RStudio em cada projeto. Como consequência, você deve apenas armazenar arquivos de script R e pequenos arquivos de dados no diretório home . Ele não é destinado a arquivos de dados grandes ou grande saída gerada. Todos os arquivos de dados grandes devem ser carregados como ativos do projeto, que são montados para o diretório project-objectstorage de onde você pode acessá-los.

Incluindo arquivos como ativos de projeto

Se você quiser que seus arquivos de dados apareçam noproject-objectstorage diretório, você deverá adicioná-los ao seu projeto como ativos de dados. Para incluir esses arquivos como ativos de dados no projeto:

  1. Na página Assets (Ativos) do projeto, clique no ícone Upload asset to project (Carregar ativo para o projeto ) Ícone Fazer upload do ativo para o projeto e selecione a guia Files (Arquivos).
  2. Selecione os arquivos que deseja adicionar ao projeto como ativos.
  3. Na lista de Ações, selecione Incluir como ativo de dados e aplique suas mudanças.

Consumo de capacidade e escopo de tempo de execução

O tempo de execução de um ambiente RStudio tem sempre o escopo de um modelo de ambiente e de um usuário de sessão RStudio. Apenas uma sessão RStudio pode estar ativa por usuário do watsonx.ai Studio de cada vez. Caso tenha iniciado o RStudio em outro projeto, você será questionado se deseja parar a outra sessão e iniciar uma nova sessão do RStudio no contexto do projeto atual no qual está trabalhando.

O uso de tempo de execução é calculado pelo número de horas de unidade de capacidade (CUHs) consumidas pelo tempo de execução do ambiente ativo. As CUHs consumidas por um tempo de execução do RStudio ativo em um projeto são faturadas na conta do criador do projeto. Veja Faturamento horário das unidades de capacidade no RStudio.

Na página Ambientes, é possível ver quais tempos de execução do ambiente do RStudio estão ativos. É possível parar seu tempo de execução nessa página.

Lembre-se: o contador de CUH continuará a aumentar enquanto o tempo de execução estiver ativo, portanto, pare o tempo de execução se não estiver usando o RStudio. Se você não interromper explicitamente o tempo de execução, ele será interrompido para você após um tempo ocioso de 2 horas. Durante esse tempo inativo, você continuará a consumir CUHs para os quais é faturado. As tarefas longas de processamento intensivo de informações são paradas imediatamente após 24 horas.

Assista a este vídeo para uma visão geral do IDE do RStudio.

Renúncia de responsabilidade de vídeo: Algumas etapas secundárias e elementos gráficos neste vídeo podem ser diferentes de sua plataforma

Este vídeo fornece um método visual para aprender os conceitos e tarefas nesta documentação.

  • Transcrição de vídeo
    Horário Transcrição
    00:00 Este vídeo é um tour rápido pelo ambiente de desenvolvimento integrado RStudio em um projeto.
    00h07 Em qualquer projeto, você pode iniciar o IDE RStudio.
    00:12 RStudio é um ambiente de desenvolvimento integrado gratuito e de código aberto para o R, uma linguagem de programação para computação estatística e gráficos.
    00:22 No RStudio, há quatro painéis: o painel de origem, o painel do console, o painel de ambiente e o painel de arquivos.
    00:32 As panelas ajudam você a organizar o seu trabalho e separam as diferentes tarefas que você fará com a R.
    00:39 Você pode arrastar para redimensionar as panelas ou usar os ícones para minimizar e maximizar um painel.
    00:47 Você também pode reorganizar as panes em opções globais.
    00:53 A pane do console é a sua interface para R.
    00h56 É exatamente o que você veria em janelas de terminal ou de interfaces de usuário empacotados com R.
    01:01 A pane do console tem alguns recursos adicionados que você vai achar útil.
    01:06 Para executar código a partir do console, basta digitar o comando.
    01:11 Comece digitando um comando para ver uma lista de comandos que começam com as letras que você começou a digitar.
    01:17 Destaque um comando na lista e pressione "Enter" para inserí-lo.
    01:24 Use a seta para cima para rolar pelos comandos que você já entrou anteriormente.
    01:31 À medida que você emite mais comandos, você pode rolar pelos resultados.
    01:36 Use a opção de menu para limpar o console.
    01:39 Você também pode usar preenchimento de guia para ver uma lista das funções, objetos e conjuntos de dados iniciados com esse texto.
    01:47 E use as setas para destacar um comando para ver ajuda para esse comando.
    01:51 Quando estiver pronto, basta pressionar "Enter" para inserí-lo.
    01:55 A seguir, você verá uma lista com as opções para esse comando no contexto atual.
    01:59 Por exemplo, o primeiro argumento para a função read.csv é o arquivo.
    02:05 RStudio exibirá uma lista das pastas e arquivos em seu diretório de trabalho, para que você possa localizar facilmente o arquivo a ser incluído com o argumento.
    02:16 Por último, se você utilizar o preenchimento da guia com uma função que espera um nome de pacote, como uma biblioteca, você verá uma lista de todos os pacotes instalados.
    02:28 A seguir, vamos olhar para o painel de origem, que é simplesmente um editor de texto para você escrever seu código R.
    02:34 O editor de texto suporta arquivos de comandos R e texto simples, bem como vários outros idiomas, e inclui o destaque específico da linguagem no contexto.
    02:47 E você notará que a conclusão da guia também está disponível no editor de texto.
    02:53 A partir do editor de texto, você pode executar uma única linha de código, ou selecionar várias linhas de código a serem executadas e verá os resultados na pane do console.
    03:08 Você pode salvar seu código como um script R para compartilhar ou executar novamente mais tarde.
    03:15 A função view abre uma nova guia que mostra o dataframe em formato de planilha.
    03:22 Ou você pode exiba-lo em sua própria janela.
    03:25 Agora, você pode rolar pelos dados, classificar as colunas, procurar por valores específicos ou filtrar as linhas usando os sliders e menus suspensos.
    03:41 A pane ambiente contém uma aba "Ambiente", uma aba "Histórico" e uma aba "Conexões", e mantém o controle do que vem acontecendo nesta sessão do R.
    03:51 A guia "Ambiente" contém os objetos R que existem em seu ambiente global, criado durante a sessão.
    03:58 Assim, ao criar um novo objeto na pane do console, ele exibe automaticamente na área de janela do ambiente.
    04:04 Você também pode visualizar os objetos relacionados a um pacote específico e até mesmo ver o código-fonte para uma função específica.
    04:12 Você também pode ver uma lista dos conjuntos de dados, expandir um conjunto de dados para inspecionar seus elementos individuais, e visualize-os no painel de origem.
    04:22 Você pode salvar o conteúdo de um ambiente como um arquivo .RData, assim você pode carregar esse arquivo .RData em uma data posterior.
    04:29 A partir daqui, você também pode limpar os objetos da área de trabalho.
    04:33 Se você deseja excluir itens específicos, use a visualização do grid.
    04:38 Por exemplo, você pode facilmente encontrar grandes itens para excluir para liberar memória em sua sessão de R.
    04:45 A guia "Ambiente" também permite que você importe um conjunto de dados.
    04:50 É possível ver uma prévia do conjunto de dados e das opções de mudança antes de concluir a importação.
    04:55 Os dados importados serão exibidos no painel de origem.
    05h00 A guia "Histórico" exibe um histórico de cada um dos comandos que você executa na linha de comando.
    05:05 Assim como a guia "Ambiente", você pode salvar o histórico como um arquivo. Rhistory, assim você poderá abri-lo em uma data posterior.
    05:11 E essa aba tem as mesmas opções para limpar toda a história e entradas individuais na história.
    05:17 Selecione um comando e envie-o para o console para reexecutar o comando.
    05:23 Você também pode copiar um comando para o painel de origem para incluí-lo em um script.
    05:31 Na guia "Conexões", é possível criar uma nova conexão com uma fonte de dados.
    05:36 As escolhas nesta caixa de diálogo são dependentes de quais pacotes você instalou.
    05:41 Por exemplo, uma conexão "BLUDB" permite que você se conecte a um serviço Db2 Warehouse on Cloud .
    05:49 A pane de arquivos contém as guias "Arquivos", "Plots", "Pacotes", "Ajuda" e "Viewer".
    05:55 A guia "Arquivos" exibe o conteúdo do seu diretório de trabalho.
    05:59 RStudio carregará arquivos desse diretório e salvará arquivos nesse diretório.
    06:04 Navegue até um arquivo e clique no arquivo para visuá-lo no painel de origem.
    06:09 A partir daqui, é possível criar novas pastas e fazer upload de arquivos, seja selecionando arquivos individuais para fazer upload ou seleção de um arquivo .zip contendo todos os arquivos para upload.
    06:25 A partir daqui, você também pode excluir e renomear arquivos e pastas.
    06h30 Para acessar o arquivo em R, é necessário configurar a pasta de dados como um diretório de trabalho.
    06:36 Você verá que o comando setwd foi executado no console.
    06:43 Você pode acessar os ativos de dados em seu projeto abrindo a pasta do projeto.
    06:50 A guia "Plots" exibe os resultados das funções da trama de R, tais como: plot, hist, ggplot e xyplot
    07h00 Você pode navegar por diferentes tramas usando as setas ou zoom para ver uma tela cheia de gráfico.
    07:09 Você também pode excluir tramas individuais ou todas as parcelas daqui.
    07:13 Use a opção "Exportar" para salvar a trama como arquivo gráfico ou impresso na resolução especificada.
    07:21 A guia "Pacotes" exibe os pacotes que você atualmente instalou em sua biblioteca do sistema.
    07:26 A barra de pesquisa permite que você encontre rapidamente um pacote específico.
    7h30 Os pacotes verificados são os pacotes que já estavam carregados, utilizando o comando da biblioteca, na sessão atual.
    07:38 Você pode conferir pacotes adicionais a partir daqui para carregá-los ou desmarcar pacotes para descolá-los da sessão atual.
    07:45 A pane do console exibe os resultados.
    07:48 Use o "X" ao lado de um nome de pacote para remotá-lo da biblioteca do sistema.
    07:54 Você também pode encontrar novos pacotes para instalar ou atualizar para a versão mais recente de qualquer pacote.
    08:03 Clicar em qualquer um dos pacotes abre a guia "Ajuda" com informações adicionais para esse pacote.
    08:09 A partir daqui, você pode procurar funções para obter mais ajuda.
    08:13 E a partir do console, você pode usar o comando help, ou simplesmente digitar um ponto de interrogação seguido da função, para obter ajuda com essa função.
    08:21 A guia "Viewer" exibe saída HTML.
    08:25 Algumas funções R geram HTML para exibir relatórios e gráficos interativos.
    08:31 O pacote R Markdown cria relatórios que você pode visualizar na aba "Viewer".
    08:38 O pacote Shiny cria apps web que você pode visualizar na guia "Viewer".
    08:44 E outros pacotes constroem no framework htmlwidgets e incluem visualizacoes interativas baseadas em Java.
    08:54 Também é possível publicar a visualização no site livre, chamado "RPubs.com".
    09:01 Esta é uma breve visão geral do IDE RStudio.
    09:05 Encontre mais vídeos sobre RStudio na documentação Cloud Pak for Data as a Service.