Avançar para a área de conteúdo

Ao clicar em Enviar, você concorda com os termos e condições do developerWorks.

A primeira vez que acessar o developerWorks, um perfil será criado para você. Informações do seu perfil (tais como: nome, país / região, e empresa) estarão disponíveis ao público, que poderá acompanhar qualquer conteúdo que você publicar. Seu perfil no developerWorks pode ser atualizado a qualquer momento.

Todas as informações enviadas são seguras.

  • Fechar [x]

Ao se conectar ao developerWorks pela primeira vez, é criado um perfil para você e é necessário selecionar um nome de exibição. O nome de exibição acompanhará o conteúdo que você postar no developerWorks.

Escolha um nome de exibição de 3 - 31 caracteres. Seu nome de exibição deve ser exclusivo na comunidade do developerWorks e não deve ser o seu endereço de email por motivo de privacidade.

Ao clicar em Enviar, você concorda com os termos e condições do developerWorks.

Todas as informações enviadas são seguras.

  • Fechar [x]

Manipule dados CSV com o Python e o pureXML

Importe e converta dados de censo dos EUA para XML usando o Python no IBM DB2 Express-C

Joe Lennon, Software developer, Core International
Joe Lennon photo
Joe Lennon, 24 anos, é desenvolvedor de software em Cork, Irlanda. Autor do livro Beginning CouchDB da Apress (ainda não publicado), tem colaborado com o IBM developerWorks com diversos artigos técnicos e tutoriais. Em seu tempo livre, Joe gosta de jogar futebol, mexer em pequenos mecanismos e bater seus recordes em seu Xbox 360.

Resumo:  O IBM® DB2® pureXML® lhe possibilita armazenar dados XML de forma nativa em um sistema de gerenciamento de banco de dados relacional, dando-lhe o poder e a flexibilidade de relatar estes dados sem perder as vantagens que o formato XML oferece. Neste tutorial, você aprenderá como se conectar a um banco de dados DB2 a partir da linguagem de programação Python, importando dados populacionais do United States Census Bureau. O Python será utilizado para converter este arquivo CSV para um arquivo XML, antes de inserir os dados XML de forma nativa no DB2. Finalmente, mostraremos como utilizar o Python para criar um aplicativo de linha de comandos que produza algumas tabelas informativas que podem ser acessadas através do menu do sistema.

Data:  26/Mar/2010
Nível:  Intermediário

Atividade:  21787 visualizações

Antes de começar

Este tutorial é direcionado a desenvolvedores que queiram aprender a armazenar dados no formato XML em um banco de dados, conectar-se ao DB2 a partir de um aplicativo Python e aprender a converter dados de arquivos CSV para documentos XML. Embora seja uma vantagem, não é necessário conhecimento prévio sobre o Python (você aprenderá a instalá-lo neste tutorial). Este tutorial pressupõe que você utiliza o sistema operacional Microsoft® Windows®, mas os códigos devem funcionar, sem modificações, em outras plataformas. Quando você terminar este tutorial, você terá as habilidades necessárias para criar aplicativos Python poderosos que podem se comunicar e interagir com um banco de dados IBM DB2 e aproveitar o poder oferecido pelo pureXML.

Sobre este tutorial

Acrônimos usados frequentemente

  • API: Application programming interface
  • CSV: Comma separated value
  • DBA: Database administrator
  • SQL: Structured Query Language
  • UI: User interface
  • URL: Uniform Resource Locator
  • XML: Extensible Markup Language

O sistema de gerenciamento de banco de dados DB2 da IBM tem tido um papel importante na área de gerenciamento de dados relacionais. Entretanto, em anos recentes, houve um aumento significativo nos requisitos para que as estruturas de dados sejam mais flexíveis e direcionadas ao próprio documento. Um dos exemplos mais notáveis dessas estruturas de dados é o XML.

Enquanto muitos sistemas de banco de dados relacional têm se apressado para incorporar algum tipo de suporte XML aos seus bancos de dados, o IBM DB2 é o único no mercado que permite o armazenamento nativo de XML em seu banco de dados, sem alterações e fiel ao seu formato original. Ele é conhecido como pureXML—, uma tecnologia que permite aos desenvolvedores DB2 e DBA a manipularem e relatarem dados XML ao lado de dados relacionais, sem afetar de maneira negativa a pureza do próprio XML.

Neste tutorial, você desenvolverá um script Python que se conecta ao Web site do United States Census Bureau e baixa um arquivo CSV contendo dados sobre a população em níveis nacionais, regionais ou estaduais—incluindo os resultados do Censo de 2000 e as variações com base em estimativas de cada ano seguinte. Você aprenderá a processar estes dados, convertendo-os para um documento XML. Ao invés de importar este grande documento e contar com as funções do DB2 para dividi-lo e jogá-lo em linhas individuais, você utilizará o Python para inserir estes dados no DB2, com um documento XML armazenado para cada linha relevante no arquivo CSV. Finalmente, você criará um aplicativo de linha de comandos que gerará relatórios úteis a respeito destes dados, mostrando uma lista de estados, regiões ou países classificados em ordem decrescente, de acordo com a população.


Pré-requisitos

Para seguir as etapas deste tutorial, é necessário possuir o seguinte software instalado:

  • IBM DB2 Express-C 9.5 ou superior
  • Python Version 2.6 ou qualquer versão anterior a 3.0

Consulte Recursos para ver os links para baixar esses pré-requisitos. Este tutorial pressupõe que você utiliza o sistema operacional Microsoft Windows, de preferência o XP ou superior. Para instalar o Python e a extensão IBM DB2 para Python, será necessário ter privilégios administrativos no seu computador.

1 de 9 | Próximo

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=80
Zone=Software livre, Information Management
ArticleID=477983
TutorialTitle=Manipule dados CSV com o Python e o pureXML
publish-date=03262010
author1-email=joe@joelennon.com
author1-email-cc=