Antes de começar
Este tutorial é direcionado a desenvolvedores que queiram aprender a armazenar dados no formato XML em um banco de dados, conectar-se ao DB2 a partir de um aplicativo Python e aprender a converter dados de arquivos CSV para documentos XML. Embora seja uma vantagem, não é necessário conhecimento prévio sobre o Python (você aprenderá a instalá-lo neste tutorial). Este tutorial pressupõe que você utiliza o sistema operacional Microsoft® Windows®, mas os códigos devem funcionar, sem modificações, em outras plataformas. Quando você terminar este tutorial, você terá as habilidades necessárias para criar aplicativos Python poderosos que podem se comunicar e interagir com um banco de dados IBM DB2 e aproveitar o poder oferecido pelo pureXML.
O sistema de gerenciamento de banco de dados DB2 da IBM tem tido um papel importante na área de gerenciamento de dados relacionais. Entretanto, em anos recentes, houve um aumento significativo nos requisitos para que as estruturas de dados sejam mais flexíveis e direcionadas ao próprio documento. Um dos exemplos mais notáveis dessas estruturas de dados é o XML.
Enquanto muitos sistemas de banco de dados relacional têm se apressado para incorporar algum tipo de suporte XML aos seus bancos de dados, o IBM DB2 é o único no mercado que permite o armazenamento nativo de XML em seu banco de dados, sem alterações e fiel ao seu formato original. Ele é conhecido como pureXML—, uma tecnologia que permite aos desenvolvedores DB2 e DBA a manipularem e relatarem dados XML ao lado de dados relacionais, sem afetar de maneira negativa a pureza do próprio XML.
Neste tutorial, você desenvolverá um script Python que se conecta ao Web site do United States Census Bureau e baixa um arquivo CSV contendo dados sobre a população em níveis nacionais, regionais ou estaduais—incluindo os resultados do Censo de 2000 e as variações com base em estimativas de cada ano seguinte. Você aprenderá a processar estes dados, convertendo-os para um documento XML. Ao invés de importar este grande documento e contar com as funções do DB2 para dividi-lo e jogá-lo em linhas individuais, você utilizará o Python para inserir estes dados no DB2, com um documento XML armazenado para cada linha relevante no arquivo CSV. Finalmente, você criará um aplicativo de linha de comandos que gerará relatórios úteis a respeito destes dados, mostrando uma lista de estados, regiões ou países classificados em ordem decrescente, de acordo com a população.
Para seguir as etapas deste tutorial, é necessário possuir o seguinte software instalado:
- IBM DB2 Express-C 9.5 ou superior
- Python Version 2.6 ou qualquer versão anterior a 3.0
Consulte Recursos para ver os links para baixar esses pré-requisitos. Este tutorial pressupõe que você utiliza o sistema operacional Microsoft Windows, de preferência o XP ou superior. Para instalar o Python e a extensão IBM DB2 para Python, será necessário ter privilégios administrativos no seu computador.
