跳转到主要内容

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

这是您第一次登陆到 developerWorks,已经自动为您创建了您的概要文件。 选择您概要文件中可以公开的信息的信息(如姓名、国家/地区,以及公司),这些信息同时也会与您所发布的内容相关联。 您可以随时更新您的 IBM 账号。

所有提交的信息确保安全。

  • 关闭 [x]

当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

所有提交的信息确保安全。

  • 关闭 [x]

使用 Python 和 pureXML 操作 CSV 数据

在 IBM DB2 Express-C 中使用 Python 导入美国人口普查数据并转换成 XML

Joe Lennon, 软件开发人员, Freelance
http://www.ibm.com/developerworks/i/p-jlennon.jpg
Joe Lennon 是一位来自爱尔兰科克市的软件开发人员,他今年 23 岁。Joe 目前为 Core International 工作,是 Web 应用程序和 Oracle PL/SQL 开发人员。他 2007 年毕业于 University College Cork,并获得商业信息系统专业的学位。他现在和他的女朋友 Jill 生活在科克市。

简介:  IBM® DB2® pureXML® 允许您将 XML 数据原生地储存在关系数据库管理系统中,从而允许您灵活地创建数据报告,并且仍然能够利用 XML 的优势。在本教程中,您将学习如何使用 Python 编程语言连接到 DB2 数据库,然后导入来自美国人口普查局的人口数据。在将 XML 数据原生地插入到 DB2 之前,您将使用 Python 把 CSV 文件转换成 XML。最后,您将使用 Python 创建一个命令行应用程序,它将生成一些可以通过菜单系统访问的信息表。

发布日期:  2010 年 2 月 04 日
级别: 中级

访问情况 : 12999 次浏览

开始之前

本教程主要针对希望了解如何以 XML 格式将数据存储在数据库中、从 Python 应用程序连接到 DB2 以及将数据从 CSV 文件转换成 XML 文档的开发人员。学习本教程不要求具备 Python 的知识(您将在本教程中了解如何安装 Python),但具有相关知识会有所帮助。本教程假设您使用 Microsoft® Windows® 操作系统,但所用的代码应该可用于其他操作系统。在学习完本教程之后,您将能够创建强大的 Python 应用程序,它可以与 IBM DB2 数据库交互并利用 pureXML 提供的功能。

关于本教程

常用缩略词

  • API:应用编程接口
  • CSV:逗号分隔值
  • DBA:数据库管理员
  • SQL:结构化查询语言
  • UI:用户界面
  • URL:统一资源定位符
  • XML:可扩展标记语言

IBM DB2 数据库管理系统早就成为关系数据管理方面的主导者。不过,在最近几年对更加灵活和面向文档的数据结构的需求越来越大。这种数据结构的杰出例子就是 XML。

在许多关系数据库系统开始在其数据库中添加某种形式的 XML 支持时,IBM DB2 是唯一允许将 XML 原生地储存在数据库中的产品,不需要对 XML 的初始形式进行任何更改。这种技术称为 pureXML — 它允许 DB2 开发人员和 DBA 以 XML 数据和关系数据的形式操作报告,并且不对 XML 的纯度产生不良影响。

在本教程中中,您将开发一个 Python 脚本,它连接到美国人口普查局的 Web 站点,并下载一个包含关于国家、地区和州级别的人口数据的 CSV 文件 —— 包括 2000 年的人口普查结果,并且在后续的年份中该数据根据估算值浮动。您将学习如何处理该数据,即将它转换成 XML 文档。您并不导入这个大型文档然后使用 DB2 函数将其划分成单个的行,而是使用 Python 将该数据插入到 DB2 中,其中使用一个 XML 文档来储存 CSV 文件中对应的每个相关行。最后,您将创建一个命令行应用程序,它生成一些关于该数据的有用报告,这些报告根据人口从多到少的顺序显示州、地区或国家列表。


先决条件

要遵循本教程中的步骤,您需要安装以下软件:

  • IBM DB2 Express-C 9.5 或更新版本
  • Python Version 2.6 或 3.0 之前的任何版本

参考资料 部分提供这些软件的下载链接。本教程假设您使用 Microsoft Windows 操作系统,最好是 XP 或更新版本。为了安装 Python 和针对 Python 的 IBM DB2 扩展,您需要具有管理员权限。

1 页,共 9 | 后一页

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=XML, Information Management, Open source, Web development
ArticleID=466472
TutorialTitle=使用 Python 和 pureXML 操作 CSV 数据
publish-date=02042010
author1-email=joe@joelennon.com
author1-email-cc=