Xây dựng một ứng dụng pureXML và JSON, Phần 1: Lưu trữ và truy vấn JSON với pureXML của DB2

Chấp nhận một ánh xạ JSON-thành-XML đơn giản

JavaScript Object Notation (JSON), một ký pháp văn bản phổ biến trong Web 2.0, được dùng để biểu diễn các đối tượng (hoặc cấu trúc dữ liệu) dưới dạng văn bản tuần tự hóa khi các trình khách và trình chủ trao đổi thông tin với nhau. Một số ứng dụng lợi dụng các đối tượng JSON lâu bền để duy trì trạng thái qua các phiên làm việc. Trong bài viết này, chúng ta hãy tìm hiểu cách pureXML® DB2® có thể lưu trữ, quản lý, và truy vấn JSON khi bạn chấp nhận một ánh xạ JSON-thành-XML đơn giản.

Nuno Job, Chuyên gia DB2, IBM  

Photo of Nuno JobNuno Job là một sinh viên học thạc sĩ từ Đại học Minho, người đã thực tập ở IBM tại Trung tâm nghiên cứu T.J. Watson, thuộc nhóm khai thông pureXML. Trong số các quan tâm của anh, bạn có thể thấy công nghệ Nguồn mở, Linux, An ninh, Riêng tư, Web và Các Cơ sở dữ liệu Phân cấp. Hiện nay Nuno đang làm cho IBM tại Toronto, nơi đó ông làm Chuyên gia khai thông kỹ thuật DB2, giúp khách hàng được xác nhận về các chương trình đối tác của IBM và duy trì một ứng dụng Ruby on Rails của IBM.



Susan Malaika, Chuyên viên kỹ thuật cao cấp, IBM Japan

Susan MalaikaSusan Malaika là chuyên viên cao cấp trong IBM Information Management Group (một phần của nhóm phần mềm IBM). Bà tập trung nghiên cứu về XML, Web và cơ sở dữ liệu, là các chuẩn phát triển hỗ trợ dữ liệu cho các môi trường điều khiển tại diễn đần Global Grid. Thêm vào đó bà cũng làm việc như là người phát triển phần mềm của IBM, trước đó bà làm việc trong lĩnh việc phân tích dữ liệu, phát triển và thiết kế ứng dụng Internet. Bà cũng là đồng tác giả sách trên Web và xuất bản các bài báo về xử lý tương tác và XML. Bà là một thành viên của Học viện công nghệ IBM



Michael Schenker, Kỹ sư phần mềm, IBM

Author Photo: Michael SchenkerMichael Schenker là một kỹ sư phần mềm làm việc tại phòng thí nghiệm thung lũng Silicon của IBM ở San Jose, California. Anh gia nhập vào IBM năm 2002 và làm việc trong nhóm phát triển công cụ cho máy chủ dữ liệu của IBM. Michael Schenker thành thạo trong việc tạo dịch vụ Web cho các máy chủ dữ liệu của IBM. Anh có bằng thạc sĩ về khoa học máy tính của trường đại học khoa học ứng dụng ở Leipzig, Đức



10 11 2009 (Xuất bản lần đầu tiên vào ngày 22 01 2011)

Giới thiệu

JavaScript (được định nghĩa trong Đặc tả Ngôn ngữ ECMAScript trong ECMA) là một ngôn ngữ kịch bản lệnh lần đầu tiên được thực hiện trong Netscape Navigator (một trình duyệt Web) để tăng cường việc xử lý của các trang Web. JSON (được định nghĩa trong RFC 4.627 tại IETF) là một định dạng biểu diễn các cấu trúc dữ liệu JavaScript, chẳng hạn như các đối tượng và mảng, dưới dạng văn bản tuần tự hóa.

Các thuật ngữ thường sử dụng

  • Ajax: JavaScript + XML không đồng bộ (Asynchronous JavaScript + XML)
  • API: Giao diện lập trình ứng dụng (Application programming interface)
  • DBMS: Hệ Quản trị Cơ sở dữ liệu (Database Management System)
  • DOM: Mô hình đối tượng tài liệu (Document Object Model)
  • HTTP: Giao thức truyền siêu văn bản (Hypertext Transfer Protocol)
  • IETF: Đơn vị đặc trách kỹ thuật Internet (Internet Engineering Task Force)
  • RFC: Đề xuất để xin góp ý (Request For Comments)
  • RSS: Dịch vụ Cung cấp thông tin đơn giản (Really Simple Syndication)
  • SAX: API đơn giản cho XML (Simple API for XML)
  • SOA: Kiến trúc Hướng dịch vụ (Service Oriented Architecture)
  • W3C: Hiệp hội World Wide Web (World Wide Web Consortium)
  • XHTML: Ngôn ngữ đánh dấu siêu văn bản mở rộng (Extensible HyperText Markup Language)
  • XML: Ngôn ngữ đánh dấu mở rộng được (Extensible Markup Language)
  • XSLT: Các chuyển đổi ngôn ngữ phiếu định kiểu mở rộng được (Extensible Stylesheet Language Transformation)

Trong khi XML (được định nghĩa trong đặc tả kỹ thuật XML 1.0 tại W3C) là một biểu diễn phổ biến để trao đổi thông báo giữa các trình chủ và trình khách được ghép lỏng, JSON thường được sử dụng để đạt được cùng một hiệu quả. Một trong những lý do để chấp nhận JSON là ở chỗ các đối tượng JSON dễ dàng được thao tác hơn bằng cách sử dụng các ngôn ngữ kịch bản như JavaScript, Python, hoặc Ruby.

Ý tưởng về việc lưu trữ và truy vấn XML trong các cơ sở dữ liệu đã nảy ra sau khi việc sử dụng XML để trao đổi dữ liệu trở nên phổ biến. Tương tự như vậy, thao tác và trao đổi JSON đã trở nên phổ biến, nhưng lưu trữ thì chưa. Tuy nhiên, các hệ quản trị cơ sở dữ liệu hướng tài liệu JSON đã bắt đầu xuất hiện. Thí dụ, Apache CouchDB được tuân thủ JSON chặt chẽ thông qua các giao diện và cách lưu trữ của nó

Trong bài này, chúng tôi giới thiệu khái niệm về sự trao đổi JSON như là XML để tận dụng các bộ xử lý XML, thiết bị XML, lưu trữ XML (thường có trong các cơ sở dữ liệu XML như pureXML DB2), và các công nghệ XML khác chẳng hạn như XQuery và XSLT. Để đạt được điều đó, chúng tôi sẽ giới thiệu một khuôn dạng XML có tên là JSONx, mô tả một ký pháp JSON-thành-XML thân thiện, và giải thích những sự khác nhau giữa JSONx và các khuôn dạng thân thiện đó.

Bằng cách làm theo các bước trong bài viết và phần tải về kèm theo này, bạn có thể xây dựng nên một kho lưu giữ JSON có chỉ mục và có thể truy vấn được dựa trên cơ sở dữ liệu mẫu pureXML DB2. Bài này là bài viết đầu tiên trong loạt ba bài minh họa cách xây dựng một ứng dụng pureXML ba tầng dựa trên JSON bằng cách kết hợp JSON, các dịch vụ web, và các tiểu trình OpenSocial (OpenSocial gadgets).

. Tổng quan về kiến trúc Các dịch vụ Phổ dụng (Universal Services)
Sơ đồ về kiến trúc Các dịch vụ phổ dụng với tương tác người dùng, các dịch vụ JSON phổ dụng, và dữ liệu

Các dịch vụ phổ dụng là một tập hợp đơn giản nhưng cố định các hoạt động (các phép toán) cơ sở dữ liệu cho phép truy vấn và sửa đổi dữ liệu XML, được lưu trong một cột pureXML của một cơ sở dữ liệu DB2. Các phép toán cơ sở dữ liệu này cho phép bạn chèn vào, cập nhật, xóa, và truy vấn dữ liệu, được trưng ra như các dịch vụ web thông qua cơ chế dịch vụ web dữ liệu. Xem phần Tài nguyên để biết thêm thông tin về Các dịch vụ phổ dụng dùng cho pureXML. Các dịch vụ phổ dụng JSON cho pureXML cũng đưa ra cùng các phép toán cơ sở dữ liệu đó cho trình khách, tuy nhiên bằng JSON chứ không phải bằng XML, trong khi tiếp tục làm việc với XML bên phía trình chủ. Ứng dụng khách không biết được rằng JSON đến và đi được chuyển thành XML ở phía trình chủ trong cơ sở dữ liệu.

Bài viết cũng khảo sát các lựa chọn mà bạn có thể thực hiện để biểu diễn JSON như là XML và sau đó tiếp tục mô tả một số kịch bản và cách áp dụng pureXML DB2 của IBM trong những kịch bản như vậy. Bài viết kèm theo một phần tải về (tên là JSONx bundle - gói JSONx) mà bạn có thể sử dụng để xây dựng một cơ sở dữ liệu pureXML JSONx mẫu. Nó có thể tạo nên một nền tảng cho các ứng dụng JSONx. Trong phần tải về có hai hàm DB2 do người sử dụng định nghĩa, chúng chuyển đổi qua lại giữa JSON và JSONx.

JSON

JSON là một khuôn dạng dựa văn bản, con người có thể đọc được, dùng để trao đổi dữ liệu giữa các trình khách và trình chủ. Nó cung cấp cho các nhà phát triển một khuôn dạng trao đổi, ánh xạ trực tiếp đến các cấu trúc dữ liệu mà họ sử dụng. Để có hiệu quả đó, JSON định nghĩa các cấu trúc dữ liệu chính sau đây: số, chuỗi ký tự, logic (đúng và sai), mảng (một dãy có trình tự các giá trị), đối tượng (tập hợp các cặp giá trị khoá), và rỗng (null).

Liệt kê 1 minh hoạ một đối tượng JSON mô tả một khách hàng. Lồng bên trong đối tượng customerinfo là hai đối tượng để xác định mã nhận dạng khách hàng (cid) và tên. Đối tượng customerinfo cũng chứa hai đối tượng có cấu trúc để xác định địa chỉ và số điện thoại khách hàng.

Liệt kê 1. Thông tin khách hàng Kathy Smith trong JSON
{
  "customerinfo" : {
	"cid" : 1000 ,
	"name" : "Kathy Smith" ,
	"addr" : {
	  "country"    : "Canada" ,
	  "street"     : "5 Rosewood" ,
	  "city"       : "Toronto" ,
	  "prov-state" : "Ontario" ,
	  "pcode-zip"  : "M6W 1E6"
	} ,
	"phone" : {
	  "work" : "416-555-1358"
	}
  }
}

Một kịch bản JSON điển hình

Một ca sử dụng điển hình dành cho JSON là có một ứng dụng Web hoán đổi dữ liệu cho nhau với một API chẳng hạn như Các Dịch vụ Web Yahoo hoặc API Twitter. Trong kịch bản này, một ứng dụng Web sử dụng các yêu cầu JavaScript không đồng bộ (Ajax) để trao đổi thông tin JSON với dịch vụ Web đã đưa ra API đó.

Thường thì một API như vậy cho phép ứng dụng chọn ra khuôn dạng hoán đổi. Các khuôn dạng được hỗ trợ thông dụng gồm XML, các chuẩn XML được định nghĩa trước chẳng hạn như RSS và Atom, và JSON. Để tìm thí dụ về các khuôn dạng như vậy xin tham khảo Phụ lục A.

Việc tự do lựa chọn khuôn dạng dùng để giao tiếp giữa ứng dụng và dịch vụ Web cho phép các nhà phát triển tăng tốc quy trình phát triển. Tuy nhiên, điều này phát sinh ra các câu hỏi liên quan đến việc duy trì một cơ sở hạ tầng hỗ trợ đồng thời nhiều khuôn dạng. Danh sách dưới đây bao gồm một số tùy chọn để lưu trữ dữ liệu:

  • Sử dụng một cơ sở dữ liệu JSON hướng tài liệu (document-centric) chẳng hạn như Apache CouchDB.
  • Sử dụng một cơ sở dữ liệu quan hệ bằng cách chia nhỏ và tái xây dựng JSON cho từng yêu cầu.
  • Sử dụng lưu trữ XML nguyên sinh (lưu trữ JSONx) và cung cấp các giao diện để đưa ra và xử lý JSON.

Hình 2 minh họa các thí dụ cho các tùy chọn lưu trữ dữ liệu này. (Xem Hình 2 lớn hơn.)

Hình 2. Các cách khác nhau để lưu trữ JSON
Ba cạc lưu JSON: Trong một cơ sở dữ liệu JSON, trong một cơ sở dữ liệu quan hệ, và như JSONx (kho lưu trữ XML)

Tất cả các cách tiếp cận này đều có những điểm mạnh và điểm yếu. Bài này không phân tích các khác biệt đó mà tập trung vào một kịch bản, trong đó việc sử dụng pureXML là cách tiếp cận thuận tiện nhất đối với một ứng dụng cụ thể. Một số lý do có thể làm cho XML trở thành cách tiếp cận thuận tiện nhất gồm:

  • Phần còn lại của cơ sở hạ tầng đã sử dụng XML và SOA từ trước
  • Sự tồn tại của các công cụ XML (chẳng hạn như Websphere® DataPower® của IBM) và các công nghệ XML có thể mở rộng được để làm việc với JSONx

Đối chiếu JSON với XML

Khi các nhà phát triển sử dụng XML để trao đổi, họ thường dẫn hướng trong XML thông qua DOM XML hay SAX. Khả năng làm việc với cùng một cấu trúc dữ liệu JSON để thao tác và để trao đổi sẽ làm đơn giản quy trình phát triển bằng việc cung cấp cách truy cập qua khai báo tới các đối tượng trong ngôn ngữ lập trình chủ của ứng dụng.

Việc tập trung vào XML là để cung cấp một ký pháp trao đổi tự định nghĩa, có thể kết hợp nếu muốn với một lược đồ nghiêm ngặt mà chính lược đồ này có thể trao đổi được. XML cũng cung cấp một loạt các đặc tính, chẳng hạn như vùng tên, nén, chữ ký số, và an ninh, cùng với các ngôn ngữ khai báo chẳng hạn như XQuery và XSLT mà có thể triệu gọi từ các ngôn ngữ lập trình C, Java™, và Ruby để thao tác một hoặc nhiều tài liệu XML.

JSON không có nhiều đặc tính mà XML có.

Biểu diễn JSON bằng XML

Tiêu điểm của bài viết này là để chỉ ra cách làm thế nào để tạo ra một khuôn dạng XML đẳng cấu (có cấu trúc giống hệt) với bất kỳ tài liệu JSON nào, nói một cách khác là cách làm thế nào để tạo ra một ánh xạ phổ quát giữa bất kỳ tài liệu JSON và tài liệu XML nào.

Để đạt được một ánh xạ hiệu quả giữa bất kỳ tài liệu JSON và XML nào, bạn phải xem xét sự khác nhau giữa hai khuôn dạng. Phần này khảo sát một sự ánh xạ khá trực quan nhưng không đẳng cấu giữa XML và JSON, sao cho bạn có thể hiểu được những khác biệt như vậy. Bảng 1 mô tả một thí dụ chưa đầy đủ của ánh xạ như vậy.

Bảng 1. Lập ánh xạ khả dĩ đối với XML thân thiện
MẫuJSONXML Mô tả
1{"foo" : "bar"} <foo> bar </foo>Đối tượng với kiểu giá trị chuỗi ký tự
2{"foo" : true} <foo> <true/> </foo>Đối tượng với kiểu giá trị true (đúng)
3{"foo" : { "true" : null }} <foo> <true/> </foo>Đối tượng với một Đối tượng lồng bên trong kiểu giá trị null (rỗng)
4{"foo bar!" : true} Error: "foo bar!" is not a valid QNameĐối tượng với kiểu giá trị false (sai) không chuyển đổi thành công vì khoá chính chứa các ký tự không hợp lệ đối với một QName XML (thí dụ dấu cách và dấu chấm than)
5{"foo" : null} <foo/>Đối tượng với kiểu giá trị null (rỗng)
6{"foo": { "bar" : null}}<foo> <bar/> </foo> Các đối tượng lồng nhau với nút lá có kiểu null (rỗng)
7{"foo": { "bar" : [null, false]}} <foo> <bar> <null/> <false/></bar></foo> Đối tượng với mảng lồng bên trong

Chúng tôi đề cập đến một ký pháp ánh xạ sử dụng các tên phần tử và tên thuộc tính đặc thù cho ứng dụng, chứ không phải các tên JSONx chính tắc, giống như khuôn dạng thân thiện của JSON. Nhiều thiếu sót vẫn còn trong cách ánh xạ này. Các Mẫu 2 và 3 có cấu trúc khác nhau và đã được tuần tự hóa thành thành tài liệu XML như nhau, làm cho không thể xây dựng lại thành chính tài liệu JSON đã có từ XML đã được tạo ra. Khoá đối tượng của Mẫu 4 chứa ký tự không hợp lệ đối với một QName XML. Một số kỹ thuật có thể được sử dụng để vượt qua các hạn chế này, tuy nhiên chúng sẽ không thể hiện cùng một sức mạnh như một ký pháp đẳng cấu chẳng hạn như JSONx.


JSONx

JSON XML (JSONx) chính tắc được đưa vào như là một khuôn dạng đẳng cấu đối với JSON. Do đó các vấn đề đã ghi trong phần trước với các ký pháp thân thiện không xảy ra trong JSONx.

Trong Liệt kê 2, bạn có thể xem các thông tin khách hàng về Kathy Smith, trước đây được biểu diễn bằng JSON trong Liệt kê 1, dưới dạng JSONx.

Liệt kê 2. Thông tin khách hàng về Kathy Smith bằng JSON XML chính tắc (JSONx)
<json:object xmlns:json="http://www.ibm.com/xmlns/prod/2009/jsonx">
  <json:object name="customerinfo">
	<json:number name="cid">1000</json:number>
	<json:string name="name">Kathy Smith</json:string>
	<json:object name="addr">
	  <json:string name="country">Canada</json:string>
	  <json:string name="street">5 Rosewood</json:string>
	  <json:string name="city">Toronto</json:string>
	  <json:string name="prov-state">Ontario</json:string>
	  <json:string name="pcode-zip">M6W 1E6</json:string>
	</json:object>
	<json:object name="phone">
	  <json:string name="work">416-555-1358</json:string>
	</json:object>
  </json:object>
</json:object>

JSONx là một khuôn dạng thích hợp dùng cho các hệ thống xử lý dữ liệu XML nhưng cần được mở rộng với sự hỗ trợ cho JSON. Tuy nhiên, nó không là một giải pháp một-kích-cỡ-vừa-với-tất-cả để chuyển đổi JSON thành XML. Trong thí dụ trước, người ta có thể chỉ rõ các thông tin ban đầu về Kathy Smith với một khuôn dạng thân thiện như sau:

Liệt kê 3. Thông tin khách hàng về Kathy Smith với một khuôn dạng XML thân thiện khả dĩ
<customerinfo>
  <cid>1000</cid>
  <name>Kathy Smith</name>
  <addr>
	<country>Canada</country>
	<street>5 Rosewood</street>
	<city>Toronto</city>
	<prov-state>Ontario</prov-state>
	<pcode-zip>M6W 1E6</pcode-zip>
  </addr>
  <phone>
	<work>416-555-1358</work>
  </phone>
</customerinfo>

Việc sử dụng JSONx chứ không phải khuôn dạng thân thiện thúc đẩy các khả năng tái sử dụng mã, sử dụng công cụ phổ biến, chuyển đổi, và lọc mà thường gắn liền với việc sử dụng một tiêu chuẩn. Người ta vẫn có thể chọn tạo ra một khung nhìn trưng ra tài liệu với khuôn dạng khác thân thiện hơn bằng cách sử dụng các công nghệ XML chẳng hạn như XSLT và XQuery.

JSONx cho phép việc sử dụng cơ sở hạ tầng XML hiện có mà không phải tùy biến giải pháp để xử lý và lưu trữ JSON.


Gói JSONx

Phần này sẽ cung cấp một tổng quan ngắn gọn về một gói JSONx (một tập hợp các kịch bản lệnh và mã) dùng cho pureXML DB2, nó chỉ cho bạn cách:

  • Chuyển đổi JSON thành JSONx
  • Chuyển đổi JSONx thành JSON
  • Nhập khẩu các tài liệu JSON như là JSONx
  • Lưu trữ JSONx
  • Lập chỉ mục JSONx để đạt được hiệu năng
  • Trưng ra JSONx với một khuôn dạng quan hệ
  • Chuyển đổi JSONx thành một ký pháp XML thân thiện
  • Nối các tài liệu JSONx (dùng các vị từ quan hệ, nếu cần thiết) bằng cách sử dụng XMLQuery

Để có giải thích chi tiết hơn về những thứ trong gói JSONx, xin xem tệp tin readme kèm trong gói này.

Các điều kiện tiên quyết

Để cài đặt và chạy gói JSONx, cần phải có DB2 phiên bản v9.5 hoặc mới hơn đã cài đặt. Bạn có thể tải về DB2 Express-C, ấn bản mở của DB2 có gộp cả pureXML, làm cho nó thành một máy chủ dữ liệu XML và quan hệ, có đầy đủ chức năng (xem phần Tài nguyên để có liên kết tới địa chỉ tải về).

Dù gói này có thể chạy trong các hệ điều hành khác, nó đã được kiểm thử với Ubuntu Jaunty Jackalope 9.04 và Microsoft® Windows® XP SP2.

Cấu trúc bảng

Trong phần trước, bạn đã được giới thiệu thông tin khách hàng của Kathy Smith, bằng cả JSON và JSONx. Trong Bảng 2, bạn nhìn thấy bảng khách hàng, nơi thông tin được lưu trữ:

Bảng 2: Bảng JSONXMLADMIN.CUSTOMER
Tên cột Kiểu dữ liệu Mô tả
CID INTEGER Mã nhận dạng khách hàng
INFOXML Một bản ghi chứa thông tin cá nhân về khách hàng
COMMENTVARCHAR(256)Một mã nhận dạng ngắn, kiểu văn bản liên quan đến khách hàng

Hai bảng khác có trong gói JSONx: Product (Sản phẩm) và PurchaseOrder (Đơn đặt hàng).

Bảng sản phẩm chứa thông tin sản phẩm trong một cột XML tên là DESCRIPTION (Mô tả), cũng như một mã nhận dạng duy nhất cho sản phẩm đó:

Bảng 3: Bảng JSONXMLADMIN.PRODUCT
Tên cột Kiểu dữ liệu Mô tả
PID INTEGER Mã nhận dạng sản phẩm
Mô tả XML Một bản ghi chứa thông tin cá thể về sản phẩm

PurchaseOrder mô tả một giao dịch khi một khách hàng mua một hay nhiều sản phẩm. Một chi tiết thú vị về bảng này là ở chỗ mã nhận dạng khách hàng không chứa trong tệp tin gốc JSON mà nằm trong một cột quan hệ riêng. Bằng cách sử dụng JSONx và pureXML DB2, bạn có thể nối dữ liệu từ hai (hoặc nhiều) tài liệu JSON khác biệt nhau, và cũng có thể nối các bản ghi quan hệ với các tài liệu JSON. Để có một thí dụ cụ thể về cách thực hiện một phép nối như vậy, xin xem mã thủ tục chứa trong gói JSONx này.

Bảng 4: Bảng JSONXMLADMIN.PURCHASEORDER
Tên cột Kiểu dữ liệu Mô tả
POID INTEGER Mã nhận dạng đơn đặt hàng
CUSTID INTEGER Mã nhận dạng khách hàng liên đới
PORDER XML Một bản ghi chứa thông tin về đơn đặt hàng

Chuyển đổi JSON thành JSONx bằng các hàm Java do người sử dụng định nghĩa

Gói JSONx sẽ đăng ký hai hàm Java do người sử dụng định nghĩa (UDFs) trong DB2 cho phép chuyển đổi JSON thành JSONx và ngược lại. Liệt kê 4 minh họa một lệnh triệu gọi rất đơn giản, gọi hàm do người sử dụng định nghĩa để chuyển đổi JSON thành JSONx.

Liệt kê 4. Gọi hàm Java JSONTOXML do người sử dụng định nghĩa
SELECT JSONXML.JSONTOXML('{"foo": "bar"}') FROM SYSIBM.SYSDUMMY1

Liệt kê 5 cho thấy kết quả từ lệnh SELECT trong Liệt kê 4.

Liệt kê 5. Kết quả tạo ra từ lệnh gọi hàm trong Liệt kê 4
<json:object xmlns:json="http://www.ibm.com/xmlns/prod/2009/jsonx">
 <json:string name="foo"> bar </json:string>
</json:object>

Để chuyển đổi JSONx thành JSON, hãy gọi thủ tục lưu sẵn XMLTOJSON. Liệt kê 6 cho thấy một thí dụ khi cùng một tài liệu JSON được sử dụng trong Liệt kê 4 được tuần tự hóa thành JSONx và sau đó đổi trở lại JSON.

Liệt kê 6. JSON thành JSONx và sau đó trở về JSON
SELECT JSONXML.XMLTOJSON(JSONXML.JSONTOXML('{"foo": "bar"}')) FROM SYSIBM.SYSDUMMY1

Nối các tài liệu JSONx

Một trong những tính năng thú vị có trong pureXML DB2 là sự đa dạng của các tuỳ chọn để ghép nối dữ liệu. Việc lưu trữ JSONx trong pureXML DB2 có nghĩa là bây giờ bạn có thể nối các dữ liệu JSON của bạn chính xác như bạn đã thực hiện với các tài liệu XML của bạn. Liệt kê 7 cho thấy cách làm thế nào sử dụng một phép nối với cả vị từ quan hệ và vị từ XML và trả về, đối với từng Đơn Đặt hàng, POID (mã nhận dạng đơn đặt hàng), và tên khách hàng.

Liệt kê 7. Nối JSONx bằng cả vị từ quan hệ lẫn vị từ XML
SELECT
  POID, 
  XMLCAST (
	XMLQUERY(
	  ''declare default element namespace "http://www.ibm.com/xmlns/prod/2009/jsonx";
	  data( 
		$INFO/object/object[@name="customerinfo"]/string[@name="name"]/text() )''
	  ) AS VARCHAR(32) 
	) AS CUSTNAME
FROM
  JSONXMLADMIN.PURCHASEORDER , 
  JSONXMLADMIN.CUSTOMER
WHERE
  XMLEXISTS(
	''declare default element namespace "http://www.ibm.com/xmlns/prod/2009/jsonx";
	$INFO/object/object[@name="customerinfo"]/number[@name="cid"][. = $CUSTID]'' 
  )

DB2 9.7

Gói JSONx cũng minh họa một số bổ sung mới nhất trong pureXML của DB2 v9.7. Khi tạo ra khung nhìn về một tài liệu JSONx với XMLTABLE, DB2 v9.7 sẽ chọn ra các chỉ mục XML áp dụng được, như vậy sẽ làm cho truy vấn nhanh hơn nhiều so với các phiên bản trước đây.

Liệt kê 8. Trưng ra JSON dưới dạng một khung nhìn quan hệ với XMLTable
CREATE VIEW JSONXMLADMIN.RELCUSTOMER(CID, NAME, PHONE) AS 
 SELECT  *
 FROM
  XMLTABLE(
   XMLNAMESPACES (DEFAULT 'http://www.ibm.com/xmlns/prod/2009/jsonx'),
   'db2-fn:xmlcolumn("JSONXMLADMIN.CUSTOMER.INFO")'
    COLUMNS
	  "CID" INTEGER 
	  PATH '/object/object[@name="customerinfo"]/number[@name="cid"]/xs:double(.)' ,
	  "NAME" VARCHAR(32) 
	  PATH '/object/object[@name="customerinfo"]/string[@name="name"]/text()' ,
	  "PHONE" VARCHAR(32)
	  PATH '/object/object[@name="customerinfo"]/object[@name="phone"][1]/*[1]/text()'
	)

Cũng có thể tạo ra JSONx từ dữ liệu quan hệ bằng cách sử dụng các hàm xuất bản SQL/XML.

Một đặc tính mới nữa là sự hỗ trợ của kiểu dữ liệu XML trong các hàm do người sử dụng định nghĩa cho phép thao tác các tài liệu XML. Khi dùng DB2 v9.7 để chạy gói JSONx, bạn sử dụng hai đặc tính mới khác để tạo ra kết quả: lập chỉ mục trên khung nhìn và một hàm XML do người sử dụng định nghĩa.

Hàm do người dùng định nghĩa có trong gói JSONx sử dụng tiện ích Cập nhật XQuery (XQuery Update Facility) để chuyển đổi JSONx thành một khuôn dạng đủ để trình bày một tập con cụ thể của JSON mà sẽ được nhập khẩu vào khi việc thực hiện cơ sở dữ liệu mẫu của JSONx hoàn tất. Mặc dù đây không phải là một thuật toán chuyển đổi tổng quát hoặc có hiệu quả, Liệt kê 9 cho thấy cách làm thế nào có thể lập trình một cách có hiệu quả các hàm XML do người sử dụng định nghĩa bằng cách sử dụng pureXML DB2:

Liệt kê 9. Ví dụ hàm XML do người dùng định nghĩa dùng để tạo ra XML thân thiện
CREATE FUNCTION JSONXMLADMIN.JSONXTOFRIENDLY(JSONX XML)
RETURNS XML
BEGIN ATOMIC
  RETURN XMLQUERY('
	declare namespace json="http://www.ibm.com/xmlns/prod/2009/jsonx";
	copy $n := $JSONX
	modify(
	  for $e in $n//json:*
	  where $e/@name
	  return (
		do rename $e as replace($e/@name," ", "_") ,
		do delete $e/@name
	  )
	)
	return document { $n/json:object/* }
  ');
END

Liệt kê 10 cho thấy cách chuyển đổi một thông tin khách hàng đã được viết bằng ký pháp thân thiện trước đó trở lại thành JSONx.

Liệt kê 10. Chuyển đổi thông tin khách hàng Kathy Smith dạng thân thiện trở lại thành JSONx
SELECT
  XMLQUERY('
	declare namespace json="http://www.ibm.com/xmlns/prod/2009/jsonx";
	copy $n := $friendly
	modify(
	  for $e in $n//*
	  let $name := local-name($e)
	  let $type := 
		if ($name = ("addr", "phone", "customerinfo")) then "json:object"
		else if ($name eq "cid") then "json:number"
		else "json:string"
	  return (
		do rename $e as $type,
		do insert attribute name { $name } into $e
	  )
	)
	return document { 
	  <json:object>
		{ $n } 
	  </json:object>
	}
  ' PASSING JSONXMLADMIN.JSONXTOFRIENDLY(INFO) as "friendly")
  FROM
	JSONXMLADMIN.CUSTOMER
  WHERE
	CID = 1000

Chạy gói JSONx

Làm theo các bước liệt kê dưới đây để cài đặt gói JSONx:

  • Để sử dụng nó trên nền Window, chỉ cần giải nén tệp tin jsonx.zip có sẵn ở phần tài nguyên trong hệ thống tệp tin của bạn. Trên các nền Linux®, giải nén tệp tin jsonx.zip bằng cách sử dụng lệnh unzip -a -aa jsonx.zip. Việc này sẽ đảm bảo rằng các ký tự kết thúc dòng đúng đắn được sử dụng.
  • Trên các hệ thống Windows, hãy chắc chắn rằng môi trường xử lý dòng lệnh DB2 được khởi tạo. Trong các hệ thống dựa trên Linux, xin kiểm tra lại việc đăng nhập của bạn như một người sử dụng có quyền truy nhập DB2 (db2inst1 là người sử dụng DB2 mặc định).
  • Bạn đã sẵn sàng chạy các kịch bản lệnh. (CHÚ Ý: Phải biết rằng các kịch bản lệnh khởi phát có thể lập cấu hình một số thông số hệ quản trị cơ sở dữ liệu và nó có thể NGỪNG và KHỞI ĐỘNG LẠI hệ quản trị cơ sở dữ liệu để đảm bảo rằng hệ quản trị cơ sở dữ liệu có thể xử lý thủ tục lưu sẵn kiểu jar (jar-stored procedure). Nếu bạn còn phân vân về các kịch bản lệnh xin xem lại chúng trước khi chạy!). Chạy start.bat trên các nền Window. Trên các nền Linux, sử dụng start.sh. Sau khi kịch bản lệnh này hoàn tất, bạn sẽ thấy một kết quả tương tự như Hình 3 trong dấu nhắc lệnh hoặc shell bash của bạn. (Xem bản bằng chữ của kết quả ví dụ trong Hình 3.)
Hình 3. Kết quả ví dụ của gói JSONx
Kết quả ví dụ của gói JSONx

Lúc này mọi thứ đều được cài đặt và bạn có thể quan sát các kết quả truy vấn trong thư mục đầu ra. Để kiểm tra xem các kết quả được tạo ra có chính xác không, bạn có thể so sánh thư mục đầu ra với đầu ra tham khảo nằm trong thư mục tham khảo.

Nếu các mẫu không phù hợp với thư mục tham khảo, hãy tra cứu tệp nhật ký (log file) nằm trong thư mục nhật ký (logs directory) để tìm ra cái có thể đã gây ra thất bại khi thi hành.

Để có minh hoạ về các tweet (bài đăng) của các Twitter bằng XML thân thiện và bằng JSONx, xin xem Phụ lục A.


Kết luận

Trong bài này, một khuôn dạng mới (JSONx) đã được giới thiệu, cho phép lưu trữ JSON như là XML trong pureXML DB2. Sự khác nhau giữa JSONx và các khuôn dạng thân thiện khác đã được phác thảo ra. Một trường hợp sử dụng điển hình của JSON đã được bàn luận và các lợi ích của việc sử dụng pureXML để lưu trữ JSON được làm nổi bật. Cuối cùng, với một bản tải về JSONx (gói JSONx), bạn giờ đây có một nền để xây dựng các ứng dụng JSON có khả năng pureXML.

Hai bài viết tiếp theo trong loạt bài này sẽ tập trung vào việc trưng ra cơ sở dữ liệu mẫu JSONx (được tạo ra trong gói JSONx) thông qua Các Dịch vụ Phổ dụng JSON và sau đó tập trung vào việc tạo ra tầng trình bày với các tiểu trình OpenSocial, dựa vào Các Dịch vụ Phổ dụng JSON như là một nền phụ trợ (back-end).

Một khả năng trong tương lai là xem xét các cách để cho các nhà phát triển Web truy cập các tài liệu JSON (được lưu như là JSONx) bằng JSONPath.


Lời Cảm ơn

Chúng tôi xin cảm ơn Brien Muschett và William Palma về các đóng góp của họ.


Phụ lục A

Như đã tham khảo trong Một kịch bản JSON điển hình, nhiều dịch vụ Web cung cấp rất nhiều khuôn dạng để hiển thị thông tin. Các chuẩn công nghiệp chẳng hạn như Atom và RSS, JSON, hoặc kể cả các ký pháp XML thân thiện là các thí dụ về những khuôn dạng như vậy. Twitter đưa ra một API để truy cập tweet bằng ID. Trong phụ lục này, chúng tôi trình bày các kết quả của việc phát ra hai yêu cầu đến Twitter bằng cách sử dụng curl, một dưới dạng JSON và một dưới dạng XML thân thiện. Sau đó, chúng tôi biểu diễn cách chuyển đổi XML thân thiện này thành JSONx.

Trong Liệt kê 11, chúng tôi sử dụng curl để yêu cầu thông tin về một thông báo cá nhân (tweet có mã nhận dạng là 2311383114) mà đã được đăng lên twitter.com. Để lấy ra thông tin tweet (trạng thái của nó), bạn có thể gọi curl từ thiết bị đầu cuối của bạn như trong Liệt kê 11, và trạng thái của tweet được trả về dưới khuôn dạng JSON. (Chú ý: Lệnh triệu gọi curl trong các Liệt kê 1112 được tách thành hai dòng nhằm mục đích định dạng.)

Liệt kê 11. Lấy ra trạng thái với mã nhận dạng ID 2311383114 ở khuôn dạng JSON
purexml@watson.ibm.com:~$ curl 
http://purexmltest:3ce3ac99@twitter.com/statuses/show.xml?id=2311383114

{
    "text": "Hello World!",
    "in_reply_to_user_id": null,
    "user": {
        "following": null,
        "favourites_count": 0,
        "profile_sidebar_fill_color": "e0ff92",
        "description": null,
        "verified": false,
        "utc_offset": null,
        "statuses_count": 1,
        "profile_sidebar_border_color": "87bc44",
        "followers_count": 0,
        "created_at": "Wed Jun 24 14:18:32 +0000 2009",
        "url": null,
        "name": "pureXML TEST",
        "friends_count": 0,
        "profile_text_color": "000000",
        "protected": false,
        "profile_image_url": "http:\/\/s3.amazonaws.com\/twitter_production
		\/profile_images\/280225879\/twitterxml-1_bigger_normal.png",
        "profile_background_image_url": "http:\/\/static.twitter.com
		\/images\/themes\/theme1\/bg.gif",
        "notifications": null,
        "time_zone": null,
        "profile_link_color": "0000ff",
        "screen_name": "purexmltest",
        "profile_background_tile": false,
        "profile_background_color": "9ae4e8",
        "location": null,
        "id": 50316451
    },
    "favorited": false,
    "created_at": "Wed Jun 24 15:04:13 +0000 2009",
    "in_reply_to_screen_name": null,
    "truncated": false,
    "id": 2311383114,
    "in_reply_to_status_id": null,
    "source": "web"
}

Một cách khác, bạn có thể lấy ra cùng một tài liệu ở dạng Atom, RSS, hoặc ở một dạng ký pháp XML thân thiện. Trong Liệt kê 12, bạn gọi ra cùng một hàm để lấy ra trạng thái đó, nhưng lần này ở dạng ký pháp XML thân thiện:

Liệt kê 12. Lấy ra trạng thái với mã nhận dạng 2311383114 ở khuôn dạng XML thân thiện
purexml@watson.ibm.com:~$ curl 
http://purexmltest:3ce3ac99@twitter.com/statuses/show.xml?id=2311383114

<?xml version="1.0" encoding="UTF-8"?>
<status>
  <created_at>Wed Jun 24 15:04:13 +0000 2009</created_at>
  <id>2311383114</id>
  <text>Hello World!</text>
  <source>web</source>
  <truncated>false</truncated>
  <in_reply_to_status_id></in_reply_to_status_id>
  <in_reply_to_user_id></in_reply_to_user_id>
  <favorited>false</favorited>
  <in_reply_to_screen_name></in_reply_to_screen_name>
  <user>
    <id>50316451</id>
    <name>pureXML TEST</name>
    <screen_name>purexmltest</screen_name>
    <location></location>
    <description></description>
    <profile_image_url>http://s3.amazonaws.com/twitter_production/
	profile_images/280225879/twitterxml-1_bigger_normal.png</profile_image_url>
    <url></url>
    <protected>false</protected>
    <followers_count>0</followers_count>
    <profile_background_color>9ae4e8</profile_background_color>
    <profile_text_color>000000</profile_text_color>
    <profile_link_color>0000ff</profile_link_color>
    <profile_sidebar_fill_color>e0ff92</profile_sidebar_fill_color>
    <profile_sidebar_border_color>87bc44</profile_sidebar_border_color>
    <friends_count>0</friends_count>
    <created_at>Wed Jun 24 14:18:32 +0000 2009</created_at>
    <favourites_count>0</favourites_count>
    <utc_offset></utc_offset>
    <time_zone></time_zone>
    <profile_background_image_url>
http://static.twitter.com/images/themes/theme1/bg.gif</profile_background_image_url>
    <profile_background_tile>false</profile_background_tile>
    <statuses_count>1</statuses_count>
    <notifications></notifications>
    <verified>false</verified>
    <following></following>
  </user>
</status>

Liệt kê 13 cho thấy một ví dụ lệnh gọi hàm DB2 do người dùng định nghĩa để chuyển JSON thành JSONx trên các kết quả thu được trong Liệt kê 12.

Liệt kê 13. Biểu diễn JSONx của tài liệu JSON thu được trong Liệt kê 12.
db2 => SELECT JSONXML.JSONTOXML('{"text":"Hello World!",
"in_reply_to_user_id":null,"user":{"following":null,
"favourites_count":0,"profile_sidebar_fill_color":"e0ff92",
"description":null,"verified":false,"utc_offset":null,
"statuses_count":1,"profile_sidebar_border_color":"87bc44",
"followers_count":0,"created_at":"Wed Jun 24 14:18:32 +0000 2009",
"url":null,"name":"pureXML TEST","friends_count":0,
"profile_text_color":"000000","protected":false,"profile_image_url":
"http:\/\/s3.amazonaws.com\/twitter_production
\/profile_images\/280225879\/twitterxml-1_bigger_normal.png",
"profile_background_image_url":"http:\/\/static.twitter.com
\/images\/themes\/theme1\/bg.gif",
"notifications":null,"time_zone":null,"profile_link_color":"0000ff",
"screen_name":"purexmltest","profile_background_tile":false,
"profile_background_color":"9ae4e8","location":null,"id":50316451},
"favorited":false,"created_at":"Wed Jun 24 15:04:13 +0000 2009",
"in_reply_to_screen_name":null,"truncated":false,"id":2311383114,
"in_reply_to_status_id":null,"source":"web"}') FROM SYSIBM.SYSDUMMY1

<json:object xmlns:json="http://www.ibm.com/xmlns/prod/2009/jsonx">
  <json:string name="text">Hello World!</json:string>
  <json:null name="in_reply_to_user_id"/>
  <json:object name="user">
    <json:null name="following"/>
    <json:number name="favourites_count">0</json:number>
    <json:string name="profile_sidebar_fill_color">e0ff92</json:string>
    <json:null name="description"/>
    <json:boolean name="verified">false</json:boolean>
    <json:null name="utc_offset"/>
    <json:number name="statuses_count">1</json:number>
    <json:string name="profile_sidebar_border_color">87bc44</json:string>
    <json:number name="followers_count">0</json:number>
    <json:string name="created_at">Wed Jun 24 14:18:32 +0000 2009</json:string>
    <json:null name="url"/>
    <json:string name="name">pureXML TEST</json:string>
    <json:number name="friends_count">0</json:number>
    <json:string name="profile_text_color">000000</json:string>
    <json:boolean name="protected">false</json:boolean>
    <json:string name="profile_image_url"
	>http://s3.amazonaws.com/twitter_production/profile_images
	/280225879/twitterxml-1_bigger_normal.png</json:string>
    <json:string name="profile_background_image_url"
	>http://static.twitter.com/images/themes/theme1/bg.gif</json:string>
    <json:null name="notifications"/>
    <json:null name="time_zone"/>
    <json:string name="profile_link_color">0000ff</json:string>
    <json:string name="screen_name">purexmltest</json:string>
    <json:boolean name="profile_background_tile">false</json:boolean>
    <json:string name="profile_background_color">9ae4e8</json:string>
    <json:null name="location"/>
    <json:number name="id">50316451</json:number>
  </json:object>
  <json:boolean name="favorited">false</json:boolean>
  <json:string name="created_at">Wed Jun 24 15:04:13 +0000 2009</json:string>
  <json:null name="in_reply_to_screen_name"/>
  <json:boolean name="truncated">false</json:boolean>
  <json:number name="id">2311383114</json:number>
  <json:null name="in_reply_to_status_id"/>
  <json:string name="source">web</json:string>
</json:object>

Tải về

Mô tảTênKích thước
JSONx Bundlejsonx.zip145KB

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạn



Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management, Nguồn mở
ArticleID=618673
ArticleTitle=Xây dựng một ứng dụng pureXML và JSON, Phần 1: Lưu trữ và truy vấn JSON với pureXML của DB2
publish-date=11102009