Phát triển các mô hình ánh xạ với InfoSphere Data Architect của IBM

Việc thiết kế ánh xạ cho một quá trình trích xuất, chuyển đổi và tải dữ liệu (ETL) là một bước quan trọng trong một dự án kho dữ liệu. Các ánh xạ phải dễ sửa đổi, có khả năng kiểm soát phiên bản, dễ tạo báo cáo và dễ xuất khẩu sang các định dạng khác. Hướng dẫn này minh họa cách phát triển một mô hình ánh xạ từ nguồn đến đích hoàn chỉnh bằng cách sử dụng InfoSphere™ Data Architect (Kiến trúc sư dữ liệu InfoSphere). Bạn cũng sẽ tìm hiểu về các chức năng báo cáo do InfoSphere Data Architect cung cấp.

Jorge Machado, Kiến trúc sư Công nghệ thông tin, I.B.M.

Photo of Jorge MachadoJorge Machado là một Kiến trúc sư Công nghệ thông tin về Các dịch vụ của Tập đoàn phần mềm IBM ở Đức. Đã trải qua nhiều vai trò khác nhau trong lịch sử 10 năm hoạt động của mình tại IBM, bây giờ lĩnh vực trọng tâm chính của ông là lập kế hoạch, thiết kế và phát triển các giải pháp kho dữ liệu cũng như các chiến lược kinh doanh thông minh cho khách hàng ở trung tâm Châu Âu.



Hermann Voellinger, Kiến trúc sư cao cấp CNTT, IBM

Hermann Voellinger là một Kiến trúc sư điều hành Công nghệ thông tin tại Các dịch vụ của Tập đoàn phần mềm IBM. Trong 12 năm qua, ông đã là kiến trúc sư Công nghệ thông tin chịu trách nhiệm về các dự án kho dữ liệu (DWH) lớn ở Đức. 10 năm trước khi làm việc trong các dự án DWH, Hermann đã làm việc trong phòng thí nghiệm phát triển của Đức như là nhà phát triển và kiến trúc sư hàng đầu về các giải pháp và các công cụ về Khai phá dữ liệu và văn bản. Các kỹ năng và các lĩnh vực trọng tâm chính của ông hiện nay là kiến trúc của quá trình lưu trú dữ liệu (ETL), các khái niệm mô hình hóa dữ liệu và chiến lược và các giải pháp kiến trúc của DWH.



14 02 2012

Trước khi bạn bắt đầu

Giới thiệu

Mục đích của hướng dẫn này là giới thiệu một phương pháp để phát triển các mô hình ánh xạ cho các dự án kho dữ liệu (DWH) khi sử dụng chức năng có sẵn trong InfoSphere Data Architect (IDA), Phiên bản 7.5.2. Việc thiết kế các ánh xạ cho quá trình trích xuất, chuyển đổi và tải dữ liệu (ETL) là một phần vô cùng quan trọng của mỗi dự án kho dữ liệu. Do đó cần lưu trữ thiết kế các ánh xạ này theo một định dạng đáp ứng một số yêu cầu như sau:

  • Có thể dễ dàng thay đổi ánh xạ.
  • Có thể tạo phiên bản các thay đổi.
  • Dễ dàng báo cáo các ánh xạ.
  • Có thể xuất khẩu sang các định dạng khác.

Bạn sẽ tìm hiểu trong hướng dẫn này cách có thể đạt được các mục tiêu trên với IDA. Hướng dẫn này mô tả tất cả các bước cần thiết để xây dựng mô hình ánh xạ đầu tiên của bạn và để tạo ra một báo cáo cho mô hình này. Các bước mức cao là:

  1. Tạo một dự án trong IDA.
  2. Tạo mô hình dữ liệu nguồn (bằng cách sử dụng cơ sở dữ liệu SAMPLE của DB2).
  3. Tạo mô hình dữ liệu đích.
  4. Tạo các ánh xạ giữa các bảng nguồn và đích.
  5. Phân tích mô hình của bạn bằng cách sử dụng các chức năng báo cáo.

Hướng dẫn này mô tả chi tiết từng bước trong năm bước trên. Cuối cùng, bạn sẽ có báo cáo ánh xạ có ý nghĩa đầu tiên của mình theo định dạng PDF bằng cách sử dụng chức năng thừa hưởng của công cụ IDA.

Tổng quan về sản phẩm và các điều kiện tiên quyết

InfoSphere Data Architect của IBM (trước đây gọi là Rational Data Architect - Kiến trúc sư dữ liệu Rational) là một công cụ mô hình hóa và thiết kế tích hợp dữ liệu doanh nghiệp cung cấp một giải pháp thiết kế dữ liệu hợp tác mà bạn có thể sử dụng để khám phá, mô hình hóa, thiết lập quan hệ và tiêu chuẩn hóa các tài sản dữ liệu đa dạng và phân tán.

IDA dựa trên một sự tích hợp Eclipse chuẩn-mở.

Để làm theo toàn bộ hướng dẫn này bạn cần phải cài đặt như sau:

  • Phiên bản 7.5.2 của InfoSphere Data Architect.
  • IBM DB2 9.7 Enterprise Server Edition (Ấn bản Máy chủ doanh nghiệp DB2 9.7 của IBM) với cơ sở dữ liệu mẫu của nó.
  • Cài đặt một cá thể của IBM DB2 Enterprise Edition (Ấn bản doanh nghiệp DB2 của IBM) và cơ sở dữ liệu mẫu tiêu chuẩn và có thể truy cập trên cùng một máy tính.

Xem phần Tài nguyên để biết các liên kết đến các phiên bản dùng thử của cả hai DB2 và IDA.


Tạo một dự án trong IDA

Tất cả công việc thiết kế cần làm trong IDA được nhóm lại thành các dự án. Trong phần này, bạn sẽ tìm hiểu cách sử dụng trình hướng dẫn của IDA để tạo ra một dự án mới cho mô hình ánh xạ của bạn. Hãy hoàn thành các bước sau để tạo một dự án mới.

  1. Chọn File > New > Project từ thanh trình đơn của IDA. Việc này khởi chạy trình hướng dẫn New Project (Dự án mới) để giúp bạn tạo một dự án mới trong bàn làm việc, như trong Hình 1.
Hình 1. Tạo một dự án mới
Ảnh chụp màn hình: File và New và Project được tô đậm trong cửa sổ thả xuống
  1. Duyệt qua danh sách các dự án và mở các thư mục để thấy tất cả các kiểu dự án mà bạn có thể tạo ra. Để hỗ trợ xác định vị trí của một trình hướng dẫn cụ thể, có thể sử dụng trường văn bản để chỉ hiển thị các trình hướng dẫn phù hợp với văn bản đã nhập.
  2. Nhập data làm một từ khóa trong trường văn bản để hạn chế danh sách các dự án.
  3. Chọn Data Design Project (Dự án thiết kế dữ liệu). Trình hướng dẫn Data Design khởi chạy, như trong Hình 2. Trình hướng dẫn này hướng dẫn bạn qua các bước cài đặt cơ bản.
Hình 2. Trình hướng dẫn Data Design Project
Ảnh chụp màn hình: Data Design Project được tô đậm trong trình hướng dẫn New Project
  1. Nhấn Next.
  2. Nhập một tên mới cho dự án, như là MyMappingTutorial, như trong Hình 3 và nhấn Finish.
Hình 3. Đặt tên cho dự án thiết kế dữ liệu
Ảnh chụp màn hình: tên là MyMappingTutorial, vị trí là c:\jorge\IBM\IDA Workspace
  1. Nhấn Yes khi được nhắc để mở phối cảnh dữ liệu.
Hình 4. Mở phối cảnh có liên quan
Ảnh chụp màn hình: Mở lời nhắc trên phối cảnh dữ liệu có liên quan

Bây giờ dự án mới của bạn đã sẵn sàng.


Tạo mô hình dữ liệu nguồn

Trong phần này, hãy tìm hiểu cách xây dựng một mô hình dữ liệu nguồn vật lý bằng kỹ thuật đảo ngược một phần cơ sở dữ liệu SAMPLE của DB2. Bạn chỉ sử dụng một vài bảng hiện có. Bạn xây dựng một tập con bằng cách sử dụng chức năng DELETE của IDA. Cuối cùng, thêm các chú thích cho một vài trường trong mô hình để mở rộng phạm vi mô tả của các trường này.

Chọn các nguồn dữ liệu

Trong bước này, hãy kết nối đến nguồn dữ liệu có chứa các bảng nguồn: cơ sở dữ liệu SAMPLE của DB2.

  1. Chuyển đến Data Project Explorer (Trình thám hiểm dự án dữ liệu), nằm ở phía bên trái màn hình. (Nếu nó không hiển thị, hãy chuyển đến trình đơn và chọn Window > Show View > Data Project Explorer.)
  2. Nhấn chuột phải vào Data Models (Các mô hình dữ liệu) rồi nhấn New > Physical Data Model trong trình đơn hiện lên, như trong Hình 5.
Hình 5. Tạo mô hình dữ liệu vật lý
Ảnh chụp màn hình: Data Project Explorer hiển thị Data Model, New, Physical Data Model được tô đậm
  1. Nhập tên của mô hình cơ sở dữ liệu nguồn, như là Source Database Model 1 (Mô hình cơ sở dữ liệu nguồn 1).
  2. Chọn phiên bản DB2 là V9.7 và đánh dấu chọn Create from reverse engineering (Tạo từ kỹ thuật đảo ngược), như trong Hình 6.
  3. Nhấn Next.
Hình 6. Quy định mô hình cơ sở dữ liệu nguồn
Ảnh chụp màn hình: Cửa sổ New Physical Data Model window có các đặc tính được điền vào
  1. Giữ nguyên màn hình tiếp theo, để biểu thị bạn muốn kỹ thuật đảo ngược từ một cơ sở dữ liệu.
  2. Nhấn vào nút New để thêm một kết nối cơ sở dữ liệu mới cho dự án, như trong Hình 7.
Hình 7. Thêm một kết nối cơ sở dữ liệu mới cho dự án
Ảnh chụp màn hình: Chọn cửa sổ kết nối có New được tô đậm
  1. Nhập tên người dùng và mật khẩu và đánh dấu chọn hộp kiểm Save password (Lưu mật khẩu).
  2. Nhấn vào nút Test Connection (Kiểm tra kết nối) để kiểm tra xem kết nối đó đã thiết lập thành công chưa, như trong Hình 8.
Hình 8. Quy định các tham số kết nối
Ảnh chụp màn hình: Cửa sổ Connection Parameters có user ID và password được tô đậm
  1. Nhấn OK khi bạn thấy hộp thông tin xác nhận kết nối đã thành công.
  2. Giữ nguyên màn hình Filter (Bộ lọc) và nhấn Finish.
  3. Nhấn vào SAMPLE của kết nối cơ sở dữ liệu mới được tạo ra trên màn hình Select Connection(Chọn kết nối), như trong Hình 9.
Hình 9. Chọn kết nối cơ sở dữ liệu
Ảnh chụp màn hình: Chọn cửa sổ Connection có SAMPLE và Next được tô đậm
  1. Nhấn Next.
  2. Áp dụng một bộ lọc cho các lược đồ mà bạn muốn có trong mô hình cơ sở dữ liệu nguồn bằng cách nhấn vào chọn hộp kiểm bên cạnh lược đồ có tên tương tự như tên người dùng Windows® mà bạn đã đặt khi bạn đã tạo ra cơ sở dữ liệu SAMPLE của DB2. Trong ví dụ của hướng dẫn này, đây là lược đồ MACHADO, như trong Hình 10.
Hình 10. Lọc các đối tượng cho mô hình cơ sở dữ liệu nguồn
Ảnh chụp màn hình: Chọn cửa sổ Schema có MACHADO được tô đậm
  1. Nhấn Next.
  2. Chọn các kiểu phần tử trong sơ đồ mà bạn muốn đưa vào trong mô hình cơ sở dữ liệu nguồn của bạn. Với hướng dẫn này, hãy chắc chắn chỉ chọn Tables, như trong Hình 11.
Hình 11. Chọn các phần tử cơ sở dữ liệu
Ảnh chụp màn hình: Cửa sổ Database Elements có Tables và Next được tô đậm
  1. Nhấn Next.
  2. Đánh dấu chọn ba hộp kiểm tra sau, như thể hiện trong Hình 12:
    Tổng quan
    Bạn có thể tạo các sơ đồ từ trình hướng dẫn hoặc bạn có thể tạo các sơ đồ sau khi bạn hoàn thành trình hướng dẫn bằng cách sử dụng các tùy chọn trình đơn ngữ cảnh có sẵn từ thư mục Diagrams (Các sơ đồ)
    Phỏng đoán các khóa chính ngầm định
    Chọn tùy chọn này để tìm ra các khóa chính ngầm định dưới dạng các chỉ mục duy nhất. Cả hai các chỉ mục duy nhất lẫn các trình giữ khóa chính không bắt buộc được tạo ra trong mô hình khi có mặt một chỉ mục duy nhất.
    Phỏng đoán các mối quan hệ
    Chọn tùy chọn này để tìm ra các mối quan hệ giữa các bảng vẫn chưa được mô hình hóa công khai bằng cách sử dụng các khóa ngoài. Nếu bạn chọn tùy chọn này, thì các mối quan hệ này được biểu diễn bằng một trình giữ khóa ngoài không bắt buộc trong mô hình.
Hình 12. Chọn thêm các tùy chọn cho mô hình
Ảnh chụp màn hình: Cửa sổ Options có Overview và hai hộp kiểm được chọn
  1. Nhấn Finish. Mô hình vật lý của cơ sở dữ liệu nguồn này được tạo ra.

Sau quá trình tạo này, bạn sẽ thấy cửa sổ chính ở đó bạn có thể xem lại các kết quả của các bước trước đó. Mô hình mới được tạo ra của bạn có sẵn để dùng trong Data Project Explorer ở vùng góc trên bên trái màn hình. Bạn cũng có thể tìm thấy kết nối cơ sở dữ liệu mới cho cơ sở dữ liệu mẫu trong Data Source Explorer ở vùng bên trái phía dưới. Cửa sổ chính cho biết các đặc tính chung của dự án mới, như trong Hình 13.

Hình 13. Màn hình sau khi tạo mô hình dữ liệu nguồn
Ảnh chụp màn hình: Cửa sổ Physical Data Model Editor có các đặc tính chung được điền vào

(Xem ảnh lớn hơn của Hình 13.)

Chọn tập con bảng từ mô hình dữ liệu nguồn

Tất cả các phần tử của lược đồ MACHADO đã được thêm vào mô hình. Bạn có thể xem chúng trong sơ đồ dữ liệu thuộc về mô hình cơ sở dữ liệu nguồn bằng cách nhấn vào Data Project Explorer > Data Diagrams > Source Database Model 1.dbm > MACHADO. Các sơ đồ dữ liệu cung cấp một biểu diễn đồ họa về các mô hình mà bạn tạo ra, như trong Hình 14.

Hình 14. Sơ đồ dữ liệu của Mô hình cơ sở dữ liệu nguồn 1
Ảnh chụp màn hình: Biểu đồ lưu lượng của dữ liệu với MACHADO

(Xem ảnh lớn hơn của Hình 14.)

Bây giờ bạn có thể duyệt qua mô hình này và xem các kết quả của quá trình kỹ thuật đảo ngược.

Bạn cũng có thể sử dụng tiện ích (widget) phác thảo để giúp bạn xem ảnh lớn của mô hình và nhanh chóng chuyển qua hết cửa sổ đó.

Loại bỏ các đối tượng không cần thiết

Vì bạn chỉ cần một tập con của các bảng đó, nên bạn có thể loại bỏ tất cả các đối tượng không cần thiết. Để loại bỏ các đối tượng không cần thiết, chuyển đến cửa sổ ở giữa màn hình và loại bỏ tất cả các bảng, trừ bảng Employee (Nhân viên) và Project (Dự án) bằng cách nhấn chuột phải vào từng bảng và chọn Delete from Model (Xóa khỏi mô hình) từ trình đơn ngữ cảnh, như trong Hình 15.

Hình 15. Loại bỏ các bảng khỏi sơ đồ dữ liệu
Ảnh chụp màn hình: Hiển thị nhấn chuột phải vào bảng có Delete from Model được tô đậm trong trình đơn

(Xem ảnh lớn hơn của Hình 15.)

Hãy nhớ rằng Delete from Diagram (Xóa khỏi sơ đồ) để lại đối tượng trong mô hình dữ liệu, trong khi Delete from Model (Xóa khỏi mô hình) loại bỏ các đối tượng khỏi cả hai sơ đồ dữ liệu lẫn mô hình dữ liệu (nhưng để lại nó trong cơ sở dữ liệu nguồn). Kết quả của việc chọn Delete from Model sẽ trông tương tự như Hình 16.

Hình 16. Mô hình bảng nguồn đã xóa
Ảnh chụp màn hình: Biểu đồ lưu lượng của mô hình bảng có hiển thị Employee và Project

(Xem ảnh lớn hơn của Hình 16.)

Thêm các chú thích cho mọi phần tử của mô hình dữ liệu nguồn

Mô hình nguồn mà bạn đã tạo trong phần trước có chứa hầu hết đặc tả được các nhà phát triển ứng dụng sử dụng về mặt kĩ thuật. Tuy nhiên, bắt buộc phải có một chú thích mô tả chi tiết hơn cho mọi phần tử của mô hình xuống đến mức cột . Ví dụ, không phải mọi nhà phát triển sẽ giải thích EMPNO char(6) chính xác theo cách giống nhau. Hãy hoàn thành các bước sau đây để thêm một chú thích làm mẫu cho cột EMPNO trong trong trường bảng, như trong Hình 17.

  1. Nếu không thấy các cột, bạn nhấn chuột phải vào bảng dự án (project table) và chọn ngăn Filters > Show/Hide.
  2. Chọn khóa và cột.
  3. Lặp lại bước này cho bảng employee.
  4. Nhấn EMPNO trong cột employee của bảng.
  5. Nhấn Properties (Các đặc tính) trong vùng thông tin phía dưới.
  6. Nhấn Annotation.
  7. Nhấn vào hình thoi màu vàng ở góc trên bên trái của vùng thông tin phía dưới.
  8. Đổi tên đặc tính chú thích mới là Description (Mô tả).
  9. Gõ một mô tả có ý nghĩa vào trường Value (Giá trị), ví dụ Số thứ tự duy nhất của một nhân viên trong công ty xyz. Số thứ tự này vẫn còn được gán cho nhân viên ngay cả khi nhân viên đó rời khỏi công ty và sau đó lại quyết định quay trở lại.
Hình 17. Thêm chú thích cho mọi phần tử
Ảnh chụp màn hình: EMPNO được tô đậm và Description được định kiểu ở dưới

(Xem ảnh lớn hơn của Hình 17.)


Tạo mô hình dữ liệu đích

Để dựng mô hình dữ liệu vật lý đích mà bạn sẽ sử dụng trong hướng dẫn ánh xạ này, trước tiên bạn tạo một mô hình dữ liệu lô-gic từ đầu. Sau đó bạn sẽ chuyển đổi mô hình dữ liệu lô-gic này thành một mô hình dữ liệu vật lý.

Tạo một mô hình dữ liệu lô-gic đích

Hãy hoàn thành các bước sau đây để tạo ra mô hình dữ liệu đích theo một mức lô-gic. Đây sẽ là đầu vào cho mô hình vật lý được mô tả sau.

  1. Chuyển đến Data Project Explorer, nhấn chuột phải vào Data Diagrams.
  2. Nhấn New > Logical Data Model.
  3. Nhấn Finish.
  4. Thay đổi tên của sơ đồ mới được tạo ra bằng cách nhấn chuột phải vào tệp-ldm mới và đặt tên nó là Logical Target Data Model (Mô hình dữ liệu lô-gic đích). Hình 18 hiển thị cửa sổ kết quả trong Data Project Explorer của bạn:
Hình 18. Data Project Explorer có mô hình dữ liệu lô-gic đích
Ảnh chụp màn hình: Logical Target Data Model có Diagram1 và Package1 được tô đậm

Lưu ý rằng một mô hình dữ liệu tương ứng đã được tạo ra tự động.

  1. Nhấn chuột phải vào cửa sổ làm việc của sơ đồ mới, có tên diagram1. Sơ đồ này là một phần của tệp Logical Target Data model.ldm.
  2. Thêm một thực thể mới vào sơ đồ bằng cách nhấn vào Add Data Object > Entity, như trong Hình 19.
Hình 19. Thêm một thực thể lô-gic mới
Ảnh chụp màn hình: Nhấn chuột phải vào cửa sổ và chọn Entity từ trình đơn ngữ cảnh
  1. Đặt tên cho thực thể này là Ent_proj_cost, như trong Hình 20.
Hình 20. Thực thể lô-gic về các chi phí dự án doanh nghiệp
Ảnh chụp màn hình: Biểu diễn logic của thực thể các chi phí dự án
  1. Thêm các thuộc tính bằng cách nhấn chuột phải lên thực thể mới và chọn hoặc Add Primary Key (Thêm khóa chính), như trong Hình 21, hay Add Attribute (Thêm thuộc tính) cho các thuộc tính không-khóa.
Hình 21. Thêm một khóa chính cho thực thể lô-gic
Ảnh chụp màn hình: Ent_proj_cost có hiển thị Add Primary Key

Thực thể này có chứa các kết quả của các chuyển đổi từ các bảng nguồn để cung cấp thông tin về các chi phí sinh ra từ tiền lương của các nhân viên được phân cho dự án tương ứng.

Tạo mô hình dữ liệu vật lý đích

Phần này mô tả cách để nhận được mô hình dữ liệu vật lý đích từ mô hình lô-gic mà bạn đã tạo trong phần trước. Hãy hoàn thành các bước sau.

  1. Nhấn chuột phải vào Logical Target Data Model và nhấn Transform to Physical Data Model, như trong Hình 22. Bạn thấy một loạt các màn hình dùng để quy định các đặc tính vật lý cho mô hình của bạn.
Hình 22. Khởi tạo việc tạo mô hình vật lý
Ảnh chụp màn hình: Mục trình đơn Transform to Physical Data Model được tô đậm
  1. Thay đổi cơ sở dữ liệu đến DB2 for Linux, UNIX, and Windows, thay đổi phiên bản thành V9.7 và cập nhật tên tệp là Physical Target Data Model, như trong Hình 23.
Hình 23. Quy định tên tệp và phiên bản cơ sở dữ liệu cho mô hình dữ liệu vật lý
Ảnh chụp màn hình: Cửa sổ Physical Data Model File có filename và version được tô đậm
  1. Nhấn Next. Cửa sổ kết quả nhắc bạn quy định các thuộc tính khóa, như trong Hình 24 và được mô tả trong các bước sau đây.
  2. Chọn Name Case (Trường hợp tên) cho các tên vật lý là Use lower case (Sử dụng chữ thường).
  3. Nhập tên Schema là reporting.
  4. Đánh dấu chọn ô Transform diagrams (Chuyển đổi các sơ đồ).
  5. Đánh dấu chọn ô Column ordering (key columns first) (Thứ tự Cột (các cột khóa đầu tiên)).
  6. Nhấn Next sau khi bạn đã hoàn thành quy định các thuộc tính.
Hình 24. Chuyển đổi sang mô hình dữ liệu vật lý
Ảnh chụp màn hình: Tên lược đồ, chữ thường, các sơ đồ chuyển đổi và thứ tự cột được tô đậm
  1. Nhấn Next.

Bây giờ bạn đã tạo thành công mô hình dữ liệu vật lý. Lưu ý rằng một mục nhập cho mô hình mới này là Physical Target Data Model.dbm đã được tạo ra trong Data Project Explorer, như trong Hình 25.

Hình 25. Mô hình vật lý mới được tạo ra
Ảnh chụp màn hình: Data Project Explorer có Physical Target Data Model.dbm được tô đậm

Tùy chỉnh khung nhìn của bạn

Để tùy chỉnh cách hiển thị mô hình của bạn, nhấn vào thẻ Properties và chọn tất cả các tùy chọn sau đây trên màn hình Properties, như trong Hình 26:

  • Show key (Hiển thị khóa).
  • Show non-key (Hiển thị không khóa).
  • Show name (Hiển thị tên).
  • Show label (Hiển thị nhãn).
  • Show data types (Hiển thị các kiểu dữ liệu).
  • Show foreign key decoration (Hiển thị trang trí khóa ngoài).
Hình 26. Hiển thị các tùy chọn cho các mô hình
Ảnh chụp màn hình:Cửa sổ Package1_Diagram1 có các tùy chọn được tô đậm

Bây giờ mô hình dữ liệu vật lý của bạn đã sẵn sàng để sử dụng làm một đích trong các phép chuyển đổi và các ánh xạ mà bạn sẽ thực hiện trong phần tiếp theo.


Tạo các ánh xạ giữa các bảng nguồn và đích

Phần này mô tả cách thực hiện ánh xạ thực tế giữa các bảng nguồn và đích. IDA cung cấp các mô hình ánh xạ (mapping models) cho mục đích này. Hãy hoàn thành các bước sau để tạo một mô hình như vậy khi sử dụng chức năng của IDA.

  1. Chuyển đến Data Project Explorer, nhấn chuột phải vào thư mục Mappings.
  2. Nhấn New > Mapping Model. Cửa sổ kết quả được hiển thị trong Hình 27.
Hình 27. Đặt tên mô hình ánh xạ
Ảnh chụp màn hình: Cửa sổ Create Mapping có MyMappingTutorial được tô đậm
  1. Thay đổi tên tệp là source_to_target_mapping.msl. Lúc này, nếu bạn muốn tạo một liên kết đến một mô hình ánh xạ hiện có, bạn nên nhấn Advanced, nhưng việc đó không cần thiết với hướng dẫn này.
  2. Nhấn Next.
  3. Nhấn Add, và chọn Source Database Model 1 làm mô hình dữ liệu nguồn cho ánh xạ mà bạn muốn tạo ra, như trong Hình 28.
Hình 28. Chọn mô hình cơ sở dữ liệu nguồn để ánh xạ
Ảnh chụp màn hình: Quy định cửa sổ Mapping Source hiển thị Source Database Model 1.dbm
  1. Chọn MACHADO làm lược đồ cơ sở dữ liệu cho mô hình ánh xạ, như trong Hình 29.
Hình 29. Chọn lược đồ nguồn cho mô hình ánh xạ
Ảnh chụp màn hình: Source Database Model 1.dbm có MACHADO được chọn ở dưới
  1. Nhấn Finish.
  2. Lặp lại các bước từ 2 đến 7 cho mô hình dữ liệu đích Physical Target Data Model.dbm, như trong Hình 30.
Hình 30. Chọn mô hình và lược đồ dữ liệu đích cho mô hình ánh xạ
Ảnh chụp màn hình: Quy định cửa sổ Mapping Target có Physical Target Data Model và Reporting được chọn

Bây giờ bạn đã tạo ra mô hình ánh xạ có các bảng cần thiết để bắt đầu ánh xạ thực tế giữa các bảng nguồn và đích.

Tạo một ánh xạ để điền vào bảng đích

Hãy hoàn thành các bước sau đây để tạo ra một ánh xạ điền vào bảng đích với dữ liệu về các chi phí sinh ra từ tiền lương của mỗi thành viên dự án được gộp chung theo dự án.

  1. Nhấn chuột vào cột, ấn giữ phím Shift xuống và chọn các trường sau đây:
    • employee.empno
    • project.respemp
    • ent_proj_cost.cost_per_project
  2. Nhấn chuột phải vào cửa sổ Mappings và chọn Create Mapping (Tạo ánh xạ) từ trình đơn ngữ cảnh. IDA tạo các liên kết đồ họa giữa các cột nguồn và đích được chọn.
  3. Nhấn vào thẻ Properties ở giữa vùng phía dưới của màn hình và cuộn xuống đến hộp chuyển đổi.
  4. Nhập thủ công quy tắc chuyển đổi trong Liệt kê 1, thay thế tên người dùng machado bằng tên mà bạn đã sử dụng khi tạo cơ sở dữ liệu SAMPLE, nếu cần.
Liệt kê 1. Quy tắc chuyển đổi
SELECT projname, sum(Salary) as summe
FROM machado.employee, machado.proj
where employee.empno = proj.respemp
group by  projname

Liệt kê 1 cũng chứa tiêu chí lựa chọn và tính gộp.

Hình 31 hiển thị mô hình của bạn.

Hình 31. Mô hình ánh xạ với quy tắc chuyển đổi đầu tiên được định nghĩa
Ảnh chụp màn hình: Dòng chảy hiển thị EMPNO, SALARY và RESPEMP trong nguồn đến đích

(Xem ảnh lớn hơn của Hình 31.)

  1. Lặp lại các bước 1 đến 4 để tạo ra một ánh xạ một-một cho các trường sau đây:
    • Project.Projectno > ent_proj_cost.projno
    • Project.projname > ent.proj_cost.proj_name
  2. Thêm văn bản 1:1 trong các hộp chuyển đổi của các ánh xạ tương ứng.

Bây giờ bạn đã ánh xạ thành công tất cả các cột cho hướng dẫn này.


Phân tích mô hình của bạn bằng cách sử dụng các chức năng báo cáo

IDA cung cấp một loạt các báo cáo dựng sẵn có thể dễ dàng được sử dụng để sản xuất tài liệu. Bây giờ bạn có thể tạo ra một báo cáo hiển thị các chi tiết của mô hình ánh xạ mà bạn đã xây dựng trong phần trước.

  1. Chuyển đến thanh trình đơn và chọn Run > Report > Report Configurations. Màn hình Report Configuration (Cấu hình báo cáo) xuất hiện, như trong Hình 32. Từ màn hình này, bạn có thể cấu hình, quản lý hoặc chạy một báo cáo:
Hình 32. Cấu hình báo cáo
Ảnh chụp màn hình: Cửa sổ Configurations hiển thị My BIRT Logical Model Report
  1. Nhấn đúp vào Data Model Classic XSLT Report (Báo cáo XSLT kinh điển của Mô hình dữ liệu) để tạo một trang cấu hình báo cáo mới để trống.
  2. Đổi tên báo cáo là MyTutorialMappingReport.
  3. Chuyển đến hộp Report Input (Đầu vào báo cáo) và nhấn Browse.
  4. Chọn /MyMappingTutorial/source_to_target_mapping.msl làm đầu vào cho báo cáo.
  5. Nhấn Browse cho trường Built-In (Dựng sẵn) và nhấn vào Classic Mapping Model Report (Báo cáo của mô hình ánh xạ kinh điển) của mô hình ánh xạ. Cửa sổ kết quả được hiển thị trong Hình 33.
Hình 33. Báo cáo của mô hình ánh xạ kinh điển
Ảnh chụp màn hình: Chọn Built In Model Report có Report được tô đậm
  1. Trong hộp Report Output (Đầu ra báo cáo), gõ vào Location (Địa điểm) nơi bạn muốn lưu trữ báo cáo, đặt tên cho báo cáo là xslt_classic_mapping_model.pdf, như trong Hình 34. Hiện tại PDF là định dạng đầu ra duy nhất được hỗ trợ cho báo cáo.
Hình 34. Trang cấu hình báo cáo đã hoàn thành
Ảnh chụp màn hình: Viết MyTutorialMappingReport vào xslt_classic_mapping_model.pdf

Tạo một báo cáo thực tế

Bạn có hai cách để tạo ra một báo cáo thực tế:

  • Nhấn Report ở dưới cùng của hộp thoại cấu hình (bắt buộc cho lần chạy đầu tiên).
  • Nhấn Close (Đóng) ở dưới cùng của hộp thoại cấu hình.

Để tiếp tục hướng dẫn này, hãy nhấn Run > Report > MyTutorialMappingReport từ thanh trình đơn. Một tệp PDF sẽ mở ra có chứa dữ liệu báo cáo ánh xạ. Vì mô hình ánh xạ của bạn rất đơn giản, nên báo cáo chỉ hiển thị một vài ánh xạ.

Mô hình ánh xạ có hai phần chính:

Thông tin về tiêu đề
  • Tên của mô hình ánh xạ mà báo cáo dựa vào.
  • Các bảng nguồn và đích.
  • Một bảng các nội dung dựa vào các đối tượng đích.

Thông tin tiêu đề cho MyTutorialMappingReport được thể hiện trong Hình 35.

Hình 35. Vùng tiêu đề của báo cáo ánh xạ
Ảnh chụp màn hình: Mô hình ánh xạ hiển thị Mapping Spec File, Associated Models và Content
Thông tin ánh xạ chi tiết
  • Ánh xạ cột nguồn nào tới cột đích nào và dựa vào quy tắc chuyển đổi nào.
  • Tiêu chí nối.

Thông tin ánh xạ chi tiết cho MyTutorialMappingReport được thể hiện trong Hình 36.

Hình 36. Báo cáo ánh xạ chi tiết
Ảnh chụp màn hình: Báo cáo hiển thị các ánh xạ, các đích và các nguồn cho ent_proj_cost

Kết luận

Hướng dẫn này mô tả cách nhận được một mô hình ánh xạ có ý nghĩa đầu tiên cho việc thiết kế các nhiệm vụ ETL chỉ bằng một vài bước.

Bạn đã bắt đầu bằng cách tạo một thư mục dự án mới cho các mô hình ánh xạ trong InfoSphere Data Architect (IDA). Tiếp theo, bạn đã tạo một mô hình dữ liệu vật lý nguồn (bằng cách sử dụng cơ sở dữ liệu SAMPLE tiêu chuẩn trong DB2). Bạn đã mở rộng mô tả các trường trong mô hình này. Sau đó bạn đã định nghĩa một mô hình dữ liệu vật lý đích mới với IDA từ đầu. Rồi bạn đã bắt đầu định nghĩa mô hình ánh xạ. Bạn đã thiết kế một vài ánh xạ đơn giản từ nguồn tới đích, đã cho thấy các khả năng để thiết kế các ánh xạ ETL bằng IDA. Trong phần cuối cùng, bạn đã học cách tạo báo cáo các ánh xạ trong một báo cáo xslt kinh điển quan trọng nhất.

Bây giờ bạn có thể sử dụng cách tiếp cận này cho các kịch bản phức tạp hơn với hàng trăm ánh xạ. Sau đó, bạn có thể tận dụng các tính năng tự động hóa để dễ thay đổi, dễ tạo phiên bản và tạo báo cáo thiết thực tốt hơn bằng cách sử dụng công cụ mô hình hóa dữ liệu InfoSphere Data Architect (IDA) từ IBM.

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạn



Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management
ArticleID=793533
ArticleTitle=Phát triển các mô hình ánh xạ với InfoSphere Data Architect của IBM
publish-date=02142012