Nghiên cứu sâu về Ấn bản DB2 Advanced Enterprise Server, Phần 2: Liên hiệp và sao chép Q

Đây là bài thứ hai trong loạt bài nêu bật IBM® DB2® Advanced Enterprise Server Edition (IBM DB2 AESE - Ấn bản Máy chủ doanh nghiệp nâng cao DB2 của IBM) cho Linux®, UNIX® và Windows® (LUW) — một gói phần mềm gồm phiên bản V9.7 của IBM DB2 Enterprise Server Edition (Ấn bản máy chủ doanh nghiệp DB2 của IBM) kèm theo tối ưu hóa, cộng với một bộ các công cụ quản lý và phát triển mạnh mẽ. Khi cung cấp một giải pháp tích hợp, toàn diện trong một gói, DB2 AESE cải thiện khả năng quản lý môi trường DB2 của bạn mà không làm phức tạp thêm.

David Tolleson, Giám đốc sản phẩm, IBM

David Tolleson đã làm việc cho IBM trong 30 năm. Ông hiện là giám đốc sản phẩm của các sản phẩm InfoSphere Federation Server (Máy chủ liên hiệp InfoSphere) và InfoSphere Replication Server (Máy chủ sao chép InfoSphere) của IBM. Ông đã làm việc nhiều về liên hiệp dữ liệu và đã là một trong những nhà phát triển máy chủ liên hiệp đầu tiên của IBM, được gọi là DB2 DataJoiner. Ông quản lý hai blog: The Data Replication Exchange và About Data Federation.



09 03 2012

Bài này làm sáng tỏ hai tính năng quan trọng trong DB2 AESE:

  • Sao chép Q cung cấp tính sẵn sàng cao của hệ thống thông qua việc sao chép chủ động/chủ động giữa một cặp máy chủ dữ liệu DB2 cho LUW.
  • Liên hiệp cung cấp truy cập trong suốt đến dữ liệu từ các cơ sở dữ liệu khác nhau giúp làm đơn giản hóa việc tích hợp dữ liệu cho các khách hàng đang sử dụng DB2 và các công nghệ cơ sở dữ liệu khác trong một môi trường hỗn hợp. AESE thêm sự liên hiệp cơ sở dữ liệu Oracle vào sự liên hiệp đã sẵn có của DB2 cho các cơ sở dữ liệu DB2 và Informix®.

Xem qua DB2 Advanced Enterprise Server Edition (DB2 AESE)

DB2 AESE gồm có các tính năng và lợi ích sau đây, không tính thêm chi phí:

  • Tính năng lưu trữ tối ưu hóa (Nén) làm giảm chi phí lưu trữ.
  • IBM Optim Performance Manager (OPM – Trình quản lý hiệu năng Optim của IBM) giúp xác định các vấn đề trước khi chúng ảnh hưởng đến kinh doanh.
  • Sao chép đồng nhất (Q-REP) cho phép di trú liền mạch phiên bản này sang phiên bản khác và các cấu trúc liên kết chủ động-chủ động có tính sẵn sàng cao (giới hạn cho một cặp cơ sở dữ liệu DB2 cho LUW).
  • Kiểm soát truy cập nâng cao cho phép kiểm soát tốt hơn những ai có thể truy cập dữ liệu của bạn.
  • IBM Optim Database Administrator (ODA – Nhà quản trị cơ sở dữ liệu Optim của IBM) giúp tiết kiệm thời gian và giảm các lỗi về quản trị cơ sở dữ liệu.
  • IBM Optim Development Studio (ODS – Xưởng phát triển Optim của IBM) sẽ giúp phát triển nhanh và cải thiện sự hợp tác giữa các nhóm.
  • IBM InfoSphere™ Federation (Liên hiệp InfoSphere của IBM) cho phép tích hợp dữ liệu thời gian thực, giữa các ứng dụng (giới hạn với liên hiệp DB2, Informix® và Oracle).
  • IBM DB2 Workload Manager sắp xếp phân bổ tài nguyên để ưu tiên kinh doanh.

Tính sẵn sàng liên tục được cung cấp qua sao chép Q

Công nghệ sao chép Q trong DB2 AESE có thể tạo bản sao các giao dịch giữa các cơ sở dữ liệu với độ trễ thấp ở lưu lượng rất cao và vượt qua các khoảng cách hầu như không hạn chế với hàng ngàn bảng DB2, trong khi vẫn giữ gìn tính toàn vẹn giao dịch và có khả năng chịu được sự cố ngừng hoạt động của hệ thống và mạng. Ví dụ, bạn có thể có thể đạt tới một lưu lượng hàng triệu thay đổi mỗi phút với độ trễ ít hơn một giây.

Trong DB2 AESE, khả năng này được cung cấp thông qua việc sử dụng hạn chế tính năng sao chép đồng nhất của IBM cho DB2, cho phép sao chép chủ động/chủ động giữa một cặp cơ sở dữ liệu DB2 cho LUW để tối đa hóa việc sử dụng các tài nguyên máy chủ, giảm chi phí và cung cấp tính sẵn sàng cho nhiều vị trí. Nếu cần một kịch bản sao chép linh hoạt hơn (ví dụ, sao chép với một máy chủ Oracle), bạn có thể mua phiên bản đầy đủ của InfoSphere Replication Service (Dịch vụ sao chép InfoSphere).

Sao chép Q hai vị trí của DB2 AESE là lý tưởng cho các giải pháp về tính sẵn sàng liên tục nhiều vị trí, ví dụ như các cơ sở dữ liệu chủ động/chủ động. Mỗi cơ sở dữ liệu đều là chủ động, cho phép phân phối tải công việc. Các cơ sở dữ liệu có thể được cấu hình khác nhau và lưu trú trên các kiểu phiên bản phần cứng và phần mềm khác nhau, cho phép khắc phục lỗi ngừng hoạt động ngay lập tức, cũng như không có thời gian chết trong quá trình bảo trì, nâng cấp và di trú. Sao chép có thể theo nhiều hướng và quản lý các thay đổi cơ sở dữ liệu xung đột. Và nếu công ty của bạn đang sử dụng tính năng IBM pureScale® của DB2 Enterprise Server, sao chép Q có thể được sử dụng gắn liền với nó để tăng thêm giá trị.

Các thành phần của sao chép Q gồm có:

  • Một chương trình Q Capture và một chương trình Q Apply cho mỗi hướng
  • Một trình quản lý hàng đợi WebSphere® MQ cho mỗi hệ thống (một bản sao hạn chế của WebSphere MQ được bao gồm trong AESE).
  • Các bảng kiểm soát sao chép được tạo ra trong DB2 để chứa thông tin hoạt động và cấu hình sao chép Q.

Các thay đổi đã nắm bắt được dàn dựng và gửi qua MQ WebSphere, cho phép di chuyển dữ liệu ra ngoài bản ghi nhật ký DB2 một cách nhanh chóng, ngay cả khi cơ sở dữ liệu đích ngừng hoạt động. Mỗi giao dịch cơ sở dữ liệu đã nắm bắt được công bố trong một thông báo MQ. Quá trình sao chép Q được mô tả dưới đây.

Hình 1. Quá trình sao chép Q
Sơ đồ của quá trình sao chép Q cho phép sao chép chủ động/chủ động

Để minh họa một quá trình sao chép chủ động/chủ động, hãy xem xét kịch bản đã đơn giản hóa được mô tả sau đây:

  • Các ứng dụng cập nhật được giao cho vị trí chính với các ứng dụng chỉ đọc được giao cho vị trí dự phòng. Hãy nhớ rằng, sao chép Q cũng làm việc trong trường hợp cả hai vị trí đều là chủ động để cập nhật.
  • Các chương trình nắm bắt-ghi nhật ký và chương trình ứng dụng chạy ở cả hai vị trí, nhưng trong kịch bản đã đơn giản hóa này, dữ liệu chỉ được sao chép theo một hướng — từ vị trí chính sang vị trí dự phòng.
  • Một kết nối chuyển đổi dự phòng được thiết lập để tự động chuyển đổi các ứng dụng cập nhật từ vị trí chính sang vị trí dự phòng.
Hình 2. Kịch bản sao chép
Kịch bản sao chép đầu tiên ở đây Vị trí A là chủ động còn Vị trí B là dự phòng

Khi xảy ra sự cố ngừng hoạt động tại vị trí chính, các ứng dụng tự động chuyển sang vị trí dự phòng, mặc dù vẫn có một quá trình thủ công có sẵn nếu thích sử dụng. Để tránh các xung đột, hãy để cho việc sao chép kết thúc việc xử lý bất kỳ dữ liệu đã xếp hàng đợi nào trước khi bạn cho phép các ứng dụng đang cập nhật khởi chạy trên vị trí dự phòng. Việc sao chép sẽ bắt đầu xếp hàng dữ liệu đã thay đổi để trở lại vị trí chính ngay sau khi các ứng dụng đã cập nhật truy cập vào hệ thống dự phòng.

Hình 3. Sự cố ngừng hoạt động của vị trí chính
Sơ đồ định tuyến lại đến vị trí dự phòng khi xảy ra sự cố tại Vị trí A

Khi vị trí chính hoạt động trở lại, các ứng dụng cập nhật vẫn ở nơi mà chúng đã ở đó cho đến khi giải quyết xong các xung đột tiềm năng. Đầu tiên, các chương trình nắm bắt được khởi động ở vị trí chính để nắm bắt bất kỳ dữ liệu đã thay đổi nào đã bị kẹt lại ở vị trí chính khi nó bị ngừng hoạt động. Việc này tạo ra cơ hội để xem liệu có các xung đột không do các thay đổi cũ hơn ở vị trí chính có thể không phù hợp với các thay đổi mới ở vị trí dự phòng. Bất cứ khi nào bản sao chép phát hiện ra một xung đột, SQL của xung đột đó được ghi nhật ký vào trong một bảng. Có thể tạo ra một báo cáo để xem liệu có bất kỳ vấn đề lớn nào tồn tại không. Việc chọn tùy chọn ngăn không cho sao chép áp dụng dữ liệu có xung đột cho bảng dự phòng, sẽ ngăn không cho dữ liệu cũ hơn ghi đè lên dữ liệu mới hơn (được giả định là tốt hơn).

Hình 4. Thu nhận dữ liệu từ vị trí dự phòng
Dựa vào việc khôi phục của Vị trí A, vị trí thứ 2 vẫn chính để cập nhật vị trí A

Khi dữ liệu bị mắc kẹt được sao chép lại, dữ liệu dự phòng có thể được gửi đến vị trí chính bằng cách khởi động chương trình ứng dụng trên hệ thống chính. Sau đó, dữ liệu dự phòng sẽ chảy sang vị trí chính. Nếu trước đó bạn đã thấy một sự xung đột giữa dữ liệu cũ hơn ở vị trí chính với dữ liệu mới hơn ở vị trí dự phòng, thì tùy chọn đã chọn này cho phép dữ liệu mới hơn ghi đè lên dữ liệu cũ hơn, nhưng được ghi nhật ký lại để bạn xem sau này. Các ứng dụng có thể được di chuyển trở lại vị trí chính, nhưng tốt nhất là hãy chờ cho đến khi chương trình ứng dụng giải quyết xong công việc tồn đọng của vị trí dự phòng trước đã. Kết quả là, hệ thống trông giống như kịch bản ban đầu.

Hình 5. Các ứng dụng cập nhật quay lại vị trí chính
Vị trí A trở về trạng thái chính khi việc cập nhật hoàn thành

Ngoài các khả năng sao chép Q linh hoạt và mạnh mẽ do DB2 AESE cung cấp, có một số báo cáo và công cụ có sẵn để làm cho nó còn hiệu quả hơn. Đầu tiên là bản tóm tắt sức khỏe mẫu từ Bảng điều khiển sao chép Q (Q Replication Dashboard), cung cấp các khung nhìn trực tiếp toàn cục và các khung nhìn gộp chung về sức khỏe và trạng thái của chương trình, các hàng đợi, đăng ký và cấu trúc liên kết. Các thông tin chi tiết về truy vấn ngược có sẵn sau thông tin trạng thái, cũng như các truy cập vào dữ liệu lịch sử. Sự hỗ trợ cho các cảnh báo, các hoạt động và các vai trò người dùng để kiểm soát truy cập cũng có sẵn từ bảng điều khiển.

Hình 6. Bảng điều khiển sao chép Q
Ảnh hiển thị một ảnh chụp của bàn đìeu khiển sao chép Q

Dưới đây là một báo cáo mẫu về xu hướng lịch sử của độ trễ dữ liệu từ điểm đầu đến điểm cuối tại một hệ thống đích, giúp kiểm tra việc tuân thủ SLA và lần theo vết các đỉnh nhọn bất thường về độ trễ.

Hình 7. Lịch sử độ trễ
Ảnh hiển thị một ảnh chụp cho thấy xu hướng lịch sử với độ trễ dữ liệu từ đầu đến cuối

Cuối cùng, Q Replication Performance Advisor (Trình tư vấn hiệu năng sao chép Q) giúp xác định các vấn đề về độ trễ với môi trường sao chép và thực sự cho thấy cách làm giảm độ trễ từ điểm đầu đến điểm cuối.

Hình 8. Trình tư vấn hiệu năng sao chép Q
Một ảnh chụp của Q Replication Performance Advisor

Tích hợp cơ sở dữ liệu Oracle với DB2 thông qua liên hiệp

Có đi kèm trong gói AESE cho LUW là một bản sao sử dụng hạn chế của IBM InfoSphere Federation Server (Máy chủ liên hiệp InfoSphere của IBM), cung cấp sự tích hợp dễ dàng các cơ sở dữ liệu Oracle, Informix, DB2 trong một doanh nghiệp và khả năng truy vấn dữ liệu này đang lưu trú trong nhiều cơ sở dữ liệu bằng một câu lệnh SQL duy nhất. Cần có InfoSphere Replication Server (mua riêng) để sử dụng sao chép Q với các cơ sở dữ liệu Oracle.

Liên hiệp các nguồn dữ liệu khác nhau thành một hệ thống liền khối mang lại:

  • Tính trong suốt— Khả năng mã hóa và sử dụng ứng dụng như thể dữ liệu lưu trú trong một cơ sở dữ liệu duy nhất. Điều này cho phép các ứng dụng tiếp tục làm việc dù có bất kỳ thay đổi nào về cách lưu trữ dữ liệu.
  • Tính đa dạng— Khả năng thích nghi với các yêu cầu dữ liệu khác nhau và các nguồn dữ liệu khác nhau trong doanh nghiệp.
  • Tính tự chủ— Không có các hạn chế nào tại nguồn dữ liệu từ xa, cho phép nó tự chủ và loại bỏ bất kỳ sự gián đoạn nào với các nguồn dữ liệu, các ứng dụng và các hệ thống.
  • Chức năng cao— Khả năng để các ứng dụng khai thác không chỉ có mức chức năng cao do hệ thống liên hiệp cung cấp mà còn cả các chức năng đặc biệt duy nhất của một số nguồn dữ liệu.
  • Khả năng mở rộng và tính mở— Tính linh hoạt để liên tục tăng thêm một nguồn dữ liệu mới vào hệ thống thông tin doanh nghiệp.
  • Hiệu năng được tối ưu hóa— Sức mạnh của các ứng dụng đã phát triển cho các hệ thống liên hiệp để đạt được hiệu năng mạnh mẽ mà không cần phải thực hiện các chiến lược đặc biệt để đánh giá các truy vấn.

Cốt lõi của hệ thống liên hiệp gồm một cá thể DB2 hoạt động như một máy chủ liên hiệp. Các thành phần bao gồm một cơ sở dữ liệu DB2 hoạt động như cơ sở dữ liệu liên hiệp, một hoặc nhiều nguồn dữ liệu như Oracle hoặc cơ sở dữ liệu DB2 khác và các khách hàng (người sử dụng và các ứng dụng) truy cập dữ liệu thông qua cơ sở dữ liệu liên hiệp. Với một cơ sở dữ liệu liên hiệp, bạn có thể sử dụng một câu lệnh SQL duy nhất để nối dữ liệu từ nhiều nguồn dữ liệu, gồm cả chính cơ sở dữ liệu liên hiệp đó.

Sau khi bạn đăng ký các bảng của một nguồn dữ liệu vào trong cơ sở dữ liệu liên hiệp, bạn có thể tham khảo chúng dễ dàng như bạn thường tham khảo các bảng cục bộ. Các ứng dụng giao tiếp với máy chủ liên hiệp thông qua bất kỳ giao diện lập trình nào được DB2 hỗ trợ. Do một hệ thống liên hiệp có một cơ sở dữ liệu DB2, nên bạn cũng có thể lưu trữ dữ liệu cục bộ, cũng như kết hợp thông tin từ các bảng cục bộ và từ xa.

Các khái niệm cơ bản của một hệ thống liên hiệp của IBM được mô tả như sau.

Hình 9. Máy chủ liên hiệp
Sơ đồ minh họa các thành phần của hệ thống liên hiệp

Để biến DB2 AESE thành một máy chủ cơ sở dữ liệu liên hiệp, bạn phải thay đổi cấu hình của trình quản lý cơ sở dữ liệu của cá thể DB2 để cho phép liên hiệp (thiết lập Federated là Yes) và cấu hình nó để giao tiếp với các nguồn dữ liệu.

  • Các máy chủ liên hiệp giao tiếp với các nguồn dữ liệu bằng các mô đun phần mềm được gọi là các trình bao (wrappers). Các trình bao này cung cấp logic để làm cho việc đăng ký đối tượng liên hiệp và giao tiếp với nguồn dữ liệu dễ dàng hơn. Bạn cần đăng ký một trình bao duy nhất để truy cập vào tất cả các nguồn dữ liệu của các loại mà trình bao đó hỗ trợ. Ví dụ, một trình bao cơ sở dữ liệu Oracle là tất cả những gì cần thiết cho bất kỳ số lượng nguồn dữ liệu Oracle nào.
  • Sau khi bạn đăng ký các thư viện trình bao với cơ sở dữ liệu liên hiệp, mỗi nguồn dữ liệu phải được xác định với hệ thống như một máy chủ. Một máy chủ thường đại diện cho một cơ sở dữ liệu trên hệ thống khác. Cơ sở dữ liệu liên hiệp dựa vào các thuộc tính máy chủ để đảm bảo rằng các khả năng của mỗi nguồn dữ liệu được khai thác đúng cách. Các thuộc tính máy chủ trên cơ sở dữ liệu liên hiệp lưu trữ các đặc tính của mỗi nguồn dữ liệu. Trình tối ưu hóa DB2 sử dụng các đặc tính này và các hạn chế khi xác định cách tốt nhất để xử lý một truy vấn. Khi sử dụng các tùy chọn máy chủ để thiết lập các thuộc tính máy chủ bên ngoài, bạn có thể chỉ rõ vị trí của nguồn dữ liệu (nút máy tính), thông tin bảo mật kết nối (ID và mật khẩu) và một số đặc tính máy chủ khác có ảnh hưởng đến hiệu năng. Mỗi mô đun trình bao duy trì một tập các thuộc tính máy chủ liên quan đến kiểu và phiên bản của các nguồn dữ liệu mà nó hỗ trợ. Đẩy xuống (Pushing down)— một hoạt động cho phép nó diễn ra trên nguồn dữ liệu từ xa — có thể có lợi trong việc giảm số lượng dữ liệu đưa đến máy chủ liên hiệp qua mạng, vì thế giúp cải thiện hiệu năng truy vấn.
  • Các tên hiệu (Nicknames) được tạo ra trong cơ sở dữ liệu liên hiệp để xác định các bảng và các khung nhìn của nguồn dữ liệu. Bây giờ bạn có thể tham chiếu tên hiệu trong ứng dụng của mình như thể nó đã là một bảng cục bộ và chúng sẽ xuất hiện cho các trình khách như là các bảng DB2. Các tên hiệu có thể có các cột, số liệu thống kê, các chỉ mục hoặc các ràng buộc thông tin.
  • Các nguồn dữ liệu thường yêu cầu xác thực. Thông tin xác thực được đăng ký với hệ thống liên hiệp dưới dạng các ánh xạ người dùng. Điều này tạo ra một tầng bảo đảm an toàn bổ sung. ID và mật khẩu người dùng của khách hàng để truy cập cơ sở dữ liệu liên hiệp được ánh xạ tới một ID và mật khẩu người dùng từ xa.
  • Một thủ tục liên hiệp là một thủ tục cục bộ được ánh xạ tới thủ tục nguồn dữ liệu.

Kết luận

DB2 AESE là một giải pháp cơ sở dữ liệu đầy đủ trong một gói duy nhất với một giá thấp. Trong nhiều khả năng và lợi ích mà nó cung cấp có tính sẵn sàng cao và các giải pháp liên tục-kinh doanh và việc quản trị được đơn giản hóa có thể giúp hợp nhất môi trường dữ liệu đa dạng cho các khách hàng bằng cách sử dụng các cơ sở dữ liệu DB2 và Oracle. Sao chép chủ động/chủ động được cung cấp thông qua công nghệ sao chép Q của nó cho phép bảo vệ trước các lỗi vị trí và sẵn sàng liên tục trong quá trình cập nhật và bảo trì. Máy chủ liên hiệp đã gồm trong DB2 AESE đơn giản hoá việc tích hợp cơ sở dữ liệu cho các khách hàng di chuyển từ Oracle sang DB2 hoặc những người đang quản lý một môi trường hỗn hợp. Để tìm hiểu thêm về DB2 AESE và các khả năng mà nó cung cấp, hãy tham khảo các tài nguyên dưới đây.

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạn



Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management
ArticleID=801333
ArticleTitle=Nghiên cứu sâu về Ấn bản DB2 Advanced Enterprise Server, Phần 2: Liên hiệp và sao chép Q
publish-date=03092012