Sử dụng InfoSphere Data Architect để định nghĩa và thi hành các tiêu chuẩn đặt tên đối tượng dữ liệu

Các tiêu chuẩn đặt tên đối tượng dữ liệu thúc đẩy sự hiểu biết chung về dữ liệu, chia sẻ dữ liệu qua các ranh giới của tổ chức và làm giảm sự dư thừa dữ liệu thông qua việc hợp nhất các thành phần dữ liệu đồng nghĩa và chồng chéo. Khi các tổ chức tìm kiếm hướng tới hiệu quả to lớn hơn nữa trong những ngày này, họ đang nắm lấy các tiêu chuẩn đặt tên trong việc quản lý dữ liệu và đã bắt đầu thi hành các tiêu chuẩn đó. Bài này xem xét các tính năng của IBM® InfoSphere Data Architect (IDA-Kiến trúc sư dữ liệu InfoSphere của IBM), cho phép người dùng định nghĩa và thực hiện các tiêu chuẩn đặt tên đối tượng và sau đó chứng tỏ bằng một ví dụ trong thế giới thực.

[07.10.2010: Bài này đã được cập nhật để phản ánh các khả năng của InfoSphere Data Architect 7.5.3.--Biên tập viên.]

Giới thiệu

Gần đây các tổ chức đã nhận ra tầm quan trọng của các tiêu chuẩn đặt tên trong việc quản lý dữ liệu và bắt đầu thi hành chúng. Khi thi hành một tiêu chuẩn đặt tên, cần phải sử dụng các từ được định nghĩa trong một bảng chú giải và thực hiện theo thứ tự của từ khi đặt tên một đối tượng dữ liệu. IDA sẽ giúp những người dùng định nghĩa bảng chú giải và các tiêu chuẩn đặt tên đối tượng dữ liệu của họ, làm cho việc tạo các tên đối tượng dễ dàng tuân theo các tiêu chuẩn đặt tên. Nó tạo điều kiện thuận lợi cho việc chuyển đổi các tên đối tượng của mô hình logic thành các tên đối tượng của mô hình vật lý và cho phép người dùng xác nhận hợp lệ các đối tượng dữ liệu của họ để đảm bảo tuân thủ các tiêu chuẩn đặt tên của chúng.

Thay đổi tên sản phẩm

Ngày 16 tháng 12 năm 2008, IBM đã công bố rằng Phiên bản 7.5.1, Rational Data Architect (Kiến trúc sư dữ liệu Rational) được đổi tên thành InfoSphere Data Architect nhằm đề cao vai trò của nó trong các công cụ của nền tảng InfoSphere (InfoSphere Foundation).

Các tiêu chuẩn đặt tên được thi hành trong nhiều tổ chức để cung cấp một môi trường dữ liệu thúc đẩy truyền thông tốt hơn và đưa ra quyết định am hiểu hơn cho cả các bên liên quan ở bên trong lẫn bên ngoài. Các lợi ích của việc lập ra các tiêu chuẩn đặt tên đối tượng dữ liệu gồm có:

  • Thúc đẩy một sự hiểu biết chung về dữ liệu.
  • Thúc đẩy việc chia sẻ dữ liệu qua các ranh giới của tổ chức.
  • Giảm dư thừa dữ liệu thông qua việc hợp nhất các thành phần dữ liệu đồng nghĩa và chồng chéo.

Các tiêu chuẩn đặt tên đối tượng dữ liệu

Một tiêu chuẩn, hay quy ước, đặt tên đối tượng dữ liệu mô tả cách tạo thành tên đối tượng dữ liệu. Một tiêu chuẩn đặt tên có thể trình bày một loạt các khía cạnh tài liệu rộng lớn, như được mô tả trong Tiêu chuẩn quốc tế ISO/IEC 11179-5:

  • Phạm vi của quy ước đặt tên; ví dụ, một tên ngành công nghiệp đã thành lập.
  • Cơ quan đặt các tên.
  • Các quy tắc ngữ nghĩa quản lý nguồn và nội dung của các từ được sử dụng trong một tên; ví dụ, các từ có nguồn gốc từ các mô hình dữ liệu và các từ thường được sử dụng theo quy định.
  • Các quy tắc cú pháp quy định một thứ tự từ ngữ bắt buộc.
  • Các quy tắc từ vựng quy định các danh sách từ, chiều dài tên, bộ ký tự và ngôn ngữ cần kiểm soát.
  • Một quy tắc đặt các tên có phải là duy nhất hay không.

Có một số các khía cạnh về tổ chức rất cụ thể. Bài này tập trung vào ngữ nghĩa học và các phần cú pháp của một tiêu chuẩn đặt tên và giả định rằng đã mô tả rõ ràng một danh sách các từ đã được phê duyệt trong một tổ chức.

Có hai khía cạnh quan trọng của việc đặt tên một đối tượng dữ liệu: nội dung và định dạng của tên đối tượng dữ liệu.

  • Các quy tắc nội dung hoặc ngữ nghĩa học liên quan đến ý nghĩa cơ bản của các từ được chọn làm tên đối tượng và cho phép tên đối tượng chuyển tải ý nghĩa đó. Có ba loại từ đóng góp vào các nội dung của tên đối tượng dữ liệu: các từ gốc, các từ phân loại và các từ bổ nghĩa (còn được gọi là các từ hạn định) như được mô tả trong Tiêu chuẩn đặt tên thành phần dữ liệu.

    Các từ gốc:

    • Trình bày khái niệm nghiệp vụ về dữ liệu nào đang được thu thập.
    • Mô tả vùng chủ đề của dữ liệu.
    • Một danh từ hoặc cụm từ danh từ mô tả chủ đề và tập trung chủ yếu vào tên.
    • Đặt các thành phần dữ liệu trong ngữ cảnh logic của mô hình thông tin.

    Các ví dụ: Từ vay mượn, khách hàng, nhân viên, đặc tính

    Các từ phân loại:

    • Xác định một thể loại hoặc phân loại riêng của dữ liệu.
    • Phác họa kiểu dữ liệu đang được mô tả bằng tên dữ liệu.
    • Mô tả phân loại chính của dữ liệu gắn liền với một thành phần dữ liệu.

    Các ví dụ: Ngày, tổng số, tỷ lệ, số lượng, mã, chỉ số, tên, mô tả, ghi chú

    Các từ hạn định:

    • Nói rõ hoặc phân biệt hơn nữa các từ gốc và các từ phân loại.
    • Cung cấp tính rõ ràng và tính duy nhất cho tên dữ liệu.
    • Sửa đổi cả các từ phân loại lẫn các từ gốc.
    • Hạn chế ý nghĩa của các từ phân loại và các từ gốc.

    Các ví dụ: Cuối cùng, đầu tiên, tiếp theo, trước đó, bắt đầu

  • Các quy tắc định dạng hoặc cú pháp quy định cấu trúc của một tên đối tượng dữ liệu. Nó định nghĩa mẫu -- số và bố trí/trình tự các phần trong một tên. Ví dụ, một tiêu chuẩn đặt tên có thể yêu cầu các tên đối tượng dữ liệu sử dụng mô hình sau đây:

    {MOD}? {PW} {MOD}? {CW} {MOD}?

    Ở đây dấu phân cách là một khoảng trống, có thể có nhiều nhất là năm từ và ít nhất là hai từ và sự sắp xếp/trình tự của các từ như sau:

    1. Một từ bổ nghĩa (MOD), tùy chọn;
    2. Một từ gốc (PW), bắt buộc;
    3. Một từ bổ nghĩa (MOD), tùy chọn;
    4. Một từ phân loại (CW), bắt buộc;
    5. Một từ bổ nghĩa (MOD), tùy chọn.

    Các ví dụ về đối tượng dữ liệu hợp lệ là:

    • EMPLOYEE NAME (PW CW)
    • EMPLOYEE LAST NAME (PW MOD CW)
    • PERMANENT EMPLOYEE LAST NAME (MOD PW MOD CW)

Một tên nghiệp vụ là một tên có ý nghĩa và giống như tiếng Anh được sử dụng để mô tả một đối tượng dữ liệu. Các tên nghiệp vụ được sử dụng trong các mô hình dữ liệu dựa trên các khái niệm hoặc lô-gic. Một tên truy cập hoặc tên kỹ thuật mô tả một đối tượng dữ liệu khi được biểu diễn trong một cơ sở dữ liệu vật lý. Do các hệ thống quản lý cơ sở dữ liệu thường có các ràng buộc cụ thể, bao gồm các ký tự và độ dài ký tự, cho các tên đối tượng, nên để sử dụng các chữ viết tắt và dấu phân cách khác nhau cho các tên nghiệp vụ là rất phổ biến với các tên truy cập. Ví dụ, đối tượng EMPLOYEE LAST NAME trong mô hình lô-gic được chuyển thành EMPL_LST_NM trong mô hình vật lý.

Định nghĩa một tiêu chuẩn đặt tên bằng cách sử dụng IDA

Khi thi hành một tiêu chuẩn đặt tên, cần phải sử dụng các từ được định nghĩa trong một bảng chú giải và thực hiện theo các thứ tự của từ khi đặt tên một đối tượng dữ liệu. IDA sẽ giúp người dùng định nghĩa các tiêu chuẩn đặt tên đối tượng dữ liệu của họ. Để định nghĩa một tiêu chuẩn đặt tên bằng IDA, bạn quy định các từ được chọn cho các tên đối tượng dữ liệu trong một mô hình bảng chú giải và các mẫu từ khi sử dụng các sở thích về tiêu chuẩn đặt tên dữ liệu.

Tạo một mô hình bảng chú giải

Một mô hình bảng chú giải là một mô hình mô tả các từ được dùng, được phê duyệt và được chia sẻ trong một tổ chức dùng cho các tên của đối tượng dữ liệu. Khi sử dụng một mô hình bảng chú giải, bạn có thể định nghĩa tên, chữ viết tắt, chữ viết tắt thay thế, kiểu (gốc hoặc phân loại), nếu có thể sử dụng nó như một từ bổ nghĩa, trạng thái và bản tóm tắt hoặc mô tả cho các từ. Các mô hình bảng chú giải được lưu trữ trong các dự án thiết kế dữ liệu IDA. Bạn có thể chia sẻ một mô hình bảng chú giải giữa các dự án thiết kế đa dữ liệu.

Để tạo một mô hình bảng chú giải:

  1. 1. Nhấn vào File > New > Glossary Model từ trình đơn chính. Trình hướng dẫn New Glossary Model (Mô hình bảng chú giải mới) sẽ mở ra như trong Hình 1.
  2. Trong trình hướng dẫn này, bạn quy định một thư mục đích và tên tệp. Bạn có thể tạo mô hình bảng chú giải bằng cách sử dụng một khuôn mẫu trống, hoặc khuôn mẫu Enterprise (Doanh nghiệp) với một số từ điền vào. Bạn có thể chọn thêm mô hình bảng chú giải vào các đặc tính của dự án làm tiêu chuẩn đặt tên cho dự án đó.
  3. Nhấn vào Finish (Kết thúc).
Hình 1. Trình hướng dẫn mô hình bảng chú giải mới
Trình hướng dẫn mô hình bảng chú giải mới

Mô hình bảng chú giải được hiển thị trong Data Project Explorer (Trình thám hiểm Dự án dữ liệu) dưới thư mục đích mà bạn đã quy định. Nếu bạn đã chọn tùy chọn để thêm mô hình này vào các đặc tính dự án, tệp mô hình này cũng được hiển thị trên trang Naming Standard (Tiêu chuẩn đặt tên) trong khung nhìn Properties (Các đặc tính) cho dự án đó.

Sau khi tạo bảng chú giải của mình, bạn có thể sử dụng trình soạn thảo để thêm, bớt, hoặc sửa đổi các định nghĩa mô hình bảng chú giải như trong Hình 2. Nhấn New để thêm một hàng mới, rồi gõ tên, chữ viết tắt, chữ viết tắt thay thế và tóm tắt. Chọn một kiểu và trạng thái và cho biết nếu đó là một từ bổ nghĩa. Bạn có thể nhấp vào bất kỳ các cột của một hàng nào hoặc sử dụng khung nhìn Properties để chỉnh sửa một định nghĩa. Nếu đã có bảng chú giải cho tổ chức của mình, bạn có thể sao chép và dán các định nghĩa từ một nguồn khác, như Microsoft® Word hay Microsoft Excel.

Hình 2. Trình soạn thảo mô hình bảng chú giải để thêm, bớt và chỉnh sửa các từ
Trình soạn thảo mô hình bảng chú giải

Quy định một mẫu đặt tên

Phần thứ hai của một tiêu chuẩn đặt tên định nghĩa mẫu hoặc cấu trúc của một tên. Bạn có thể quy định điều này bằng cách sử dụng các sở thích về tiêu chuẩn đặt tên dữ liệu. Các sở thích này áp dụng cho tất cả các mô hình dữ liệu trong vùng làm việc của bạn.

Để thiết lập các sở thích cho các tiêu chuẩn đặt tên:

  1. Nhấn vào Window > Preferences (Cửa sổ > Các sở thích) từ trình đơn chính.
  2. Nhấn vào Data > Naming Standard (Dữ liệu > Tiêu chuẩn đặt tên).
  3. Trên trang Logical, như trong Hình 3, hãy thiết lập mẫu cho các tên của đối tượng thực thể và thuộc tính. Bạn có thể chỉ rõ liệu các từ gốc, các từ phân loại và các từ bổ nghĩa có là tùy chọn không và thứ tự cần xuất hiện của các thành phần này. Bạn cũng có thể quy định các ký tự dấu phân cách hợp lệ cho các đối tượng logic này. Theo mặc định, dấu phân cách cho các đối tượng logic là một khoảng trống. Với IDA V7.0, bạn có thể chọn <Title Case> làm dấu phân cách nếu tiêu chuẩn đặt tên của bạn đòi hỏi các tên có một định dạng viết bằng chữ hoa, ví dụ như EmployeeLastName.
  4. Trên trang Physical-Table/Column, hãy thiết lập mẫu cho các tên đối tượng bảng và cột trong một mô hình vật lý. Bạn có thể quy định liệu các từ gốc, các từ phân loại và các từ bổ nghĩa có là bắt buộc hay tùy chọn không và thứ tự cần xuất hiện của các thành phần này. Bạn cũng có thể quy định các ký tự dấu phân cách hợp lệ cho các đối tượng vật lý. Theo mặc định, dấu phân cách là một ký tự gạch dưới.
  5. Trên trang Physical-Other, như trong Hình 4, hãy thiết lập mẫu tên cho các đối tượng vật lý khác với các bảng và các cột, ví dụ, các khóa chính, các khóa ngoài, các ràng buộc kiểm tra, các ràng buộc đáng lưu ý, các chỉ mục và các tri-gơ bằng cách thêm hoặc bớt các biến và các chuỗi ký tự. Các mẫu đã định nghĩa trong trang này sử dụng các biến, ví dụ như tên bảng và tên cột và không tham khảo các từ.
  6. Trên trang Glossary (Bảng chú giải), hãy quy định một mô hình bảng chú giải mặc định. Các mô hình bảng chú giải đã quy định ở đây được sử dụng cho các đối tượng cơ sở dữ liệu hiển thị trong Database Explorer (Trình thám hiểm cơ sở dữ liệu).
Hình 3. Các sở thích về tiêu chuẩn đặt tên các đối tượng logic
Các sở thích về tiêu chuẩn đặt tên - các đối tượng logic
Hình 4. Các sở thích về tiêu chuẩn đặt tên các đối tượng vật lý khác với các bảng và các cột
Các sở thích về tiêu chuẩn đặt tên - các đối tượng vật lý

Bây giờ, bạn đã tạo thành công tiêu chuẩn đặt tên của mình. Khi các tiêu chuẩn đặt tên được tạo ra, làm thế nào để đảm bảo rằng các đối tượng dữ liệu tuân thủ các tiêu chuẩn đó? Quy tắc tuân thủ tiêu chuẩn đặt tên của IDA được thiết kế cho mục đích này.


Xác nhận hợp lệ tuân thủ tiêu chuẩn đặt tên

Quy tắc tuân thủ tiêu chuẩn đặt tên của IDA phát hiện ra các vi phạm tiêu chuẩn đặt tên. Việc kiểm tra này được dựa vào sự kết hợp của các sở thích về tiêu chuẩn đặt tên dữ liệu và các tệp mô hình bảng chú giải. Bạn có thể gọi các quy tắc của mô hình phân tích bằng cách chọn:

Từ Data Project Explorer:

  • Một gói trong một mô hình logic
  • Một cơ sở dữ liệu trong một mô hình vật lý, hoặc
  • Một lược đồ trong một mô hình vật lý

Từ Database Explorer:

  • Một cơ sở dữ liệu, hoặc
  • Một lược đồ

Hộp thoại của mô hình phân tích nhắc nhở bạn chọn các quy tắc để dựa vào, như trong Hình 5. Khi bạn chọn quy tắc tuân thủ tiêu chuẩn đặt tên, các mô hình bảng chú giải được bổ sung vào các đặc tính của dự án khi tiêu chuẩn đặt tên dự án hiển thị trên trang tiếp theo của trình hướng dẫn. Bạn có thể thêm hoặc bớt các mô hình chú giải vào lúc này và trang này sẽ được đồng bộ tự động với trang các đặc tính của tiêu chuẩn đặt tên cho dự án. Khi bạn nhấn Finish, IDA lặp lại tất cả các đối tượng đã bao gồm từ các lựa chọn của bạn và kiểm tra các tên của chúng để đảm bảo rằng chúng sử dụng các từ và các mẫu đã định nghĩa trong tiêu chuẩn đặt tên của bạn. Ví dụ, nếu mẫu đặt tên được định nghĩa là:

{PW} {MOD} {CW}

Và với employee, last và name là từ gốc, từ bổ nghĩa và từ phân loại đã định nghĩa trong mô hình bảng chú giải, thì một đối tượng EMPLOYEE LAST NAME là một tên hợp lệ.

Hình 5. Hộp thoại của mô hình phân tích nhắc nhở người dùng chọn các quy tắc để dựa vào
Hộp thoại của mô hình Phân tích

Nếu phát hiện ra bất kỳ sự vi phạm nào, chúng được hiển thị trong khung nhìn Problems (Vấn đề), như trong Hình 6.

Hình 6. Các vi phạm tiêu chuẩn đặt tên được hiển thị là các cảnh báo trong khung nhìn Problems
Khung nhìn Các vấn đề

Dưới đây là một số ví dụ có tiêu chuẩn đặt tên bị vi phạm.

  • Một tên không đầy đủ:

    Mẫu là: {mod}? {PW} {MOD}? {MOD}? {CW} {MOD}?

    Tên đối tượng là: CIVILIAN EMPLOYEE (MOD PW)

    Do mẫu này yêu cầu một từ phân loại và “CIVILIAN EMPLOYEE" không chứa một từ phân loại, nên có một cảnh báo với mô tả sau đây được hiển thị trong khung nhìn Problems:

    Thực thể CIVILIAN EMPLOYEE không tuân thủ các tiêu chuẩn đặt tên -- Thiếu {từ phân loại} bắt buộc ở cuối tên. Mẫu đặt tên dự kiến là tùy chọn {từ bổ nghĩa} {từ gốc} tùy chọn {từ bổ nghĩa} tùy chọn {từ bổ nghĩa} {từ phân loại} tùy chọn {từ bổ nghĩa}.

  • Một tên có từ không hợp lệ:

    Mẫu là: {MOD}? {PW} {MOD}? {MOD}? {CW} {MOD}?

    Tên đối tượng là: CIVILIAN EMPLOYEE ADDRESS (MOD PW từ không hợp lệd)

    Do mẫu này yêu cầu một từ phân loại và “ADDRESS" (Địa chỉ) không phải là một từ phân loại được định nghĩa trong mô hình bảng chú giải, nên có một cảnh báo với mô tả sau được hiển thị trong khung nhìn Problems:

    Thuộc tính CIVILIAN EMPLOYEE ADDRESS không tuân thủ các tiêu chuẩn đặt tên -- Một từ phân loại bắt buộc và ADDRESS không phải là một từ phân loại hợp lệ. Mẫu đặt tên dự kiến là tùy chọn {từ bổ nghĩa} {từ gốc} tùy chọn {từ bổ nghĩa} tùy chọn {từ bổ nghĩa} {từ phân loại} tùy chọn {từ bổ nghĩa}.

    Khi “ADDRESS" được thêm vào mô hình bảng chú giải làm một từ phân loại, sẽ không có cảnh báo nào hiển thị cho tên CIVILIAN EMPLOYEE ADDRESS.

  • Một tên có các chuỗi ký tự thêm vào:

    Mẫu: {MOD}? {PW} {MOD}? {MOD}? {CW} {MOD}?

    Tên đối tượng: CIVILIAN EMPL REQUESTED DESC TEXT FULL VERIFIED (MOD PW MOD MOD CW MOD MOD)

    Mẫu này cho phép một từ bổ nghĩa sau khi từ phân loại bắt buộc và tên có hai từ bổ nghĩa ở cuối. Vì vậy, có một cảnh báo với mô tả sau được hiển thị trong khung nhìn Problems:

    Thuộc tính CIVILIAN EMPL REQUESTED DESC TEXT LAST VERIFIED không tuân thủ các tiêu chuẩn đặt tên -- Một chuỗi ký tự thêm vào VERIFIED được tìm thấy ở cuối. Mẫu đặt tên dự kiến là tùy chọn {từ bổ nghĩa} {từ gốc} tùy chọn {từ bổ nghĩa} tùy chọn {từ bổ nghĩa}{từ phân loại} tùy chọn {từ bổ nghĩa}.


Đặt một tên đối tượng dữ liệu với trợ giúp nội dung

Đối với các tổ chức lớn, các mô hình bảng chú giải của họ có thể chứa ít nhất hàng ngàn mục. Khi đặt tên một đối tượng dữ liệu, để chọn các từ trong số hàng ngàn từ đúng là một thách thức. Trợ giúp việc đặt tên đã được bổ sung vào phiên bản 7.0 của IDA để giúp người dùng thực hiện nhiệm vụ này.

Xem mẫu đặt tên bằng cách sử dụng trợ giúp nội dung

Là một trong những phần quan trọng của một tiêu chuẩn đặt tên, các mẫu đặt tên được định nghĩa cho các đối tượng dữ liệu khác nhau. Điều này được thực hiện thông qua các sở thích về tiêu chuẩn đặt tên dữ liệu với IDA. Một dấu hiệu của trợ giúp nội dung hiển thị thông tin này khi bạn chỉnh sửa một đặc tính tên trong khung nhìn Properties. Ví dụ, khi bạn đặt tên một đối tượng bảng trong một mô hình vật lý, bạn có thể di chuột trên dấu hiệu trợ giúp nội dung và mẫu đặt tên được hiển thị, như trong Hình 7. Trong ví dụ này, dấu phân cách là một gạch dưới và các tên cần thực hiện theo trình tự sau đây:

  1. Một từ bổ nghĩa, tùy chọn;
  2. Một từ gốc, bắt buộc;
  3. Một từ bổ nghĩa, tùy chọn;
  4. Một từ bổ nghĩa, tùy chọn;
  5. Một từ phân loại, bắt buộc;
  6. Một từ bổ nghĩa, tùy chọn;
Hình 7. Dấu hiệu trợ giúp nội dung hiển thị mẫu đặt tên
Dấu hiệu trợ giúp nội dung

Dấu hiệu trợ giúp nội dung có sẵn cho các đối tượng dữ liệu để định nghĩa các tiêu chuẩn đặt tên cho chúng như là một sự kết hợp của các sở thích về tiêu chuẩn đặt tên dữ liệu và các tệp mô hình bảng chú giải.

Hiển thị các bảng chú giải trong danh sách thả xuống

Khi bạn biết mẫu để đặt tên một đối tượng, bạn cần chọn các từ trong mô hình bảng chú giải cho phù hợp với mô hình. Bạn có thể sử dụng tổ hợp phím Ctrl+Space hoặc kiểu dấu phân cách để xem một danh sách thả xuống với các từ, chữ viết tắt và các mô tả có sẵn, như trong Hình 8.

Hình 8. Trợ giúp nội dung hiển thị các từ và các đặc tính của chúng
Các từ và các đặc tính của chúng

Danh sách thả xuống được rút gọn khi người dùng gõ vào các chữ cái trong Hình 9.

Hình 9. Danh sách từ của trợ giúp nội dung được rút gọn khi người dùng gõ vào các chữ cái
Danh sách các từ của trợ giúp nội dung

Khi bạn chọn một từ trong danh sách đó, nó sẽ được thêm vào làm một phần của tên.


Chuyển đổi các đối tượng dữ liệu từ mô hình logic sang mô hình vật lý bằng cách sử dụng tiêu chuẩn đặt tên

Một mô hình dữ liệu logic định nghĩa các thực thể và các mối quan hệ giữa các thực thể mà không cần xem xét nền tảng thực hiện. Mặt khác, một mô hình dữ liệu vật lý là một mô hình cơ sở dữ liệu cụ thể biểu diễn các đối tượng dữ liệu quan hệ (ví dụ, các bảng, các cột, khóa chính và khóa ngoài và các mối quan hệ của chúng). Theo một kịch bản thiết kế phổ biến từ trên xuống, bạn thiết kế một mô hình logic, biến đổi nó thành một mô hình vật lý và sử dụng mô hình dữ liệu vật lý để tạo ra các câu lệnh ngôn ngữ định nghĩa dữ liệu (DDL), rồi được triển khai đến một máy chủ cơ sở dữ liệu. Vì hầu hết các cơ sở dữ liệu có các yêu cầu về các ký tự và chiều dài ký tự của các tên đối tượng cơ sở dữ liệu, nên người ta thường sử dụng các chữ viết tắt khi đặt tên các đối tượng dữ liệu trong mô hình vật lý. Ví dụ, một đối tượng EMPLOYEE SOCIAL-SECURITY-NUMBER (Số an sinh xã hội của nhân viên) trong mô hình dữ liệu logic được chuyển đổi thành EMPL_SSN trong mô hình vật lý, ở đây EMPL và SSN là chữ viết tắt của EMPLOYEE và SOCIAL-SECURITY-NUMBER được định nghĩa trong mô hình bảng chú giải.

Khi chuyển đổi một mô hình dữ liệu logic sang một mô hình dữ liệu vật lý bằng cách sử dụng IDA, các tên thực thể và thuộc tính được chuyển đổi thành các tên bảng và cột theo các quy tắc sau:

  • Dấu phân cách logic trong một tên đối tượng logic được thay thế bằng dấu phân cách vật lý trong tên đối tượng vật lý tương ứng của nó.
  • Nếu một thực thể có một đặc tính viết tắt đã định nghĩa, thì bảng tương ứng được đặt tên theo đặc tính viết tắt đó.
  • Nếu một thực thể không có một đặc tính viết tắt đã định nghĩa, các mô hình bảng chú giải đã quy định cho dự án được tìm kiếm theo các từ phù hợp và từ viết tắt của chúng được sử dụng trong tên bảng đã chuyển đổi. Nếu không tìm thấy các từ phù hợp nào, hoặc không quy định các mô hình chú giải nào cho dự án, thì sử dụng tên thực thể.
  • Các quy tắc đặt tên tương tự áp dụng cho việc chuyển đổi các thuộc tính lô-gic thành các cột vật lý, trừ một thuộc tính được xác nhận cho một đặc tính miền đã định nghĩa đầu tiên và cột tương ứng được đặt tên theo tên của đặc tính miền nếu được tìm thấy.

Ví dụ, một thuộc tính MESSAGE ORIGINATOR IDENTIFIER (Mã định danh của người tạo thông báo) trong một mô hình logic được chuyển đổi thành một cột MSG_ORITR_ID trong mô hình vật lý, ở đây, MSG, ORITR và ID là chữ viết tắt của MESSAGE, ORIGINATOR và IDENTIFIER được định nghĩa trong mô hình bảng chú giải và các khoảng trống được thay thế bằng cách các dấu gạch dưới.


Ví dụ về các tiêu chuẩn đặt tên thành phần của lực lượng bảo vệ bờ biển

Trong phần này, Các tiêu chuẩn đặt tên thành phần dữ liệu của Lực lượng bảo vệ bờ biển (Coast Guard) được lấy làm ví dụ để giải thích việc sử dụng IDA để định nghĩa và thi hành các tiêu chuẩn đặt tên. Coast Guard có một nhu cầu ngày càng tăng về chia sẻ dữ liệu qua các ranh giới tổ chức và chức năng. Một hệ thống đa chức năng là một hệ thống thông tin hỗ trợ quá trình tổ chức liên quan đến các hoạt động của một vài chương trình hoặc các đơn vị chức năng, chứ không phải là hoạt động của một chương trình đơn lẻ. Các tiêu chuẩn đặt tên thành phần dữ liệu của Coast Guard đã được phát triển và được thi hành để đáp ứng các nhu cầu trong quá trình phát triển của các hệ thống đa chức năng này.

Bảng chú giải

Các tiêu chuẩn đặt tên yêu cầu một danh sách từ phân loại chính thức được phát triển, được duy trì và được điều khiển chủ yếu bởi Người lãnh đạo. Do khối lượng các từ gốc cần thiết có khả năng lên đến hàng ngàn từ, nên họ yêu cầu phát triển một danh sách từ gốc sơ bộ như là một bảng từ vựng hạn chế để phối hợp và sử dụng trong toàn bộ tổ chức. Danh sách này có thể được phát triển từ việc xem lại hoặc sàng lọc các từ đang xuất hiện trong các tên của các thành phần dữ liệu đã định nghĩa trong các hệ thống dữ liệu hiện có. Các từ bổ nghĩa hay các từ hạn định mẫu được liệt kê trong Các tiêu chuẩn đặt tên thành phần dữ liệu của Coast Guard. Các từ này có thể được lưu trữ trong một mô hình bảng chú giải của IDA theo một số định dạng bằng cách sử dụng một trình soạn thảo văn bản và sau đó sao chép và dán vào. Hình 10 hiển thị bảng chú giải được tạo ra bằng cách sử dụng danh sách từ phân loại và các từ gốc và các từ bổ nghĩa mẫu của Các tiêu chuẩn đặt tên thành phần dữ liệu của Coast Guard.

Hình 10. Mô hình bảng chú giải của Coast Guard
Mô hình bảng chú giải của Coast Guard

Ngoài ra, IDA cũng hỗ trợ kiểm soát phiên bản và quản lý cấu hình. Khi sử dụng các công cụ So sánh bằng (Compare With), bạn có thể so sánh các mô hình chú giải và các phiên bản.

Các quy tắc cú pháp đặt tên

Các tiêu chuẩn đặt tên Coast Guard bao gồm các quy tắc cú pháp sau đây:

  • Mỗi tên thành phần dữ liệu sẽ có một từ phân loại được lấy từ một danh sách từ phân loại đã dựng sẵn. Các từ phân loại có thể được thêm vào danh sách đã tiêu chuẩn hóa theo sự phê duyệt của Sỹ quan chỉ huy.
  • Mỗi tên thành phần dữ liệu sẽ có một từ gốc được lấy từ một danh sách từ gốc đã dựng sẵn. Từ gốc phải được đặt vào vị trí là từ đầu tiên hoặc từ thứ hai trong tên phần tử dữ liệu. Các từ gốc có thể được thêm vào danh sách đã tiêu chuẩn hóa theo sự phê duyệt của Sỹ quan chỉ huy.
  • Mỗi tên thành phần dữ liệu sẽ chứa một số lượng thích hợp các từ bổ nghĩa và các từ hạn định để mô tả đầy đủ tên đó (nhiều nhất lên tới bốn từ bổ nghĩa cho mỗi từ gốc và một từ bổ nghĩa cộng với hai từ hạn định cho mỗi từ phân loại).
  • Thứ tự các từ trong một tên thành phần dữ liệu là: (1) từ bổ nghĩa nếu cần + từ gốc + (1 đến 4) từ bổ nghĩa nếu cần + từ phân loại + (1 hoặc 2) từ hạn định nếu cần. Từ gốc phải đặt trước từ phân loại trong một tên thành phần dữ liệu. Số lượng các từ tối thiểu trong một tên thành phần dữ liệu là hai từ (từ gốc + từ phân loại) và số lượng các từ tối đa là chín từ.

Những quy tắc này được giữ trong mục các sở thích về tiêu chuẩn đặt tên dữ liệu của IDA, như trong Hình Hình 11.

Hình 11. Các sở thích về tiêu chuẩn đặt tên của Coast Guard
Các tiêu chuẩn đặt tên của Coast Guard

Kiểm tra sự tuân thủ tiêu chuẩn đặt tên

Khi định nghĩa các tiêu chuẩn đặt tên, quy tắc tuân thủ tiêu chuẩn đặt tên có thể được viện dẫn cho bất kỳ các mô hình lô-gic hoặc mô hình vật lý nào như được mô tả trong phần Xác nhận hợp lệ tuân thủ tiêu chuẩn đặt tên. Các thông báo cảnh báo hiển thị các tên đối tượng dữ liệu không tuân thủ các tiêu chuẩn đặt tên; ví dụ, các tên sau:

  • Thiếu một từ phân loại.
  • Thiếu một từ gốc.
  • Không có một từ gốc trước một từ phân loại.
  • Có ít hơn hai từ.
  • Có nhiều hơn chín từ.

Quy tắc bắt buộc thi hành này được mô tả trong Các tiêu chuẩn đặt tên thành phần dữ liệu của Coast Guard.


Kết luận

Trong bài này, bạn đã học được cách IDA sẽ giúp bạn:

  1. Tạo một tiêu chuẩn đặt tên với các mô hình bảng chú giải và các sở thích đặt tên tiêu chuẩn.
  2. Tạo các tên đối tượng dữ liệu tuân thủ tiêu chuẩn đặt tên với trợ giúp nội dung đặt tên.
  3. Chuyển đổi các tên thực thể logic và thuộc tính thành các tên bảng và tên cột vật lý bằng cách sử dụng các từ viết tắt được định nghĩa trong các mô hình bảng chú giải.
  4. Thi hành các tiêu chuẩn đặt tên bằng cách sử dụng quy tắc tuân thủ tiêu chuẩn đặt tên.

Lời cảm ơn

Cảm ơn Robin Raddatz, người chịu trách nhiệm về thực hiện cập nhật cho bản phát hành 07.10.2010 của bài này.

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạn



Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management, Rational
ArticleID=792708
ArticleTitle=Sử dụng InfoSphere Data Architect để định nghĩa và thi hành các tiêu chuẩn đặt tên đối tượng dữ liệu
publish-date=10072010