Chuyển đến nôi dung chính

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng (tiếng Anh).

Khi bạn đăng ký với trang developerWorks lần đầu tiên, một tiểu sử của của bạn được tạo ra. Chọn các thông tin về tiểu sử của bạn (tên, nước/vùng, và nơi làm việc) đã được hiện lên màn hình, thông tin này sẽ được hiện kèm với nội dung mà bạn đăng tải. Bạn có thể cập nhật thông tin này bất kỳ lúc nào.

Thông tin gửi đi được đảm bảo an toàn.

  • Đóng [x]

Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng (tiếng Anh).

Thông tin gửi đi được đảm bảo an toàn.

  • Đóng [x]

Tìm kiếm văn bản của DB2, Phần 1: Tìm kiếm toàn văn bản

Prashant Shettar, Kỹ sư phần mềm, IBM
Prashant Shettar là một kỹ sư phần mềm Các hệ thống trong tập đoàn Quản lý Thông tin của IBM (một bộ phận của Tập đoàn phần mềm IBM) tại Bangalore, Ấn Độ.
Marion Behnen, Nhà phát triển tìm kiếm văn bản của DB2, IBM
Marion Behnen là một kỹ sư phần mềm cao cấp trong Tập đoàn phần mềm IBM và là một nhà lãnh đạo kỹ thuật về tìm kiếm toàn văn bản trong DB2. Bà đã có hơn 20 năm kinh nghiệm trong việc phát triển ứng dụng cơ sở dữ liệu, báo cáo kinh doanh, lưu trữ dữ liệu và tích hợp quá trình kinh doanh. Trước khi gia nhập IBM, bà đã dành tâm trí cho nhiều khía cạnh của quá trình kinh doanh và tích hợp dữ liệu, đặc biệt là với ngành công nghiệp sản xuất.
Shantanu Mundkur, Nhà phát triển tìm kiếm văn bản của DB2, IBM
Shantanu Mundkur là một kỹ sư phần mềm tư vấn tại Phòng thí nghiệm Thung lũng Silicon của IBM. Ông thuộc nhóm phát triển DB2 cho Linux, UNIX và Windows của IBM và làm việc trong trong lĩnh vực tìm kiếm toàn văn bản. Ông có rất nhiều kinh nghiệm phát triển sản phẩm phần mềm và đã thiết kế và thực hiện các tính năng cho nhiều máy chủ cơ sở dữ liệu khác nhau gồm cả DB2 và Informix.

Tóm tắt:  Tìm kiếm văn bản của DB2 (DB2 Text Search) cho phép một người dùng cơ sở dữ liệu IBM DB2 cho Linux, UNIX và Windows tạo ra các ứng dụng có các khả năng tìm kiếm toàn văn bản bằng cách nhúng các mệnh đề tìm kiếm toàn văn bản vào các câu lệnh SQL và XQuery. Trong hướng dẫn này, bạn sẽ thiết lập một cơ sở dữ liệu để hỗ trợ tìm kiếm văn bản và đi qua một kịch bản để nhận được một số kinh nghiệm về thiết lập các tìm kiếm văn bản riêng của mình.

Lưu ý: Hướng dẫn này đã được cập nhật với các ví dụ và các lệnh mã có sẵn tốt hơn để giúp cho người dùng không quen với DB2 tránh khỏi các vấn đề ngẫu nhiên.

Xem thêm bài trong loạt bài này

Ngày:  15 04 2010 (Ngày đăng: 03 08 2012)
Mức độ:  Nhập môn

Hoạt động:  2645 lần đọc

Trước khi bạn bắt đầu

Hãy tìm hiểu những điều cần mong đợi từ hướng dẫn này và cách nhận được nhiều kiến thức nhất trong bài này.

Về hướng dẫn này

Tìm kiếm văn bản của DB2 là một thành phần tích hợp của DB2 9.5 và do máy chủ IBM OmniFind™ Text Search (Tìm kiếm văn bản OmniFind của IBM) cung cấp. Nó cung cấp các tính năng sau đây:


  • Tìm kiếm toàn văn bản trong các tài liệu văn bản, HTML và XML, gồm cả tìm kiếm theo logic Bun (Boolean) và ký tự đại diện.
  • Hỗ trợ SQL, SQL/XML và Xquery tích hợp đầy đủ, gồm cả tập con cú pháp XPath để tìm kiếm các tài liệu XML.
  • Xử lý ngôn ngữ với định nghĩa các từ đồng nghĩa tùy chọn.
  • Cập nhật chỉ mục không đồng bộ với tùy chọn lập lịch biểu.

Hướng dẫn này trình bày cách sử dụng các tính năng cơ bản trong Tìm kiếm văn bản của DB2 để tìm kiếm trong các tài liệu văn bản thuần và các tài liệu XML được lưu trữ trong cơ sở dữ liệu và hướng dẫn bạn qua các nhiệm vụ sau đây:

  • Chuẩn bị thiết lập cơ sở dữ liệu.
  • Tạo các chỉ mục tìm kiếm-văn bản cho các tài liệu dữ liệu văn bản và các tài liệu XML.
  • Điền các chỉ mục tìm kiếm-văn bản.
  • Tìm kiếm trong văn bản thuần.
  • Xác định mối liên quan trong các kết quả.
  • Tìm kiếm trong các tài liệu XML.
  • Cập nhật các chỉ mục tìm kiếm-văn bản.
  • Kết thúc công việc.

Các yêu cầu và các điều kiện tiên quyết về hệ thống

Để hoàn thành các bước sau, ít nhất là bạn phải có bản vá lỗi 1 (Fix Pack 1), phiên bản DB2 9.5 cho Linux, UNIX và Windows đã cài đặt trên hệ thống. Lưu ý rằng bạn không thể sử dụng Tìm kiếm văn bản của DB2 trong một môi trường cơ sở dữ liệu phân vùng trên một cá thể DB2 có nhiều phân vùng.

Để đi qua hết hướng dẫn này khi sử dụng cách tiếp cận theo từng bước một, có thể thực hiện các lệnh như các lệnh tương tác CLP (Bộ xử lý dòng lệnh) của DB2 khi sử dụng lệnh db2 -t. Các lệnh quản trị chỉ mục tìm kiếm văn bản db2ts phải được chạy tại dấu nhắc của hệ điều hành. Tuy nhiên, các lệnh này có thể được thực hiện trong cùng một cửa sổ bằng cách sử dụng lệnh shell (!). Trong chế độ này, mọi câu lệnh cũng sẽ phải sử dụng ký tự kết thúc câu lệnh — là một dấu chấm phẩy (;).

Để chạy các ví dụ trong bài này, hãy chắc chắn rằng bạn có quyền hạn DBADM trên máy chủ cơ sở dữ liệu DB2 mà bạn muốn sử dụng. Nếu bạn tạo ra cơ sở dữ liệu như được mô tả trong phần tiếp theo, quyền hạn này được gán tự động. Quyền hạn DBADM là cần thiết để quản lý các dịch vụ cá thể tìm kiếm-văn bản và để tạo và sửa đổi cơ sở dữ liệu được sử dụng trong các ví dụ.

1 của 10 | Trang sau

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management
ArticleID=828776
TutorialTitle=Tìm kiếm văn bản của DB2, Phần 1: Tìm kiếm toàn văn bản
publish-date=04152010
author1-email=pshettar@in.ibm.com
author1-email-cc=
author2-email=mbehnen@us.ibm.com
author2-email-cc=
author3-email=mundkur@us.ibm.com
author3-email-cc=