Khai phá dữ liệu dưới dạng văn bản tài liệu

From the developerWorks archives

Martin Brown

Xuất bản lần đầu tiên vào ngày: 31 07 2013

Phân tích dự đoán, kinh doanh thông minh, và khai phá dữ liệu nói chung tất cả các nhu cầu lưu trữ và xử lý các cấu trúc dữ liệu phức tạp và thường rất khác nhau như thông tin được xử lý, phân tích, và tổng kết. Nó rất được coi trọng, đặc biệt là trong thông tin tài chính doanh nghiệp, mà đa số các dữ liệu xuất phát từ cơ sở dữ liệu quan hệ. Theo đó là một cấu trúc chặt chẽ và yêu cầu một phần lớn của việc chuẩn bị trước về mặt thiết kế lược đồ của bạn và các mô hình dữ liệu. Các thế hệ mới của NoSQL và cơ sở dữ liệu dựa trên văn bản (document-based databases) làm cho quá trình này đơn giản hơn bởi vì bạn có thể tạo và kết xuất thông tin theo một định dạng linh hoạt. Ngoài ra, bạn có thể làm việc dựa trên các phương pháp để trích xuất dữ liệu theo các định dạng cố định mà bạn cần. Trong bài viết này, tôi tìm hiểu làm thế nào để sử dụng cơ sở dữ liệu dựa trên văn bản cho việc phân tích và xử lý dữ liệu như là một phần của giải pháp tổng quan về cơ sở dữ liệu của bạn.

This content is no longer being updated or maintained. The full article is provided "as is" in a PDF file. Given the rapid evolution of technology, some steps and illustrations may have changed.



static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Rational
ArticleID=939476
ArticleTitle=Khai phá dữ liệu dưới dạng văn bản tài liệu
publish-date=07312013