Xây dựng một kho dữ liệu với Hive

Xây dựng kho dữ liệu dựa vào ngân sách

From the developerWorks archives

Peter Jamack

Xuất bản lần đầu tiên vào ngày: 31 07 2013

Kho dữ liệu đã thực sự là một trận chiến đang diễn ra giữa các tổ chức trong nhiều năm. Làm thế nào để bạn xây dựng nó? Những dữ liệu của bạn có thể tích hợp không? Bạn có nên sử dụng Kimball hoặc Inmon, nhà máy doanh nghiệp thông tin (CIF), hoặc siêu thị dữ liệu? Danh sách có thể kéo dài thêm theo ngày, thậm chí nhiều thập kỷ. Với dữ liệu lớn, các câu hỏi trở thành phức tạp hơn, chẳng hạn như là một kho dữ liệu đã đủ hay chưa? Câu trả lời nằm ở các doanh nghiệp. Người ta cho rằng Hive là kho dữ liệu Hadoop. Dù trên một mức độ nào đó là đúng, đôi khi nó cũng là một cái gì đó của một nhận định sai. Tuy nhiên, đôi khi bạn phải sử dụng các công cụ có sẵn, và vì thế, Hive có thể được coi là một kho dữ liệu.

This content is no longer being updated or maintained. The full article is provided "as is" in a PDF file. Given the rapid evolution of technology, some steps and illustrations may have changed.



static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management
ArticleID=939430
ArticleTitle=Xây dựng một kho dữ liệu với Hive
publish-date=07312013