資料倉儲環境的最佳作法

本節中說明的最佳作法文件提供實務準則及技術,可協助您在資料倉儲環境中有效率地使用 Db2® 軟體。

資料倉儲環境是資料管理系統,一般來說,其設計目的是要將在大型資料儲存庫上進行的資料分析查詢效能最佳化。 IBM® Smart Analytics System 環境包含 IBM Db2 Warehouse 軟體、 Db2 資料庫軟體及 IBM Cognos ® 軟體,代表適用於資料倉儲環境之軟硬體的最佳作法配置。 雖然本節中所提及的最佳作法文件中所記載的許多實務範例已使用 IBM Smart Analytics System 軟體進行廣泛測試,但它們也適用於其他產品配置。

IBM Smart Analytics System 環境的 AIX 作業系統層次備份及回復

使用 IBM Smart Analytics System 環境的 AIX 作業系統層次備份及回復 文件,以瞭解針對以 AIX® 作業系統及 POWER ® 處理器為基礎之 IBM Smart Analytics System 解決方案的作業系統及配置,開發備份及回復策略的最佳作法。 本文件著重在從 IBM Smart Analytics System 元件的備份檔回復替代裝置的配置及替代伺服器的已配置作業系統。 備份及回復策略的目標是在您更換伺服器或裝置後,能儘快回復正常的作業行為。

您可以從 IBM developerWorks ® Hybrid Data Management 社群網站下載這份最佳作法文件: AIX IBM Smart Analytics System

使用 IBM InfoSphere Optim High Performance Unload 建置資料移轉策略

IBM Optim High Performance Unload for Db2 4.02 版是一種高速工具,用於在 Db2 資料庫中卸載、擷取及移轉資料。 High Performance Unload (HPU) 依設計可從 Db2 表格空間儲存器擷取及移轉資料。 採用 HPU 的資料移轉策略將可盡可能減少儲存需求,並將許多手動作業自動化。

HPU 可使用具名管道及平行 LOAD 作業將資料從來源串流處理至目標資料庫,而無需將資料暫置於磁碟上。 您可以指示 HPU 判斷在資料移轉期間哪些位置使用了不同的分割對映表、軟體層次與索引鍵限制,並自動處理這些事件。

HPU 也可直接從目標資料庫卸載資料的子集,而無需存取 Db2 軟體層。 透過這項功能,您能夠將資料從較大的正式作業系統移轉至較小的前置生產或開發環境。

您可以從 IBM Hybrid Data Management 社群網站下載 使用 IBM InfoSphere Optim High Performance Unload 最佳作法文件建置資料移轉策略: 使用 IBM InfoSphere Optim High Performance Unload建置資料移轉策略。

建置 IBM Smart Analytics System 資料倉儲的回復策略

識別及規劃最可能發生的回復實務範例,是判定資料遺失或毀損的回復速度的重要因素。 建置 IBM Smart Analytics System 資料倉儲的回復策略中的建議使用最佳作法文件,可協助您開發符合資料倉儲備份及回復需求的策略。 本文件著重於 IBM Smart Analytics System 環境中具有以 System x ® 及 Power Systems 伺服器為基礎之配置的 IBM Db2 軟體。

本文以涉及規劃、配置、設計、實作或管理以 Db2 軟體為基礎的資料倉儲的人員為目標。 尤其,本文件著重於 IBM Smart Analytics System 環境,且其配置是以 System x ® 及 Power Systems 伺服器為基礎。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 建置 IBM Smart Analytics System 資料倉儲的回復策略

將 IBM Banking Data Warehouse 部署至 IBM Db2 10.5(含 BLU Acceleration)

實作產業模型可在企業開發及實作商業智慧應用程式時,加速推動各種產業領域的專案並減少風險。 IBM Industry Models 解決方案的涵蓋面遍及多種產業,包括銀行業、醫療保健業、零售業與電信業。 IBM Industry Models 解決方案針對產業領域提供大量且可延伸的資料模型。 使用 IBM 所提供的邏輯資料模型來建置針對報告需求所自訂的實體模型,然後部署及移入最佳作法 IBM Db2 10.5(含 BLU Acceleration)資料庫。 本文介紹邏輯資料模型概念,然後聚焦於將非供應商特有邏輯資料模型轉換為最佳作法正式作業 IBM Db2 10.5(含 BLU Acceleration)綱目時所必須執行的作業。 特別的是,本文使用與 Involved Party 及 Social Media 實體相關的 IBM Industry Models Banking Data Warehouse 模型。 它會引導您完成建議程序,以將理論性倉儲的邏輯資料模型轉換為可供實際作業環境使用的實體資料庫設計。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 將 IBM Banking Data Warehouse 部署至 IBM Db2 10.5 with BLU Acceleration

將 IBM Banking Data Warehouse 部署至 IBM InfoSphere BigInsights

IBM 產業模型解決方案是一組綜合性的產業特定預先設計模型,可構成商業及軟體解決方案的基礎,並針對特定產業中的商業挑戰進行最佳化。 網域區域包括資料倉儲、商業智慧、商業流程管理、服務導向架構、商業術語,以及商業名詞解釋範本。 IBM Industry Models 解決方案的涵蓋面遍及多種產業,包括銀行業、醫療保健業、零售業與電信業。 IBM Industry Models 解決方案針對產業領域提供大量且可延伸的資料模型。 使用 IBM 所提供的邏輯資料模型來建置針對報告需求所自訂的實體資料模型,然後部署及移入 IBM InfoSphere® BigInsights™ 環境。 本文顯示如何將 IBM Banking Data Warehouse (BDW) 解決方案部署至 BigInsights。 本文介紹邏輯資料模型概念,然後聚焦於將非供應商特有邏輯資料模型轉換為正式作業 BigInsights BigSQL 綱目時所必須執行的作業。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 將 IBM Banking Data Warehouse 部署至 IBM InfoSphere BigInsights

擴充 IBM Smart Analytics System 資料庫並重新配送資料

本文件建議的最佳作法,指出如何在硬體建置、 安裝及叢集擴增後擴增資料庫並重新配送。 擴充 IBM Smart Analytics System文件中討論了硬體擴充及規劃將硬體新增至 IBM Smart Analytics System 的可用選項。

您可以從 IBM 混合式 Data Management 社群網站下載這份最佳作法文件: 展開 IBM Smart Analytics System 資料庫並重新配送資料

擴充 IBM Smart Analytics System 環境

資料倉儲環境不斷遭遇到資料成長劇增的問題。 因此,您可能需要增加容量來處理增加的企業需求。 為了協助您滿足這些需求, IBM Smart Analytics System 軟體是一種彈性的資料倉儲解決方案,可支援擴充的建置區塊方法。

擴充 IBM Smart Analytics System 最佳作法文件說明如何識別、規劃及準備擴充系統,並說明擴充專案中涉及的里程碑及選項。 本文件提供有關下列建議的詳細資料:
  • 使用好的產能規劃作法,可協助提早偵測資源使用的趨勢。 您可以建立及記載每一個工作量的效能基準線,並預測接下來 12 個月的基準線。 讓您的服務等級目標與產能規劃指示器相符,以便可以輕鬆地比較度量。
  • 當儲存體容量到達 60% 並且預測會在 12 個月內到達 80% 時,開始規劃儲存體擴增。
  • 您可以新增一個資料模組來擴增儲存體容量,並減少每個資料庫分割區的資料磁區。 此外,您也可以新增一個使用者模組來增加系統的容量,以容納使用者。 在新增模組時,請記住多重產生環境可能需要多個高可用性群組。 請確定您有將失效接手及失效回復測試納入您的擴增計劃中。

您可以從 IBM 混合式 Data Management 社群網站下載這份最佳作法文件: 擴充 IBM Smart Analytics System

IBM Smart Analytics System 環境之資料庫管理的常見問題

關於 IBM Smart Analytics System 環境之資料庫管理的常見問題 最佳作法文件會回答一些關於 IBM Smart Analytics System 資料倉儲資料庫之資料庫管理的常見問題。 常見問題被分組成下列幾個種類:
  • 資料庫實作及設計
  • 資料庫管理及維護
  • 進階統計資料維護
  • 疑難排解及解決

您可以從 IBM 混合式 Data Management 社群網站下載這份最佳作法文件: IBM Smart Analytics System 環境之資料庫管理的常見問題

關於 IBM Smart Analytics System 系統維護的常見問題

使用 IBM Smart Analytics System 最佳作法文件中有關系統維護的常見問題,以取得有關 IBM Smart Analytics System 環境及 InfoSphere® Balanced Warehouse® 環境中系統維護的部分常見問題的回答。 您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: IBM Smart Analytics System系統維護的常見問題。

在資料倉儲中實作 Db2 工作量管理

使用暫置方法, 在資料倉儲中實作 Db2 工作量管理 最佳作法文件會引導您完成在 IBM Db2 軟體上實作最佳作法工作量管理配置的步驟。 這些步驟會建立足夠的控制項,協助確保大部分資料倉儲環境的可預期穩定系統。 此起始配置是預期能成為一個良好的基礎,讓您可以據以執行其他調整及配置變更,以達成特定的工作量管理目標。

此最佳作法文件呈現一組定義,代表 Db2 資料庫中工作量管理配置的不同成熟階段。 這些暫置的範圍是從基本暫置 0 配置到進階暫置 3 配置。 會提供特定配置範本及程序,讓您可以從暫置 0 配置進行至暫置 2 配置。 也提供共用暫置 3 實務範例的一般說明及建議。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 在資料倉儲中實作 Db2 工作量管理

將資料汲取至 IBM Smart Analytics System

吸收應用程式設計的重要設計目標,是平衡具有處理資源可用性的必要吸收率、吸收資料而不影響資料可用性,以及維護所吸收資料量中的彈性。 識別吸收至資料倉儲的資料速度及資料量的服務等級目標,有助於判定資料吸收應用程式的架構、設計及開發。

將資料汲取至 IBM Smart Analytics System 最佳作法文件的目標對象是參與設計及開發以 Db2 資料庫軟體為基礎之資料汲取應用程式的人員。 具體而言,焦點是將資料吸收至 IBM Smart Analytics System 環境,且其配置是以 System x 及 Power Systems 伺服器為基礎。 您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 將資料汲取至 IBM Smart Analytics System

管理資料成長

由於資料保留及管理規範的商業需求,企業需要管理越來越大的資料庫, 其大小從數百 GB 到多個 TB,甚至 PB。 當資料繼續以指數速率成長時, 這些組識中的 DBA 及 IT 專家會在設計及操作這類大型資料庫時面臨使人氣餒的挑戰。 資料必須妥善地編排,才能有效地處理資料成長,並符合服務需求。 本文件使用 IBM Db2 軟體中的豐富特性集來傳達管理資料成長的最佳作法。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 管理資料成長

使用 IBM InfoSphere Optim Performance Manager 管理資料倉儲效能

本文件以在以 Db2 V9.7 (Db2 9.7) 軟體為基礎的資料倉儲環境中實作 IBM InfoSphere Optim™ Performance Manager (OPM) 5.1 的人員為目標。 具體而言,本文件著重於 IBM Smart Analytics System 環境,且其配置是以 System x 及 Power ® Systems 伺服器為基礎。

在倉儲環境中實作 OPM 的目標,是要識別哪些資料庫作業與應用程式工作量在個別資料庫分割區與整個資料庫中耗用較多資源。 識別適當的指示器與工作量以監視您的環境,是您根據服務水準目標來測量資料庫工作量的效能時所必須執行的關鍵步驟。

在正式作業環境中實作 OPM 時,務必要根據服務水準目標的設定配置 OPM,僅就您需要監視的資料進行收集。 在需要更詳細的度量時(例如使用新的應用程式或對查詢進行疑難排解時),您可在定義的期間內收集這些項目。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 使用 IBM InfoSphere Optim Performance Manager來管理資料倉儲效能。

多重溫度資料管理

對最熱門資料使用較快速且成本較高的儲存裝置,對最冷門資料使用較緩慢且成本較低的儲存裝置,可將最要緊的查詢的效能最佳化,同時協助減少整體成本。 本文呈現管理多重溫度資料倉儲的策略,而管理方法是根據資料的溫度,將資料儲存在不同類型的儲存裝置上。 它會提供下列每一項作業的準則及建議:
  • 將資料識別及特性化為溫度層級。
  • 設計資料庫,以容納多個資料溫度。
  • 將資料從某個溫度層級移至另一個溫度層級。
  • 使用 Db2 工作量管理程式配置給最熱門資料要求的資源,會多於最冷門資料要求
  • 規劃資料倉儲包括多個資料溫度層級時的備份及回復策略
本文內容會根據 Db2 10.1 版或更新版本來套用至資料倉儲。

使用多重溫度資料管理文件,可瞭解管理多重溫度資料倉儲的策略,而管理方法是根據資料的溫度,將資料儲存在不同類型的儲存裝置上。 您可以從 IBM 混合式 Data Management 社群網站下載這份最佳作法文件: 多重溫度資料管理

使用 Db2 10.5(含 BLU Acceleration)最佳化分析工作量

BLU Acceleration 是 Db2 10.5 版中所引進的分析查詢的新技術集合。 BLU Acceleration 的核心可更快速地回答更多問題,以及以更低的成本來分析更多資料。 Db2(含 BLU Acceleration)提供效能、節省儲存體及時間價值的數量級優點。

本文概述這些技術、軟硬體選擇建議、BLU Acceleration 最佳工作量識別準則,以及產能規劃、記憶體和 I/O 的相關資訊。

系統配置上的某個區段會顯示 IBM 聚焦於簡化的方式可讓您設定 Db2,以自動進行分析工作量的最佳配置選項。 其他區段會說明如何實作以及搭配使用 Db2 與 BLU Acceleration。 與顯示多個選項的其他最佳作法不同,本文著重於 BLU Acceleration 的運作方式及其執行作業。 這將真正提供 BLU Acceleration 所內建的簡化,並顯示如何實際提供「分析極佳,超級簡單」。

您可以從 IBM Hybrid Data Management 社群網站下載 使用 Db2 10.5 搭配 BLU Acceleration 最佳作法文件: 使用 Db2 10.5 搭配 BLU Acceleration來最佳化分析工作量。

資料倉儲中的效能監視

監視資料倉儲系統十分重要,可協助確保它以最佳方式執行。 本文說明最重要的 Db2 軟體及作業系統度量,用於監視 IBM Smart Analytics System、IBM PureData™ System for Operational Analytics 或具有類似架構之系統的效能。 本文也會呈現一般方法,以協助尋找效能問題的原因。 此方式是從使用作業系統度量開始,並展開至 Db2 度量,而 Db2 度量會解釋作業系統層次的行為,並協助識別效能問題原因。 此方式是透過一般效能問題相關資訊進行說明。

您可以從 IBM Hybrid Data Management 社群網站下載此文件: 資料倉儲中的效能監視

資料倉儲環境的實體資料庫設計

本文件會提供最佳作法建議,讓您在設計實體資料模型以支援一般全天候資料倉儲環境中存在的競用工作量時,能夠加以採用。 此外也會提供使用了完整邏輯與實體資料模型的範例實務。 您可以下載含有 DDL 陳述式的 Script 檔,以建立範例實務的實體資料庫模型。

本報告以在 Db2 或 IBM InfoSphere Warehouse 9.7 版環境中參與設計及開發資料倉儲實體資料模型的經驗豐富使用者為目標。

您可以從 IBM 混合式 Data Management 社群網站下載 資料倉儲環境的實體資料庫設計 最佳作法文件: 資料倉儲環境的實體資料庫設計

資料倉儲中的查詢最佳化

在大型資料倉儲系統中,最重要的是最佳化查詢工作量,以最大化系統使用率,以及最小化處理時間。 資料倉儲中的查詢最佳化最佳實務文章說明用於最佳化資料倉儲查詢工作量的技術。 本文包含 IBM Smart Analytics Systems 實務範例,其中 Db2 軟體會管理叢集中的多個資料庫分割區。 這些實務範例說明有助於在短時間內增進效能的最佳化方法。 本文章中的準則可能不適用於交易式應用程式。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 資料倉儲中的查詢最佳化

使用深層壓縮的儲存體最佳化

本文傳達搭配使用 Db2 Storage Optimization Feature 與 Db2 產品的最佳作法。 您可以使用 Db2 儲存體最佳化特性,對各種類型的持續儲存資料及暫用資料套用壓縮。

您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 具有深度壓縮的儲存體最佳化

使用 Db2 V10 的時間資料管理

IBM Db2 第 10 版產品中的時間特性提供時間型資料管理的豐富功能。 例如,您可以選擇對資料庫表格記錄完整的資料變更歷程,以便可以「按時返回」及查詢任何過去的資料狀態。 您也可以指定一對的日期或時間戳記至橫列來指出何時的資訊實際上是有效的,以指出資料的商業有效性。 使用新的及標準化的 SQL 語法,您可以容易地插入、更新、刪除及查詢過去、現在或未來的資料。

您可以從 IBM Hybrid Data Management 社群網站下載此最佳作法文件: 使用 Db2 V10

將 IBM Industry Models 轉換為生產資料倉儲

實作產業模型可減少針對資料倉儲與商業智慧建立最佳化資料庫設計所需的人力與時間,進而加速推動各種產業領域的專案。

IBM Industry Models 的涵蓋面遍及多種產業,包括銀行業、醫療保健業、零售業與電信業。 本文選擇的範例來自有關於 Solvency II (SII) 法規的 IBM Insurance Information Warehouse 模型。

有許多最重要的分割資料庫設計決策,都取決於報告與分析應用程式所產生的查詢。 本文件會解說如何將報告需求轉換為資料庫設計決策。 本文件會引導您完成下列建議程序,以將理論性倉儲的邏輯資料模型轉換為可供實際作業環境使用的實體資料庫設計。

您可以從 IBM Hybrid Data Management 社群網站下載 將 IBM Industry Models 轉換成正式作業資料倉儲 最佳作法文件: 將 IBM Industry Models 轉換成正式作業資料倉儲

調整及監視資料庫系統效能

大部分 Db2 系統都經歷某種 效能發展。 您必須先配置系統的軟硬體。 在許多方面,配置可設定階段以定義系統在運作時的行為方式。 接著,在部署系統之後,監視系統效能來偵測任何可能發生的問題是非常重要的。 如果發生這類問題,則會進入下一個階段:疑難排解。 每一個現行階段都會視前一個階段而定,如果在前一個階段中沒有妥善準備,則非常可能會在現行階段中發生難以解決的問題。

使用 調整及監視資料庫系統效能 文件,以瞭解 Db2 資料伺服器效能發展的最佳作法。 主題的範圍是從起始軟硬體配置的重要原則,到能夠協助您瞭解作業及疑難排解狀況下的系統效能的監視技術。 本文件提供有系統的逐步方法來疑難排解效能問題。 您可以從 IBM Hybrid Data Management 社群網站下載這份最佳作法文件: 調整及監視資料庫系統效能

在 IBM Smart Analytics System 中使用 IBM InfoSphere Optim High Performance Unload 作為回復策略的一部分

IBM InfoSphere Optim High Performance Unload (HPU) for Db2 V4.2 軟體是一種高速工具,用於在 Db2 資料庫中卸載、擷取及重新分割資料。 HPU 會直接從完整、增量及差異備份映像檔或表格空間儲存器讀取,而非透過 Db2 軟體層,快速卸載大量資料。

使用 IBM InfoSphere Optim High Performance Unload 作為 IBM Smart Analytics System 文件中回復策略的一部分,說明如何將 HPU 納入回復策略,以及何時使用 HPU 來符合回復目標。 此外,本文章還會對照輸出檔及具名管道的使用、涵蓋簡介平行化、說明 HPU 指令及控制檔,以及提供用於建立控制檔的最佳實務。 最後,本文詳述如何在 IBM Smart Analytics System 環境中安裝及配置 HPU。 您可以從 IBM Hybrid Data Management 社群網站下載此最佳作法文件: 在 IBM Smart Analytics System中使用 IBM InfoSphere Optim High Performance Unload 作為回復策略的一部分。