Cloud Pak for Data Systemと watsonx.dataの統合
Netezza Performance Server for Cloud Pak for Data as a Service と watsonx.data を使用すると、データ レイク メタストア サーバーである Hive Metastore (HMS) に接続し、データ レイク S3 オブジェクト ストアにある Apache Iceberg テーブルからクエリを実行できます。
概要
Cloud Pak for Data System は IBM watsonx.data と統合し、機能を拡張してレイクハウスとなった。 ハイブリッド・クラウド体験を構築するために、オンプレミス組織は IBM Storage Fusion HCIシステム上の IBM watsonx.data をダウンロードすることができる。 この統合により Cloud Pak for Data System は、SF HCI システム上の S3 と互換性のある、手頃な価格のオブジェクト・ストレージに保存された Apache Iceberg テーブルを読み書きできる。 また、Icebergテーブルとネイティブ・テーブルを組み合わせることもできる。 Netezza Performance Server を組み合わせることもできる。 オンプレミスであれクラウドであれ、異なるインスタンス間でのデータアクセスと共有は、共有メタデータ、共有ストレージ、オープンテーブルIcebergデータフォーマットによって容易になります。 Netezza Performance Server メタデータ、ストレージ、オープンなテーブルIcebergデータフォーマットを共有することで、異なるインスタンス間でのデータアクセスと共有が容易になります。 watsonx.data は、AIワークロードの展開、低コストのETL、組織の統一されたガバナンスを促進する。 さらに、より安全で、仕事に適したエンジンを提供する。
一般情報
parquetファイルフォーマットで Apache Iceberg テーブルを使用する。- SELECT、 CREATE、 INSERT、 CREATE TABLE、 CTAS、 DROP、 DELETE、 TRUNCATE、 CREATE VIEW、 スナップショット/タイムトラベルがサポートされています。
- Icebergテーブルが変更され、Icebergスキーマ・エボリューションを受けた場合、読み取ることはできない。
- LZ4 データ圧縮形式をサポート。
- NETEZZA_SCHEMAは、データレイクデータベースに接続する際のデフォルトスキーマです。 これはテーブル、外部テーブル、シーケンスなどの Netezza オブジェクトを含む通常のスキーマである。 NETEZZA_SCHEMA、 DEFINITON_SCHEMA、 INFORMATION_SCHEMAのスキーマ名はすべて予約されており、メタストア内のこれらの名前のスキーマは NPSaaS ユーザーには公開されません。
- 以下のデータ型はサポートされていません:
timestamptzuuidstructlistmap
SPUを外部化して直接アクセスするには、スイッチの構成についてサポートに問い合わせてから、「 SPU IPアドレスの外部化 」に記載されている手順を実行します。