Data Virtualizationにおける統計収集の限界
データ・ソースは、ローカル統計収集のサポートが異なり、さまざまな列統計をサポートします。 また、統計を収集するためのさまざまな方法もサポートしています。
- remote-catalog
- このタイプの統計収集は、ローカル方式の統計収集がサポートされる、リモート・データ・ソース内の仮想化テーブルでのみサポートされます。リモート・データ・ソースのカタログ・テーブルに格納されている統計が取得され、Data Virtualization統計カタログに格納されます。リモート・データ・ソースで正確な統計を使用できるようにすることが重要です。 remote-catalog タイプの統計収集は、グループ化されたテーブルではサポートされません。
以下の表は、ローカル統計収集をサポートするデータ・ソースを示し、使用可能な列統計を示しています。
| データ・ソース | 基本統計が使用可能 | サポート remote-catalog
|
サポート remote-query
|
|---|---|---|---|
| Amazon Redshift | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
| Amazon S3 | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
| Ceph® | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
| Apache Impala | CARD, COLCARD, NUMNULLS. 最新バージョンの Impala (1.4 以降) では、NUMNULLS は収集されません。 | ✓ | ✓ |
| Databases for PostgreSQL | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
| Db2 | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
| Db2 Big SQL | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
| Db2 for z/OS | CARD, COLCARD, HIGH2KEY, LOW2KEY | ✓ | ✓ |
| Db2 on Cloud | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
| 汎用 S3 | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
| Greenplum | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
| Hive | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ (推奨されません)
|
✓ |
| IBM Cloud Object Storage | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
| Informix | CARD, COLCARD | ✓ | ✓ |
| MariaDB | CARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
| Microsoft SQL Server | CARD, COLCARD | ✓ | ✓ |
| MySQL | CARD, COLCARD | ✓ | ✓ |
| Netezza Performance Server | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
| Oracle | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
| SAP ASE | CARD | ✓ | ✓ |
| SAP HANA | CARD, COLCARD | ✓ | ✓ |
| Snowflake | CARD | ✓ | ✓ |
| Teradata | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
Amazon Redshift
- 統計の収集
- ローカル表の統計を収集するには、 Amazon Redshift 製品資料の説明に従って ANALYZE コマンドを使用します。
- 制限
- Amazon Redshiftでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 また、列データの長さが 1020 バイトを超える場合、 ANALYZE コマンドは CHAR および NCHAR 列データの統計を収集しません。 列にNULL値のみが含まれる場合、列統計は収集されません。
照会でこれらの統計の利点が得られる場合は、remote-query統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Apache Impala
- 統計の収集
- ローカル表の統計を収集するには、 Apache Impala 製品資料の説明に従って COMPUTE STATS ステートメントを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
Apache Impala または LOW2KEYHIGH2KEY 統計をサポートしておらず、より新しいバージョンのではNUMNULLS統計 Impala をサポートしていません。
照会でこれらの統計の利点が得られる場合は、remote-query統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
PostgreSQL 用データベース
- 統計の収集
ローカル表の統計を収集するには、 PostgreSQL 製品資料の説明に従って ANALYZE コマンドを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
PostgreSQL または LOW2KEYHIGH2KEY 統計をサポートしていません。 クエリがこれらの統計の恩恵を受ける場合は、統計 remote-query 収集タイプを使用してください。
このタイプは、仮想化されたテーブルの行数が多すぎる場合や、多くの列に対して統計情報が収集される場合、リソースを大量に消費し、完了までに長い時間がかかる可能性があります。 システムの負荷が低いときに統計を収集することを検討してください。 多くの統計収集ジョブを同時にスケジュールしないようにしてください。
Db2 および Db2 on Cloud
- 統計の収集
これらのデータソースのローカルテーブル統計情報を収集するには、` RUNSTATS `コマンドを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
Db2 Big SQL
- 統計の収集
ローカルテーブルの統計情報を収集するには、`` ANALYZE コマンドを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。 両方のタイプにおいて、 および LOW2KEY の HIGH2KEY 値はテーブル内の最大値と最小値を表します。
Db2 for z/OS
- 統計の収集
ローカルテーブルの統計情報を収集するには、`` RUNSTATS コマンドを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。 この方法では、テーブル内の2番目に高い値と2番目に低い値を表す および LOW2KEY の HIGH2KEY 値が カタログ Db2 からコピーされます。 コレクション remote-query 型では、`min HIGH2KEY `値 LOW2KEY と`max`値はテーブル内の最小値と最大値を表します。
- 制限
- LOB タイプの統計は収集されません。
Db2 for z/OS NUMNULLS統計をサポートしていません。 照会がこの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Greenplum
- 統計の収集
- ローカル表の統計を収集するには、 Greenplum 製品資料の説明に従って ANALYZE コマンドを使用します。 リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
Greenplumでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Hive
- 統計の収集
- ローカル表の統計を収集するには、 Hive 製品資料の説明に従って ANALYZE コマンドを使用します。
統計 remote-catalog 情報の収集タイプは、統計情報の収集 Hive に関する既知の問題があるため、推奨されません。 Hive 代わりに統計 remote-query 情報の収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Informix
- 統計の収集
- ローカル表の統計を収集するには、 Informix 製品資料の説明に従って UPDATE STATISTICS ステートメントを使用します。 リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
Informixは、HIGH2KEY、LOW2KEY、または NUMNULLS 統計をサポートしません。 収集するのは CARD (表カーディナリティー) と COLCARD (列カーディナリティー) のみです。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
MariaDB
- 統計の収集
ローカル表の統計を収集するには、 MariaDB 製品資料の説明に従って ANALYZE コマンドを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。 カタログ統計情報にアクセスするには管理者権限が必要です。統計収集 remote-catalog タイプを使用する際にはこれが必須となります。
- 制限
- TEXT タイプまたは BLOB タイプの列の統計は収集されません。
MariaDBは COLCARD 統計をサポートしていません。 照会がこの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Microsoft SQL Server
- 統計の収集
- ローカル表の統計を収集するには、 Microsoft SQL
Server 製品資料の説明に従って UPDATE STATISTICS ステートメントを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
- XML タイプ列の統計は収集されません。
- Microsoft SQL Serverは、CARD (表カーディナリティー) および COLCARD (列カーディナリティー) のみを収集します。 HIGH2KEY、 LOW2KEY、または NUMNULLS 統計はサポートされません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
MySQL
- 統計の収集
- ローカル表の統計を収集するには、 MySQL 製品資料の説明に従って ANALYZE TABLE ステートメントを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
- MySQLは、CARD (表カーディナリティー) および COLCARD (列カーディナリティー) のみを収集します。 HIGH2KEY、 LOW2KEY、または NUMNULLS 統計はサポートされません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Netezza Performance Server
- 統計の収集
- ローカル表の統計を収集するには、 Netezza 製品資料の説明に従って GENERATE STATISTICS コマンドを使用します。
リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。 両方のタイプにおいて、 および LOW2KEY の HIGH2KEY 値はテーブル内の最大値と最小値を表します。
Oracle
- 統計の収集
ローカル表の統計を収集するには、 Oracle 製品資料の説明に従って ANALYZE コマンドを使用します。 あるいは、DBMS_STATS.GATHER_TABLE_STATS プロシージャーを使用して統計を収集することもできます。 Oracleリモート・データ・ソースで自動統計収集を構成することもできます。
- 制限
- LOB タイプの統計は収集されません。 リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。 両方のタイプにおいて、 および LOW2KEY の HIGH2KEY 値はテーブル内の最大値と最小値を表します。
SAP ASE
- 統計の収集
- ローカル表の統計を収集するには、 SAP ASE 製品資料の説明に従って UPDATE STATISTICS ステートメントを使用します。
- 制限
- SAP ASEは、CARD (表のカーディナリティー) のみを収集します。 COLCARD、HIGH2KEY、LOW2KEY、および NUMNULLS 統計はサポートされません。 述部で使用されるキー列には、 remote-query 統計収集タイプを使用します。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
SAP HANA
- 統計の収集
- ローカル表の統計を収集するには、 SAP HANA 製品資料の説明に従って CREATE STATISTICS ON ステートメントを使用します。 リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
- SAP HANAは、CARD (表カーディナリティー) および COLCARD (列カーディナリティー) のみを収集します。 HIGH2KEY、 LOW2KEY、または NUMNULLS 統計はサポートされません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Snowflake
- 統計の収集
- Snowflakeは、統計を収集するための明示的な方法をサポートしていません。 ただし、INFORMATION_SCHEMA.TABLESカタログ・テーブルのROW_COUNT列には、Data Virtualization統計収集の一環としてテーブルのカーディナリティ(CARD)値が格納されます。 リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
Snowflakeは、CARD (表のカーディナリティー) のみを収集します。 COLCARD、HIGH2KEY、LOW2KEY、および NUMNULLS 統計はサポートされません。 述部で使用されるキー列には、 remote-query 統計収集タイプを使用します。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Teradata
- 統計の収集
ローカル表の統計を収集するには、 Teradata 製品資料の説明に従って COLLECT STATISTICS コマンドを使用します。 冗長な統計収集を回避するには、THRESHOLD オプションを指定します。 このオプションを使用すると、最後の統計収集以降に変更されたデータ量が指定されたしきい値を下回っている場合、または統計が指定された経過時間より新しい場合、Teradataは統計を再収集しません。 PERIOD タイプ (BEGIN 式と END 式を除く)、XML タイプ、BLOB タイプ、CLOB タイプ、またはユーザー定義タイプ (地理空間タイプ以外) については、統計は収集されません。 リモートデータソースで統計情報が収集されることを確認し、統計 remote-catalog 情報収集タイプを使用してください。
- 制限
Teradataでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
IBM Cloud Object Storage、 Amazon S3、 Ceph、 または汎用 S3 データ・ソース
- 統計の収集
仮想化されたテーブルの統計情報を収集するには、 IBM Cloud Object Storage` Amazon S3` Ceph、``、``、または S3 汎用データソースで` ANALYZE `コマンドを使用します。
表に大量のデータがある場合は、TABLESAMPLEオプションを指定して、データのサブセットに関する統計を収集し、分析操作をより早く完了できるようにします。
オブジェクトストレージ内のデータの統計情報の収集も参照してください。