データ完全性とは

オフィスの机で書類を調べる成熟したビジネスマン

共同執筆者

Tim Mucci

IBM Writer

Gather

Cole Stryker

Staff Editor, AI Models

IBM Think

データの整合性とは

データの整合性とは、組織のデータがライフサイクルのどの時点でも正確、完全、一貫していることを保証することです。データの整合性を維持するには、組織のデータを損失、漏洩、破損の影響から保護する必要があります。

組織は、意思決定、消費者行動の予測、市場動向の評価、データ侵害の防止のためにクリーンなデータに依存しています。組織内のデータ量が急増し、そのデータが会社の将来に関する意思決定に使用されるにつれて、データの整合性を最大限に高めることがますます重要になっています。

データの整合性を達成するために、組織はエラーチェック、検証手順、さらに、暗号化、アクセス制御、バックアップなどの厳格なセキュリティ-対策を含むプロセスを遵守します。データ整合性の目標は、データ分析がGDPRなどの規制フレームワークによってサポートされている信頼できる情報に基づいていること、そして機密情報が不正アクセスやエクスプロイテーションから保護されていることを保証することです。

データの整合性は、単一のツールやプラットフォームに限定されるものではありません。むしろ、データが信頼できる資産であり続けることを保証するために、組織のテクノロジー・インフラストラクチャー、ポリシー、およびデータ・システムを扱う個人が協力して取り組む包括的なアプローチです。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ご登録いただきありがとうございます。

ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

データの整合性が重要な理由

データの整合性は、従来の製品指向のビジネスにおける品質管理に似ており、未加工データが正しく、安全で、意図された用途に適切であることを保証します。

ビジネス分析、顧客とのやり取り、コンプライアンスにおける優れたデータへの依存は、組織全体にわたるデータの整合性の重要性を浮き彫りにします。データを使用する際には、「ごみを入れたらゴミが出てくる」という言葉がよく当てはまります。健全なビジネス上の意思決定を行い、顧客を公正かつ正しく扱い、業界規制に準拠した正確なビジネスレポートを促進するには、良質なデータを使用することが非常に重要です。質の悪いデータを使えば、望ましくない結果をもたらします。

組織は、ライフサイクルを通じてデータを完全、正確、一貫、安全に保つ必要があります。データの整合性は、すべてのデータ要素を変更、切り捨て、または損失することなく完全な状態に保ち、分析を歪め一貫したテスト条件を危険にさらす可能性のある変更を防ぐことによって、この完全性を促進するのに役立ちます。データ整合性プロセスがなければ、アクセス・パターンに関係なく、組織は将来においてデータが過去のデータと一致するかどうかを検証できなくなります。さらに、データの整合性は、認証、承認、暗号化、およびバックアップやアクセス・ロギングを含む包括的なデータ保護戦略を通じてアクセスを制御し、不正な利用から保護することで、データ・セキュリティーを強化するのに役立ちます。

意思決定だけでなく、データ対象者の個人情報や機密情報を保護するためにも、データの整合性は極めて重要です。人為的ミスであれ、サイバー攻撃であれ、顧客データの取り扱いにおけるミスは、プライバシーや信頼の侵害、個人の虚偽表示、そして深刻な風評被害につながる可能性があります。これは、機密性の低いファースト・パーティー・データにも同様に当てはまり、不正確なデータは、企業のユーザーに対する理解や扱いを歪め、トレンドへの取り込みやブランドとのインタラクションに影響を与える可能性があります。したがって、データの整合性を維持することは、単なるコンプライアンスや業務上の問題ではなく、組織と顧客との関係や市場における地位のあらゆる側面に影響を与える戦略上の必須事項です。

5種類のデータ整合性

データ整合性の中心的な概念は、中核的な ビジネス分析の 目的でデータセットを使用できるようにすることです。これはデータの安定性、性能、回復可能性、セキュリティーを支えます。

問題は、人的ミス、意図しない転送エラー、ウイルス、ソフトウェアのバグ、マルウェア、ハッキング、構成されたハードウェア、デバイスへの物理的損傷など、さまざまな方法でデータが侵害される可能性があることです。組織は、整合性制約を採用し、データの操作に関するルールと手順を定義することで整合性を実現できます。整合性制約は、情報の削除、挿入、変更などのアクションをカバーし、エンタープライズ・リソース・プランニング( ERP )データベース、顧客関係管理( CRM )システム、 サプライチェーン管理 システムなどの一般的なシステムで整合性を徹底できるようにします。

組織がデータの品質を検証および維持するには、次の5種類のデータ整合性が役立ちます。

エンティティの整合性

さまざまな方法で使用およびリンクできるテーブル内にデータを格納する リレーショナル・データベース システムの機能。エンティティの整合性は、データを識別するために作成された一意のキーと値に依存し、同じデータが何度もリストされず、テーブル・フィールドに正しく値が設定されるようにします。

物理的な整合性

データの保存および取得時に、データの正確性、正確性、完全性を保護します。物理的な整合性は、停電、ストレージの侵食、ハッカーからの攻撃、自然災害により損なわれる可能性があります。

参照整合性

データが均一に保存され、使用されることを保証する一連のプロセス。データベース構造には、リンクされたテーブル内に一致するレコードの存在を強制するルールが組み込まれることで、レコードの孤立を防ぎ、データベース全体でデータの一貫性を確保します。

ドメインの整合性

ドメインは、インプットできる数量、形式、データを管理する制限やルールなど、テーブルの列の特定の値セットによって定義されます。ドメイン整合性は、ドメイン内のデータ要素の精度を確保するのに役立ちます。

ユーザー定義の整合性

ユーザーが独自のニーズに合わせてデータに関するルールと制約を作成する場合。この方法は通常、データの安全性とセキュリティーが保証されない他のプロセスで使用されます。

AI Academy

生成AIの成功の鍵はデータ管理

生成AIの使用を成功させるために、高品質のデータが不可欠である理由をご覧ください。

データ整合性、データ品質、データ・セキュリティーの違い

データの整合性、データ品質、およびデータ・セキュリティーは、企業データの管理における基本的な概念であり、誤って同じ意味で使用されていることがよくあります。

データ品質は、正確性、完全性、一意性、適時性などの要素に基づくデータの状態に重点を置いています。

データ・セキュリティーは、不正アクセス、侵害、その他の不正行為からデータを保護します。これには、データのライフサイクル全体にわたってデータを保護するために導入されるテクノロジー、ポリシー、プラクティスが含まれ、機密性と信頼を維持するために、許可された担当者だけが機密情報にアクセスできるようにします。

データの整合性は、データの品質とセキュリティー要素を含む包括的な原則です。不正なデータ変更を防ぐルールと標準を適用することで、作成と保存から取得と削除まで、データのライフサイクルにおけるデータの正確性と一貫性を検証します。データ整合性メカニズムは、データが正確でアクセス可能であるだけでなく、不正な改ざんから保護されていることを保証するのに役立ち、業界および政府の規制への準拠をサポートします。

データ整合性アプリケーションの業界例

データの整合性はすべての業界の懸念事項であり、各業界はデータを保護するために独自の慣行と標準を採用しています。例えば、製薬業界では、米国食品医薬品局(FDA)などの規制機関が定めた厳格なガイドラインを遵守する必要があります。医薬品メーカー向けのFDAのドラフト・ガイダンス (ibm.com外部へのリンク)では、医薬品が一貫して製造され、追跡可能で、摂取しても安全で、効果的であることを証明するために、規約と連邦規制に準拠することを強調しています。同様に、医療機器に関する ISO 13485 (ibm.com外部へのリンク)などの国際標準は、製造におけるデータ整合性の世界的な重要性を強調し、製品が最高の安全性と品質基準を満たすことを保証しています。

金融分野では、金融取引業規制機構(FINRA)が、特に自動取引や資金移動監視システムにおいて、堅牢なデータ整合性対策の必要性を認識しています。データ整合性プログラムを開発および拡張するための FINRA の取り組み (ibm.com外部へのリンク)は、金融取引と機密性の高い顧客情報を保護するための業界全体の取り組みを反映しており、これは規制の厳しい環境で信頼とコンプライアンスを維持するために不可欠です。

鉱業や製品製造業界でも、オートメーションおよび生産監視システム内のデータ整合性にますます重点が置かれるようになっています。その目標は、運用上の意思決定と効率性の改善を促すデータの正確性と信頼性を保証し、コストのかかるエラーを防ぎ、競争力を高めることです。

クラウド・ストレージ・データベース・プロバイダーは、顧客データの整合性と出所を維持する上で独自の課題に直面しています。データの保存と処理にクラウド・サービスへの依存度が高まるにつれて、これらのプロバイダーは、データ違反を追跡して防止し、顧客の情報が安全かつ変更されないよう保証するための高度な対策を講じる必要があります。

データ整合性アプリケーションは、電子医療記録のエラーが悲惨な結果を招く可能性がある医療業界でも使用されています。また、金融業界では、正確な取引データがリスク評価と不正検知に不可欠で、顧客確認(KYC)プロトコルなどの実践が顧客情報の検証と規制遵守の維持に重要な役割を果たします。さらに、教育機関では、入学管理、学業の追跡、リソースの割り当てのために正確な学生記録に依存しています。

組織内のデータ管理戦略

企業組織におけるデータの整合性の確保は、一度限りの作業ではなく、データを最大限に検証するためにテクノロジー、プロセス、人材を巻き込んだ総合的な戦略を必要とする継続的な取り組みです。以下の戦略とベスト・プラクティスは、データ資産を保護し、組織が自信を持ってデータを活用して意思決定とイノベーションを実現できるようにするためのものです。

データ入力

データの整合性チェックを、キーボードを打つ人間やデータを送信するアプリケーションなど、データ入力ポイントのできるだけ近くで実装することで、データベースに入力できる情報の種類を制限および指定できます。

整合性の制約

データの脆弱性の多様性は、データを保護するための包括的なアプローチの重要性を強調しています。組織全体でのデータの整合性の管理は、整合性制約と呼ばれる幅広いポリシー、ガイドライン、ルールによって実現されます。これらは、保持からさまざまなデータとそれらを扱う人々の関係まで、データ管理のさまざまな側面をカバーします。

整合性制約は、エンティティー、参照、ドメイン、ユーザー定義などのリレーショナル・データ・モデルに関連付けられています。例えば、ドメイン制約によって列が保持できる値の種類が制限されるため、「年齢」列では1~120の整数のみをインプットできます。

エンティティ整合性では、テーブル内の各行が一意かつ識別可能になるように指示が提供されます。これは通常、主キーによって強制され、データベース・テーブル内のすべての行に一意の識別子があることを意味します。

また、整合性制約は、テーブル間の関係が外部キー(あるテーブル内の列または列のセットで、別のテーブルのプライマリー・キーを参照)を通じて明確に定義および維持されることも保証します。

これらの制約により、各フィールドのデータが指定された形式と値に準拠していること、および特定の組織のニーズに合わせて調整された追加のルールが満たされていることを確認します。

データ保持

保持ガイドラインとポリシーは、一貫性を維持し、古い情報に起因するエラーを最小限に抑えるために、データベースにデータを保管する期間を指定します。データのバックアップは、データ損失を防ぎ、システム障害、データ破損、またはデータの整合性を損なう可能性のあるその他の予期しないインシデントが発生した場合のフェイルセーフを提供するためのものです。効果的なバックアップ戦略には、安全で地理的に分散した場所に保存されたデータの定期的なスナップショットが含まれ、最小限の損失でデータを復元できることを確認する必要があります。

アクセス、セキュリティー、物理的整合性

接続性とデータ・アクセスも、データの整合性を維持する上で重要な役割を果たします。さまざまなデータ・ソースとシステム間のシームレスな接続を確保することで、組織全体で一貫した情報の流れが可能になります。

データ・アクセスを管理することで、許可された担当者だけがデータを変更または操作できるようにし、偶発的または悪意のあるデータ改ざんのリスクを軽減できます。

さらに、組織全体で継続的に監視することで、データの整合性を維持することにも役立ちます。定期的なエラー・チェック、サイバーセキュリティーの意識、正確なデータの重要性に関するチーム・メンバー間の明確なコミュニケーションが重要です。

組織は、無停電電源装置や冗長ハードウェアなどの対策を使用して、データの物理的な整合性を確保する必要があります

ツール

データが収集されると、強力なデータベース管理プラクティスによって、重複データの作成を防ぐルールを適用できます。監査試験のためにデータの起源と変換を追跡するデータ・リネージュ・ツールなどのテクノロジーを活用し、アクセス制御のセキュリティー機能を提供するデータ・カタログ、厳格な入力検証プロセス、整合性違反の防止に役立つ最新のデータベース・システムを実現します。

データベース・システムには整合性制約をサポートする機能が備わっており、正確性をチェックする責任をデータベース自体に委ねます。例えば、親子関係などのメカニズムは、データベース・レベルで管理される参照整合性プロセスが、レコード間の関係が保持され、孤立したレコードや不正な削除が防止されることを保証することで、データの整合性を自動的に保護する方法を示しています。

IBM DatabandやAtaccamaなどのデータ検証ツールは、正確性、一貫性、完全性を実現するために欠かせません。検証ツールは、問題を示している可能性のある矛盾や異常を特定するのに役立ちます。これらのツールは、データ管理システムに統合されると、データの品質と整合性を継続的に検証します。

この一元化されたアプローチにより、さまざまなアプリケーション間での再利用性と簡単なデータ保守を確保しながら、データ管理システムの安定性を維持できます。

教育と文化

データの正確性とセキュリティーを優先する文化を育むことに熱心な企業は、安全でないデータや質の悪いデータを使用するリスクについて、ビジネス・リーダーと従業員を教育する必要があります。

関連ソリューション
データ管理ソフトウェアとソリューション

データ・サイロを排除し、複雑さを軽減し、データ品質を向上させることで、卓越した顧客体験と従業員体験を実現するデータ・ストラテジーを設計します。

データ管理ソリューションの詳細はこちら
IBM watsonx.data

watsonx.dataを使用すると、オープンでハイブリッド、かつ管理されたデータ・ストアを通じて、データがどこに保存されていても、すべてのデータを使用して分析とAIを拡張できます。

watsonx.dataについてはこちら
データ分析コンサルティングサービス

IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築します。

分析サービスを発見する
次のステップ

データ・サイロを排除し、複雑さを軽減し、データ品質を向上させることで、卓越した顧客体験と従業員体験を実現するデータ・ストラテジーを設計します。

データ管理ソリューションの詳細はこちら watsonx.dataについてはこちら