テレメトリーは、医療、航空宇宙、自動車、情報技術(IT)などのさまざまな業界で重要な役割を果たしており、組織にシステム性能、ユーザーの振る舞い、セキュリティー、運用効率に関する貴重な知見を提供します。農業、公益事業、輸送など、物理的な資産に依存する業界では、組織はテレメトリーを用いて温度、気圧、動き、光などの測定値を取得します。医療分野では、テレメトリーシステムは心拍数、血圧、酸素レベルを追跡できます。
どちらの場合も、物理的な機器やセンサーが実世界のデータを収集し、中央リポジトリーに送信します。データは多くの場合、詳細な分析のために、Modbus、PROFINET、OPC Unified Architecture、EtherNet/IPなどの特殊な通信プロトコルを使用して送信されます。
ただし、物理センサーは、エラー率、ー使用量、応答時間、アップタイム、レイテンシーなどのデジタル性能を取得するようには設計されていません。代わりに、ITチームは、ソフトウェア・ベースのエージェント(自律的に監視し、関連するシステム・データを収集するようにプログラムされたデジタル・センサー)を介して、デバイスの計測を利用することがよくあります。こうしたデータは多くの場合、メトリクス、イベント、ログ、トレース(MELT)として構造化されており、それぞれがシステム動作、運用ワークフロー、性能についての異なる視点を取得します。
特に、デジタル技術をビジネスの全領域に導入させることを目指すデジタル・トランスフォーメーション戦略を採用する企業が増えているため、物理的遠隔測定システムとデジタル遠隔測定システムの境界線は曖昧になり始めています。
たとえば、製造業のような従来、物理的な業界では、エネルギー消費、品質管理、環境条件を把握するためにセンサーが使用されることがあります。同時に、高度な資産追跡、予防的保守、生産フロー監視のためのソフトウェア・エージェントを利用することもあります。そのため、この記事では主にIT遠隔測定と、現代の企業環境で拡大するその役割に焦点を当てます。
ITテレメトリーの中核には、次の5つの重要なステップが含まれます。
効果的なテレメトリー戦略は、組織がFull Stack Observability、つまり外部アウトプットに基づいてテクノロジーのスタックの内部状態をエンドツーエンドで把握する能力を実現するのに役立ちます。
テレメトリーは、デバイスに高度なセンサー、ソフトウェア、ネットワーク接続を装備し、システム全体で通信してデータを交換できるようにするフレームワークでIoT(モノのインターネット)の主要構成要素でもあります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
テレメトリー・システムは、業界やシステムの複雑さによって異なります。従来のプラットフォームは、歴史的にテレメーターと呼ばれる記録デバイスを使用して、設備またはその近くでデータを収集します。この情報は、信号調整と呼ばれるプロセスで処理、変更され、場合によってはアナログからデジタルに変換されます。
次に、マルチプレクサー¥が複数のデータ・ストリームを合成信号に結合して、データの伝送効率を高めます。この結合された信号は、無線、衛星、または別の形式の通信を通じて遠隔の受信ステーションに送信されます。最後に、デマルチプレクサが信号を解析し、異種のストランドに分割して分析の準備をします。
最新のIT環境では、テレメトリーの仕組みは異なります。ITに重点を置いたシステムでは、物理センサーに頼るのではなく、ソフトウェア・エージェント(サービスやアプリケーションと並行して実行される軽量プログラム)を使用して関連するメトリクスを取得します。Kubernetes環境では、これらのエージェントは、監視対象のサービスと同じクラスター内で動作するコンテナで動作することがよくあります。その他の構成では、ソフトウェア開発キット(SDK)を使用してアプリケーション自体にエージェントを埋め込んだり、カスタムAPIを使用してデータ転送を容易にしたりする場合があります。
収集後、データはテレメトリー・パイプラインを介して伝送され、データの標準化、ノイズの除去、メタデータ(環境タグや地理位置情報タグなど)の追加、機密情報のマスクなどによりコンプライアンスを維持できます。この精製されたデータは、JSONやOpenTelemetry Protocol(OTLP)などの形式で標準化されます。
次に、gRPC、HTTP、またはその他のトランスポート・プロトコルを介して、1つ以上のバックエンド(ソフトウェア・システムのサーバー側コンポーネント、たとえばサーバー、データベース、アプリケーション・ロジック)にインテリジェントにルーティングされます。バックエンドは、このデータを保管し、分析と解釈を行い、ダッシュボード、アラート、推奨事項などの形式で表示する役割を担います。
単一のテレメトリー・システムを使用して、収集から分析までのワークフロー全体を管理する場合があります。ただし、特に最新のマルチクラウドおよびハイブリッド環境では、組織が複数の特殊なテレメトリー・システムを使用して、オブザーバビリティー・パイプラインのさまざまな部分を管理していることがあります。
ITにおいて最も一般的なテレメトリーの種類は、メトリクス、イベント、ログ、トレースであり、これらは総称して「MELT」データとよく呼ばれます。組織はオブザーバビリティー・プラットフォームを使用してこれらのメトリクスを組み合わせて分析し、プラットフォームのセキュリティー、ユーザーの振る舞い、システム効率などの全体像を把握できます。
メトリクスは、システムの正常性や性能を示す数値測定です。たとえば、リクエスト率、ネットワーク・スループット、アプリケーション応答時間、ユーザー・コンバージョン率、CPU使用率などがあります。
イベントは、システム内で発生する個別の現象です。多くの場合、イベントがいつ開始され、いつ終了したかを示すタイムスタンプが含まれます。たとえば、アラート通知、ユーザー・ログイン試行回数、サービス中断、決済の失敗、構成変更などが挙げられます。
ログは、特定のインシデントのみをフラグ付けするイベントとは異なり、システムの動作の継続的な記録と時系列を提供します。たとえば、再起動、データベース照会、ファイル・アクセス履歴、コード実行ステップなどが挙げられます。ログは多くの場合、エラーのトラブルシューティングやデバッグに使用され、ITチームが障害が発生した正確な瞬間を特定するのに役立ちます。
トレースは、分散環境またはマイクロサービス環境を介した特定のユーザー要求またはトランザクションのエンドツーエンドのフローを、各ステップのタイムスタンプとともに反映します。例としては、API および HTTP 呼び出し、データベース照会、電子商取引チェックアウトなどがあります。トレースはボトルネックを特定し、全体的なユーザー体験に関する知見を提供します。
MELTは企業が利用できる幅広いテレメトリー・データを提示しますが、このフレームワークの範囲外であっても、オブザーバビリティーにおいては依然として重要な役割を果たしているデータ型がさらに多くあります。テレメトリーの種類の間の境界は必ずしも明確であるとは限らず、重複する場合があります。たとえば、レイテンシーはメトリクスとネットワーク・テレメトリーのテータ点の両方と考えることができます。その他の種類のテレメトリー・データには、次のものがあります。
テレメトリー は、分散システムやコンポーネントから複数の種類のデータを収集して送信するプロセスです。これは組織の可視化機能の基盤であり、各コンポーネントがどのように動作し、パフォーマンスを発揮するかについての知見を提供します。企業は最終的に、監視およびオブザーバビリティー・システムを強化するためにテレメトリーを利用します。
監視とは、組織が収集したテレメトリー・データをどのように活用するかを指します。たとえば、テレメトリー監視システムではダッシュボードを使用して、DevOpsチームがシステムの性能を視覚化できるようにします。一方、アラートの自動化では、ネットワークの停止やデータ侵害などの注目すべきイベントが発生するたびに通知を送信できます。
オブザーバビリティーには、運用データを解釈し、さまざまなデータの流れがシステムの正常性や性能とどのように相関しているかを理解することです。オブザーバビリティーは、現在のデータを分析するだけでなく、より大きな傾向を見つけ出し、それを使用して企業の意思決定とリソースの使用を通知して最適化します。最新のオブザーバビリティー・プラットフォームには、テレメトリーおよび監視機能が組み込まれていることがよくあります。オブザーバビリティーは、エージェント型AIや生成AIプラットフォームなどの新興テクノロジーのサポートにおいても重要な役割を果たします。
OpenTelemetry(OTel)と呼ばれるオープンソース・フレームワークは、最も人気のあるテレメトリー・プラットフォームの1つであり、柔軟性(モジュール設計によりカスタマイズが可能)、手頃な価格(コア・コンポーネントは無料で利用可能)、互換性(複数のベンダーおよびプログラミング言語と互換性がある)が高く評価されています。OTelはテレメトリーのストレージや視覚化を処理しません。代わりに、データの収集と送信に特化した標準化されたSDK、API、その他のツールのセットを提供します。
AI企業、Elasticの2025年レポートによると、IT組織のほぼ半数がOTelを使用しており、さらに25%が将来的にこのフレームワークを実装する予定です。オブザーバビリティー・システムが成熟している組織は、オブザーバビリティー・ワークフローがあまり開発されていない企業と比較して、OTelを使用する傾向にあります。IBM Instana、Datadog、Grafana、New Relic、Dynatrace、Splunkはそれぞれ強力なoTelサポートを特長としています。
Prometheusと呼ばれる代替オープンソース・フレームワークには、OTelといくつかの類似点があります。Cloud Native Computing Foundation(CNCF)は、非営利団体であるLinux Foundationの子会社であり、両方のソリューションをホストしています。OTelとは異なり、Prometheusにはいくつかのデータ・ストレージとデータの可視化機能があります。ただし、範囲は少し狭くなります。OTelはさまざまな種類のテレメトリー・データを収集できますが、Prometheusはメトリクスのみを処理します。
テレメトリーの正規化は、分析ツールがメトリクスを保管、読み取り、解釈できるように、メトリクスを標準化された形式に変換するプロセスです。次の2つの主要なアプローチがあります。
このデータ処理アプローチでは、すべてのデータを保管および取得する前に、すべてのデータが事前に定義された形式に一致する必要があります。スキーマオンライトは信頼性が非常に高いですが、それぞれ異なる形式とファイル・プロセスを持つ複数のシステムが含まれる最新のITアーキテクチャーでは実装が難しい場合があります。
スキーマオンライトは、データ・ウェアハウスと呼ばれる集中型データ・リポジトリーでよく使用されます。これらのストレージ・ソリューションは、膨大な量のテレメトリー・データを維持できますが、それはそのデータが事前定義された形式で構造化および編成されている場合に限ります。データウェアハウスは拡張や維持にコストがかかる可能性がありますが、一貫性と信頼性が最優先されるビジネス・インテリジェンス、分析、その他のワークフローに最適です。
このアプローチでは、データを元の形式で収集し、ユーザーが取得したときにのみ変換されます。運用的には複雑ですが、スキーマオンリードは複数の形式にわたるデータを処理できるため、スキーマオンライトよりも柔軟性が高くなります。
スキーマオンリードは、データウェアハウスのようなデータレイクで一般的ですが、半構造化データと未加工の非構造化データの両方を構造化データと一緒に保存および管理できます。データレイクはコスト効率と俊敏性の点で高く評価されており、機械学習を活用した分析ツールに特に最適です。しかし、しっかりとしたガバナンスがなければ、管理が難しくなり、検証されていないデータや一貫性のないデータにつながる可能性があります。
データレイクハウスと呼ばれる新たな代替手段は、データレイクとデータウェアハウスの最も優れた要素を組み合わせることを目的としています。このフレームワークは、非構造化データのスキーマオンリードをサポートすると同時に、構造化データのスキーマオンライトも可能にします。このハイブリッド・アプローチにより、組織はデータレイクの柔軟性と俊敏性のメリットを享受しながら、一貫性と正確性を維持できます。
テレメトリー・データは、特に最新のハイブリッドおよびマルチクラウド環境では、収集、維持、保管が困難な場合があります。一般的に、次のような課題があります。
デバイスやサービスは、さまざまな形式、プロトコル、モデルを使用してテレメトリー・データを記録する場合があり、中央リポジトリーとの通信能力が制限されます。たとえば、遠隔医療機器は独自のプロトコルを使用して患者のバイタルサインを測定し、通信する電子医療システムは標準プロトコルを使用する場合があります。こうした非互換性があるため、DevOpsチームは接続を簡易化するためにカスタム・ミドルウェアを構築する必要がある場合があります。
また、非互換性があると、組織が各アーキテクチャ層の可視性を維持することが困難になり、データ・サイロ、イノベーションの障害、顧客体験のギャップが生じる可能性があります。企業は、一貫したデータ形式を確立し、厳格なガードレールを実装し、定期的な監査を実施し、コンポーネント間の同期とバージョン管理を実施することにより、この課題に対処できます。
冗長で乱雑なデータは、ストレージ・コストの高騰や、過剰なノイズによる分析の欠陥につながるおそれがあります。強力なガバナンスは、これらのリスクを軽減するのに役立ちます。
たとえば、DevOpsチームはデータ保持ポリシーを実装することができ、一定期間経過後にデータを自動的に削除できます。サンプリング(より大きなデータセットから代表的なサンプルを保存)、集計(特定のデータセットの平均を計算)、階層型ストレージ(古いデータをより低速で手頃なストレージ・ソリューションに移動)も、ストレージの負担と価格を軽減することができます。
企業、特に医療、法律サービス、人事などの分野は、個人情報が頻繁に保管および交換されるため、データの保持、プライバシー、主権に関する厳格な規制の対象となります。今日のDevOpsチームは、膨大な量のテレメトリー・データを収集し、規模が拡大しているため、コンプライアンスが課題となる可能性があります。
この課題に対処するために、組織は、機密データをセキュリティー侵害や偶発的な漏洩から保護する強力な暗号化手法とトークン制御を実装できます。監査を行うことで、組織はテレメトリー・パイプラインをレビューし、パイプラインの早い段階で脆弱性を発見できます。同様に、フィルタリング・システムは、ユーザーに届く前に非準拠データを特定して削除できます。最後に、企業は、データ保持と常駐ポリシーを効果的に適用する強力なガバナンス・フレームワークを通じてコンプライアンスを維持できます。
テレメトリー・システムによって生成されるデータの量は企業を圧倒し、有意な傾向を不明瞭にし、システムのセキュリティーと効率に関する知見を曇らせるおそれがあります。一方、過剰なアラートによるアラート疲労により、DevOps チームが優先度の高いタスクを完了できなくなり、計算リソースに不必要な負担がかかる可能性があります。組織は、アラート応答を自動化し、冗長なデータをエッジで除外し、強力なラベル付けと名前付け規則を確立し、リソースの割り当てと制限を適用することで対応できます。
テレメトリーにより、組織はデータを実行可能な知見に変換し、性能、ワークフローの効率、予算編成、顧客体験などの向上に使用できます。
テレメトリー・データは、DevOpsチームがどのコンポーネントやシステムがうまく機能しているか、またどのコンポーネントやシステムを更新、再構成、交換する必要があるかを特定するのに役立ちます。また、チームが過去の傾向とリアルタイムのパフォーマンス・データを分析し、設備を先見的に保守して重大な障害を防ぐ予知保全もサポートします。テレメトリー・システムは、古いデータや無関係なデータを効率的に分類、整理、削除することもできるため、運用上の無駄が削減されます。
手動のデータ分析とは異なり、テレメトリー・データは通常、自動的に、リアルタイムで収集されます。このプロセスは、ダウンタイムやコストのかかる障害が発生する前に、企業が問題に迅速に対処できるようにするためのものです。テレメトリー・システムを使用すると、企業は更新やイノベーションがシステムにどのような影響を与えるかを大規模に展開する前に追跡することもできます。
テレメトリー・システムは、ユーザー、アプリケーション、システムの動作をリアルタイムで可視化します。継続的な監視により、パフォーマンスのベースラインを確立し、異常なネットワーク・トラフィック、ログイン試行の繰り返し失敗、予期しないインストール、その他の疑わしいアクティビティーなどの異常を容易に検出できるようになります。テレメトリーはシャドー IT(集中管理されたガバナンスの外で動作する不正なコンポーネント)を公開することもできるため、攻撃者の潜在的な侵入ポイントを排除するのに役立ちます。
堅牢な暗号化ポリシーにより、テレメトリー・パイプライン全体でデータを保護でき、保持の適用により、必要な場合にのみ個人データが保持されるようになります。ロールベースのアクセス制御により、利害関係者はプライベート・データにアクセスできるようになり、監査証跡とログによって最近のシステム・アクションの詳細な履歴が提供されるため、より正確で効率的なセキュリティー調査が可能になります。
テレメトリーにより、チームは時間の経過に伴うシステムの使用状況をより深く知見できるため、変化するワークロードの需要に対応するようにリソースを動的にスケーリングできます。チームはこれらの知見を活用して、顧客にとって安定した安全な環境を維持しながら、リソースを最適化し、コストを管理できます。
テレメトリー・プラットフォームにより、チームは組織全体からデータを統合し、より適切な情報に基づいたデータ駆動型のビジネス上の意思決定を行うことができます。オブザーバビリティー・プラットフォームは、テレメトリー・データを利用して、システムの正常性、カスタマー・ジャーニー、ユーザー・エンゲージメント、およびその他の主要業績評価指標を分析します。重要なのは、テレメトリーが分散アプリケーションやシステムからデータを収集して統合し、ビジネス上の意思決定が個々のコンポーネントだけでなく環境全体に与える影響を企業に提供することです。
オンプレミス、クラウド、またはメインフレームのあらゆるアプリケーションのソフトウェア配信を自動化します。
DevOpsソフトウェアとツールを使用して、複数のデバイスや環境でクラウドネイティブ・アプリケーションを構築、デプロイ、管理します。
IBMのクラウド・コンサルティング・サービスで新しい機能にアクセスし、ビジネスの俊敏性を高めましょう。ハイブリッドクラウド戦略や専門家とのパートナーシップを通じて、ソリューションを共創し、デジタル・トランスフォーメーションを加速させ、パフォーマンスを最適化する方法をご覧ください。