Apache Avroとは

Avroとは

Avroは、Apache Hadoop向けのデータ・シリアライゼーションとデータ交換のサービスを提供するオープンソース・プロジェクトです。これらのサービスは、一緒に使用することも、個別に使用することもできます。

Avroでは、どんな言語で書かれたプログラムどうしでもでビッグデータを容易に交換できます。シリアライゼーション・サービスを使用すると、プログラムではデータをファイルやメッセージに効率的にシリアライズできます。データ・ストレージはコンパクトで効率的です。Avroでは、データ定義とデータの両方を1つのメッセージまたはファイルにまとめて保管します。

Avroはデータ定義をJSON形式で保存するため、読み取りや解釈が簡単です。データ自体はバイナリ形式で保存されるため、コンパクトで効率的です。Avroファイルにはマーカーが含まれており、大規模なデータ・セットをApache MapReduce処理に適したサブセットに分割する際に使用できます。一部のデータ交換サービスでは、データ定義を解釈し、データにアクセスするためのコードを生成するためにコードジェネレーターを使用します。Avroはこのステップを必要としないため、スクリプト言語に最適です。

Avroの主要な機能は、時間の経過とともに変化する（多くの場合、スキーマ進化と呼ばれる）データ・スキーマの堅牢なサポートです。Avroは、フィールドの欠落、フィールドの追加、フィールドの変更といったスキーマの変更を処理します。その結果、古いプログラムが新しいデータを読み取り、新しいプログラムが古いデータを読み取ることができます。AvroにはJava、Python、Ruby、C、C++などのAPIが含まれています。Avroを使用して保管されたデータは、異なる言語で書かれたプログラムからの受け渡しが可能で、Cなどのコンパイル済み言語から、Apache Pigなどのスクリプト言語へも受け渡すこともできます。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

データ・リーダー向けAI対応データ関連ガイド

データ・リーダーがこれらの課題を克服し、信頼できるデータ基盤の基礎を確立し、組織のデータをAIに対応させるために実行できる実行可能な手順について学びましょう。

参考情報

カメラ、ボリューム・ノブ、クリップボードなどを並べた複数のアイコンの3Dレンダリング

AIエージェントはデータに基づいて実行されます。準備はできていますか?

データは競争上の優位性です。この短時間のWebセミナーでは、安全な方法でAIを解き放ち、測定可能なROIを達成する方法を紹介します。

Gartner社のロゴ

IBMがメタデータ管理のリーダーに選出

IBMがwatsonx.data intelligenceにより、2025年Gartner Magic Quadrant for Metadata Managementでリーダーに選出された理由をご覧ください。

曲線に沿って並んでいるアプリ・アイコン

お客様のデータは生成AIに向けた準備ができていますか

当社の「Data Matters」ハブで、統合などのデータとAIの課題に取り組む方法を学びましょう。

データについて話している人々がいる画面のイラスト

データ戦略をAIの成果へ

強力なデータ基盤でAIを拡張し、説明可能で管理された成果を実現し、実世界の教訓を独自のAIロードマップに適用する方法をご覧ください。

カジュアルなワークスペースでトピックについて議論する3人の同僚

データ・インテリジェンス：暗闇からデータを開放しましょう

データ・インテリジェンスがガバナンス、品質、リネージュ、共有を統合して、未加工データを信頼できる洞察に変える方法をご覧ください。

Heather Gentileの笑顔の写真

データとAIを信頼して活用するための統合的なフレームワークを構築する

人・プロセス・技術を一体化した体系的なデータ・AI運用が、導入の迅速化、イノベーション創出、投資効果の向上を実現します

タブレットを持ってデータセンターの廊下に立つプロフェッショナル

データから洞察へ：データ・インテリジェンスによるジャーニーの計画

データ・インテリジェンスから実行可能な洞察を導き出すための変革的なプロセスとベスト・プラクティスをご覧ください。

カメラ、ボリューム・ノブ、クリップボードなどを並べた複数のアイコンの3Dレンダリング

経営幹部が情報をインパクトに変える方法

データ・リーダー向けの業界横断レポートで、1,700人の最高データ責任者（CDO）から得たインサイトをご覧ください。

関連ソリューション

IBM Knowledge Catalog

インテリジェントなカタログ作成とポリシー管理により、AIと分析用のデータを有効化します。 IBM Knowledge Catalogは、データ検出、データ品質管理、データ保護を自動化するデータ・カタログを提供するデータ・ガバナンス・ソフトウェアです。

Knowledge Catalogを見る

IBMデータ・インテリジェンス・ソリューション

未加工データを実行可能な洞察にすばやく変換し、データ・ガバナンス、品質、リネージ、共有を統合し、信頼性が高くコンテキスト化されたデータでデータ・コンシューマーを支援します。

データ・インテリジェンス・ソリューションを発見する

データと分析に関するコンサルティング・サービス

IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築できます。

分析サービスの詳細はこちら

次のステップ

クラウド上またはオンプレミス上のどこに保存されていても、データやナレッジ資産、そしてその関係性を見出し、理解し、キュレートし、アクセスします。IBM Knowledge Catalogは、データ検出、データ品質管理、データ保護を自動化するデータ・カタログを提供するデータ・ガバナンス・ソフトウェアです。