Hugging Faceとは

共同執筆者

Staff Editor, AI Models

IBM Think

Hugging Faceとは

Hugging Faceは、データサイエンス、機械学習、自然言語処理（NLP）に重点を置き、人工知能を活用するためのツール、機械学習モデル、プラットフォームを構築する、同名の巨大なオープンソース・コミュニティーを運営している企業です。Hugging Faceは、NLPトランスフォーマー・ライブラリーと、ユーザーがモデルとデータセットを共有できるプラットフォームで有名です。

The DX Leaders

「The DX Leaders」は日本語でお届けするニュースレターです。AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。

Hugging Faceを使用するメリット

Hugging Faceは世界で最も活気のあるAIコミュニティーの1つを育んでおり、ユーザーは毎日新しいAIモデル、データセット、チュートリアル、研究を投稿しています。開発者がモデルをアプリケーションに直接統合できるようにする豊富なAPIが提供されており、そのプラットフォームは多くのユースケースや業種・業務にわたる幅広いタスクをサポートしています。プラットフォームの主な利点のいくつかを次に示します。

最新モデルへのアクセス
ワークフローの簡素化
シンプルなデプロイメントとスケーリング
活気あるコミュニティー
責任あるAIへの注力

Hugging Faceを使用するメリット

ワークフローの簡素化

Hugging Faceのライブラリーは、ユーザーフレンドリーで、ドキュメントが充実していることで知られています。初心者でも、Hugging Faceツールを使用して強力なモデルをファイン・チューニングし、分散トレーニング、トークン化、評価、デプロイメントなどの複雑なタスクを実行できます。基礎ツールと高度なツールの両方にアクセスできることで、AI開発は非常に多彩な実務者コミュニティーに開かれています。

シンプルなデプロイメントとスケーリング

Hugging Faceを使用すると、トレーニングだけでなく、モデルを本番環境に簡単にデプロイできます。Hugging Faceツールを使用すると、ユーザーはインフラストラクチャーに関する深い知識を必要とせずに、Web、モバイル・アプリケーション、または社内システムにモデルを提供できます。このフルスタック・サポートにより、このプラットフォームはスタートアップ企業やエンタープライズにとって特に魅力的になっています。

活気あるコミュニティー

すぐに利用できるすべてのテクノロジーとは別に、開発者、データサイエンティスト、研究者が多くがHugging Faceの活気あるコミュニティーを利用しています。このコミュニティーでは、経験の浅い開発者が経験豊富な実践者から学び、すでに同様の課題に直面したことのある人々に質問することができます。

責任あるAIへの注力

多くのHugging Faceモデルには、制限、バイアス、意図されたユースケースに関するドキュメンテーションが付属しています。同社は、オープン・ガバナンスと、AI倫理に関するコミュニティー主導の議論に多額の投資を行っています。

IBMお客様事例

お客様のビジネス課題（顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など）を解決した多岐にわたる事例のご紹介です。

オープンソースの違い

Hugging Faceが登場する前は、最も強力なモデルは、専門知識と膨大なコンピューティング・リソースが必要だったため、人々が使用するのが困難なことがよくありました。ツールをオープンソース化することで、必要なコードとドキュメントがすべて揃い、これらのモデルが使いやすくなりました。これにより、研究者、学生、スタートアップ企業が実験や構築を行うことができるようになり、世界規模でイノベーションが大幅に加速しました。Hugging Face登場後、開発者は知識を簡単に共有し、互いの取り組みからメリットを受けることができ、より良いモデルを共同で作ることができるようになりました。

このようにオープンソースに重点を置くことで、大企業も成果を共有するようになり、エコシステム全体にメリットをもたらすことができました。Microsoftは、Hugging Faceモデルを自社のAzureサービスに統合し、企業顧客が最先端のAIツールに直接アクセスできるようにしています。同様に、NVIDIAはHugging Faceと連携してGPUのモデル・トレーニングと推論を最適化し、ディープラーニングのワークフローを大規模なデータセットに拡張できるようにしています。

Hugging Faceの歴史

Hugging Faceは、2016年にニューヨーク市でフランスの起業家Clément Delangue氏、Julien Chaumond氏、Thomas Wolf氏によって設立されました。¹ 起業家たちはもともと、10代の若者向けのチャットボットの構築に興味を持っていましたが、チャットボット・テクノロジーの基盤となるモデルの力を認識し、モデルそのものに方向転換しました。

チームは社内ツールをオープンソース化し、Hugging Face Transformersライブラリーの最初のバージョンを立ち上げました。これはすぐに研究者やエンジニアの間で人気となりました。Hugging Faceは事前トレーニング済みのTransformerモデルの信頼できるソースとなり、2020年にモデル・リポジトリーであるHugging Face Hubを導入しました。これにより、ユーザーはモデルを簡単にアップロード、ダウンロード、共有できるようになりました。翌年には、データセットの共有を容易にするデータセット・ライブラリーと、対話型AIデモをデプロイするためのHugging Face Spacesを立ち上げました。2022年には、Pythonで機械学習アプリケーションを開発するためのオープンソースAIライブラリーであるGradioを買収しました。²

Hugging Faceは、マルチモーダル・モデル、大規模言語モデル（LLM）、拡散モデル、強化学習用のツールをリリースしました。2023年、Hugging Faceはwatsonx.aiでIBMとの協働を開始しました。watsonx.aiは、ユーザーが従来のMLと当時の新しい生成AI機能の両方をトレーニング、検証、チューニング、デプロイできるようにするIBMのAIスタジオです。その年の後半、IBMはHugging FaceのシリーズD資金調達ラウンドに参加しました。

Hugging Faceのサービス

Hugging Faceの主なサービスは次のとおりです。

Hugging Face Hub

Hugging Face Hubは、ユーザーがモデルやデータセット、アプリケーションを共有、発見、共同作業できるWebベースの中央プラットフォームです。「AIのためのGitHub」のように機能し、何千もの公開参考情報をホストしています。モデルおよびデータセットのページには、多くの場合、ドキュメンテーション、例、バージョン追跡、ライブ・デモが含まれています。このハブは、安全なコラボレーションのために、チームや企業向けのプライベート・リポジトリーもサポートしています。

Transformerライブラリー

Transformerライブラリーは、NLP、コンピューター・ビジョン、ディープラーニング・モデルで最も広く使用されているツールの1つです。これは、ユーザーがコンピューターまたはサーバーにインストールするPythonライブラリーで、Hubで見つけたモデルを使用できるようにするコードを提供します。これには、モデル・アーキテクチャー、前処理ツール、トレーニング・ユーティリティーなどが含まれます。PyTorchやTensorFlowなどの一般的なフレームワーク上に構築されたTransformerライブラリーを使用すると、ユーザーはわずか数行のコードでBERT、GPTなどの強力なMLモデルを読み込むことができます。また、カスタム・データセットでオープンソース・モデルをファイン・チューニングするための広範なツールも提供しており、研究や制作にさらに役立ちます。