生成 AI の転換点をナビゲート
企業の 80% が 2026年までに生成 AI を使用する予定であり1、あなたの組織もほかの多くの組織と同様に、この新たなテクノロジーを使用して価値と機会を勝ち取ろうと躍起になっている可能性があります。あらゆる AI イニシアチブの中心になるのは、モデルそのものです。企業組織は、ビジネスに固有の特定の AI 機能を迅速かつ高い費用対効果で実現する必要があります。
今日、企業組織は、カスタマイズされた生成 AI 機能を実現するために、主に 2 つの方法に依存しています。さらなるトレーニングを通じて、汎用の基礎モデルを微調整することを選択できます。あるいは、基礎モデルを特定のデータセットに接続することで、カスタマイズされた出力を容易にする取得拡張生成 (RAG) と呼ばれるテクニックを実装することもできます。
取得拡張生成とモデルの微調整の比較
RAG と微調整はどちらも、カスタマイズされた AI 機能への道のりを加速しますが、その方法はさまざまです。
微調整方法では、組織は独自のデータセットを使用して既製のモデルを改良します。基礎モデルは出発点を提供するため、チームはゼロから構築するのに必要な大量の時間とデータを必要としません。微調整の処理需要は、ゼロからトレーニングするよりも負荷が少なくなるため、選択した基礎モデルを微調整するために大規模なコンピューティング (GPU クラスターなど) が必要になる可能性は低くなります。
一方、RAG は独自の所有データベースからモデルを関連データに接続し、組織固有の最新情報を取得・分析します。この追加のコンテキストは最終的な出力に情報を与え、微調整と同様に、企業組織が必要とする非常に具体的な結果につながります。重要なことは、このモデルは RAG パラダイムで微調整されていないか、さらにトレーニングされていないということです。代わりに、検索メカニズムを通じて必要なナレッジベースに接続されます。
どちらのアプローチも、明確な利点を提供します。非常に効果的な RAG ベースの実装は、微調整よりも安価なハードウェアで実現できます。RAG はまた、幻覚のリスクも軽減し、出力のソースを提供して説明可能性を向上させることができ、機密情報をプライベート・データベースに安全に保持するためセキュリティー上の利点も提供します。
また、これらのアプローチは併用することもできることに留意することが重要です。RAG の詳細については、次のガイドをご覧ください。
一般的な基礎モデルを調べる
RAG とモデルの微調整はどちらも、中心的な要素として基礎モデルに依存しています。ビジネスで利用可能な既製の基礎モデルは数多く存在していますが、次に示す 6 つは、現在使用されている最も強力で人気のある製品の一部です。
- テクノロジー・イノベーション・インスティチュート (TII) Falcon LLM
- MosaicML の MPT
- Hugging Face の BLOOM
- Stability AI の Stable Diffusion
- Databricks の Dolly
- Meta AI Llama 3
- Mistral AI のモデル
これらの基礎モデルに基づいて、企業の生成 AI ソリューションを構築することで、組織の AI 投資のための時間を大幅に強化できます。
もちろん、モデルの選択は、ニーズとビジネスの現実に大きく依存する複雑なプロセスです。実践的な実験は、これらの既製の製品に慣れるための最良の方法の 1 つです。これらの 6 つのモデルはすべて、インテル® Tiber™ デベロッパー・クラウドを介して、お客様のチームで評価できます。
ハードウェアの推奨事項
一般的に、既製のモデルのカスタマイズする方が、モデルを一からトレーニングするよりも少ない処理能力で済みます。ニーズに応じて、お客様の組織がすでに所有している汎用のハードウェアで、必要なワークロードを実行できる可能性もあります。あるいは、より要求の厳しいワークロードを処理するために、専用の AI ハードウェアを選択することもできます。RAG の場合、スループットとレイテンシーの要件に基づいてハードウェア・タイプを選択することになります。インテルは、あらゆるカスタマイズのニーズ向けに、高速化 AI ハードウェアを提供しています。
- 大規模で専用の AI 微調整 (< 1T パラメーター) と高スループット、低レイテンシーの RAG : インテル® Gaudi® AI アクセラレーター
- 汎用の微調整 (< 10B パラメーター) および一般 RAG アプリケーション: AI エンジンを内蔵したインテル® Xeon® プロセッサー
微調整されたモデルを導入する場合、最新のインテル® Xeon® プロセッサーとインテル® Gaudi® AI アクセラレーターは、コスト効率の高い推論を可能にする、最適化された導入プラットフォームを提供します。
ご自身とご自身のチームは、インテル® Tiber™ デベロッパー・クラウドを介して、さまざまなハードウェア・タイプの AI パイプライン全体でパフォーマンスをテストできます。
ソフトウェア・ツール
どちらのカスタマイズ・アプローチでも、ソフトウェア・ツールと開発リソースは、開発と導入で不可欠な役割を果たします。適切なツールがなければ、特にハードウェアの異種混合を扱う場合に、開発時間が長くなり、導入中に問題が発生する可能性があります。
これらの課題を解決するために、インテルは AI のエンドツーエンドの開発ポートフォリオを提供しています。インテルのリソースとツールのコレクションは、最適化された結果をもたらす生成 AI の構築、拡張、導入を支援します。
例えば、最適化された PyTorch ライブラリーにより、ほんの数行のコードで PyTorch 向けの最新のインテルのソフトウェアおよびハードウェアの最適化を活用できます。
RAG アプローチを通じてカスタマイズを追求する場合、LangChain、LLamaIndex、インテルラボの fastRAG などの統合 RAG フレームワークは、取り組みを合理化し、加速させます。RAG フレームワークにより、パイプライン全体で AI ツールチェーンを統合し、実際のユースケース向けにテンプレート・ベースのソリューションを提供できます。
インテルは、インテルのハードウェアの全体的なパイプライン・パフォーマンスを最大限に高めるために、最適化を提供しています。例えば、fastRAG は、インテル® Extension for PyTorch と Optimum Habana を統合し、インテル® Xeon® プロセッサーとインテル® Gaudi® AI アクセラレーターで RAG アプリケーションを最適化します。
一方、OpenVINO™ ツールキットは、導入において不可欠な役割を果たします。これは、精度を維持し、モデル・フットプリントを削減して、ハードウェア使用を最適化しながら低レイテンシーと高スループットで AI 推論を加速するオープンソース・ツールキットです。このツールキットは、コンピューター・ビジョンや大規模言語モデルだけでなく、生成 AI のディープラーニングの開発と統合を合理化します。
RAG アプリケーションでは、ハードウェア・リソースの LLM 推論を最大限に高めるための最適化ライブラリーをいくつか提供しています。インテル® oneAPI ライブラリーは、PyTorch や TensorFlow などの人気の AI フレームワークの低レベルの最適化を提供しており、インテルのハードウェアで最適化された使い慣れたオープンソース・ツールを使用することができます。
こちらの記事で取り上げたインテルのソフトウェア・リソースやその他多くリソースは、インテル® Tiber™ デベロッパー・クラウドをからお試しいただけます。
また、生成 AI プロジェクト向けの有効化リソースの厳選されたコレクションについては、生成 AI 開発のページを参照してください。
エンタープライズ AI の簡単なコースの図
モデルのカスタマイズや概念実証から導入まで、生成 AI のイニシアチブを進める際に、インテルとグローバル・パートナーのエコシステムが提供するツールとテクノロジーを活用し、効率を最適化してイノベーションを加速することができます。
AI プラットフォームにインテルを選択することで、将来の成功に必要なオープン性と相互運用性を確保しながら、既存のインフラストラクチャーの価値を最大限に高めることができます。信頼性と管理性への投資により、パイプライン全体で AI 運用がさらにスムーズかつシンプルになります。インテルのオープン・プラットフォームと高性能で低 TCO のハードウェアにより、生成 AI を大規模に実現するために必要な柔軟で効率的な導入が可能になります。
Linux Foundation Open Platform for Enterprise AI の一環として、生成 AI テクノロジーとワークフローを効率的に統合するエコシステムのオーケストレーション・フレームワークの開発に取り組んでいます。また、共同開発を通じて、より迅速な導入を可能にし、ビジネス価値を向上させます。インテルの現在の貢献には、イニシアチブを早めるのに役立つ、生成 AI アーキテクチャーが含まれています。
- インテル® Xeon® スケーラブル・プロセッサーとインテル® Gaudi® AI アクセラレーターを搭載したチャットボット
- インテル® Gaudi® AI アクセラレーターを使用したドキュメントの要約
- インテル® Gaudi® AI アクセラレーターにおける画像に対する質問への回答 (VQA)
- インテル® Gaudi® AI アクセラレーターの Visual Studio コード生成向けに設計されたコピロット
インテルの生成 AI モデルのカスタマイズを今すぐ始める
生成 AI は、製造業からヘルスケア、小売業まで、ほぼすべての業界で、企業組織に劇的な変化をもたらす呼び水となっています。
組織と AI アプリケーションに必要な独自の AI 機能を実現するために、微調整と RAG は、市場投入までの時間を短縮し、ROI を実現するための大きな道筋を提供します。今日の主要な基礎モデルと、専用のインテル® AI ポートフォリオを組み合わせて使用することで、組織での生成 AI の成功を容易にし、合理化し、加速することができます。