FPGAi
カスタム・ソリューションの AI 支援を加速。 継続的イノベーションに必要な低レイテンシー、エネルギー効率、俊敏性を実現するために、FPGAi がカスタム・ソリューションで AI を有効にして導入する方法について説明します。
Altera® FPGA での AI の新時代を導く
FPGA と AI の融合は単なる進化ではなく、まさに革命です。
Altera は、ハイパフォーマンスで AI を搭載した FPGA ファブリックにより、FPGAi の新たな時代を実現します。緊密に統合されたプログラマブル・ロジックと AI は、リアルタイムのデータの適応と自律的な意思決定を可能にし、次世代の複雑性を実現するシステムを装備しています。AI 向け FPGA を選ぶ理由
AI ワークロードの複雑化が進み、要求が厳しくなってきているため、AI アクセラレーションに最適なハードウェアを選択することが重要です。FPGA が AI アプリケーション向けの強力で柔軟なソリューションをどのように提供できるかをご覧ください。
エッジ AI およびマシンラーニング・アプリケーションの実装に FPGA が適している理由
エッジおよびカスタム AI アプリケーションにおける FPGA ベースの AI 推論、およびインテルのエッジ FPGA AI 向けのソフトウェアおよびハードウェア・ソリューションの新たなユースケースについてご覧ください。
ディープラーニング向け FPGA と GPU の比較
すべてのマシンラーニングおよびディープラーニング・アプリケーションに最適な単一のアーキテクチャーはありませんが、FPGA は GPU やその他のタイプのハードウェアに比べて明確な利点を提供できます。
FPGA 推論向けの量子化ニューラル・ネットワーク
ニューラル・ネットワークの低精度の量子化は、同じフットプリントで、より高いスループットを実現したり、リソースの使用量を削減したりすることで、AI アプリケーションの仕様をサポートします。
パートナーが、エッジにおける AI を加速する
Altera のパートナーが、FPGA 上で AI ワークロードを加速するのにどのように役立つかについては、これらのビデオをご覧ください。
FPGAi アプリケーション
エッジ AI
FPGA は、さまざまな産業、医療、試験および計測、航空宇宙、防衛、放送などのアプリケーションにおけるエッジ AI に最適です。統合された Arm プロセッサー、Nios® V ソフト・プロセッサー、およびエッジで多様なデータをサポートする多様な IO プロトコルは、確定的な低レイテンシー、低消費電力、および長寿命と相まって、 FPGA にエッジでのさらなるメリットをもたらします。
GenAI またはカスタム
Agilex™ 7 FPGA Mシリーズは、カスタムのトランスフォーマー・ベースの LLM 推論に使用でき、出力とサイズで GPU を凌駕します。
32GB の HBM2E で 820GBps、最大 512GB の DDR5 で 224GBps を実現し、LLM および KVのキャッシュに最適です。高速 SERDES (116 Gbps)、800 GbE サポート、PCIe 5.0 (64GBps) により、迅速なスケーリングとデータ転送を実現します。このデバイスの可変精度 DSPは、FP16、bfloat16、INT8 などの AI 推論に適したフォーマットをサポートします。Hyperflex™ アーキテクチャーが、高速 AI 推論のための 500MHz 以上の動作を実現します。AI アタッチ
800GbE をサポートすることで、FPGA が AI NIC として動作し、トレーニング中や推論中の データ取り込みジッターやネットワーク混雑を軽減する、AI クラスター・クリエーター向けのカスタマイズされたソリューションを設計できます。スケールインおよびスケールアウトのカスタムおよびオープン・スタンダードのオプションがサポートされています。
FPGA は AI の前処理に最適で、AI トレーニングや推論で効率的に使用できるように、データのフォーマットやフィルタリングを行います。 FPGA は、社内のエンタープライズ・データベースを加速し、高速なデータ検索を実現します。ソリューション機能: ハイパフォーマンス FPGA
89 個の INT8 TOPS、パッケージ内の HBM2e メモリー容量 (32GB、帯域幅 820Gbps)、および強化された DDR5/LPDDR5 メモリー・コントローラー (5600MBP 対応) を搭載した Agilex™ 7 FPGA M シリーズは、生成 AI LLM ベースのトランスフォーマー・モデルなど、メモリーに依存する AI モデルのボトルネックを緩和します。
最大 56 個の INT8 TOP を持つ Agilex™ 5 FPGA デバイスは、より高いコンピューティング密度を実現するために AI テンソル・ブロックを組み込んだ初の FPGA ファブリックを備えています。テンソル・ブロックは、1 つのクロックサイクルで 20 個の BlockFP16 または INT8 乗算を実行できるため、Agilex™ FPGA ポートフォリオの他のデバイスと比較してコンピューティング密度が 5 倍増加します。
開発者の有用性: シームレスなトレーニング済みモデル変換と FPGA リソースの自動最適化
FPGA AI スイートは、OpenVINO を使用して、トレーニング済みモデルを AI 推論 IP にプッシュボタン変換します。このスイートの自動オプティマイザー・ツールは、AI モデルの最適な実装のために設計スペースをスイープします。 FPGA AI スイート IP のソフトウェア・エミュレーションには、OpenVINO プラグイン・インターフェイスからアクセスでき、ハードウェアを必要とせずに、FPGA AI IP の精度を迅速に評価できます ( Agilex™ 5 FPGA でのみ利用可能)。 FPGA AI スイートは、Quartus® Prime 開発ソフトウェアおよびプラットフォーム・デザイナーを統合し、AI 推論 IP の組込みを簡素化します。アプリケーションの俊敏性: 継続的なイノベーションを実現
エンジニアは、FPGA を使用して AI ソリューションを構築し、進化させることが可能です。これにより、継続的なイノベーションと適応を可能にするデバイス 1の再プログラマビリティー、製品ライフサイクルの延長、および汎用性を備えた I/O オプションを使用して、テクノロジーの最先端に立ち続けることができます。 FPGA は本質的に、AI に適しています。FPGA の何千もの DSP ブロック、メモリー階層、広範な I/O サポートにより、デザインのカスタマイズや、最適なパフォーマンスを達成するための AI ネットワークの構築を基礎から実現できます。 電力効率の高い TinyML から、エッジでの中規模および大規模モデル、データセンターでの GenAI LLM Transformer モデルまで、さまざまなサイズの AI モデルを効率的に実装できます。

