インテル® アクセラレーション・スタック (インテル® Xeon® CPU&FPGA対応) コア・キャッシュ・インターフェイス (CCI-P) リファレンス・マニュアル

ID 683193
日付 11/04/2019
Public
ドキュメント目次

1.2. 概要

CCI-Pは、アクセラレーター・ファンクショナル・ユニット (AFU) のホスト・インターフェイス・バスであり、個別のヘッダーとデータワイヤーを備えます。これは、AFUをFPGA内のFPGAインターフェイス・ユニット (FIU) に接続するためのものです。このドキュメントでは、CCI-Pプロトコルと信号インターフェイスを定義します。これには、リクエストタイプ、ヘッダー・フォーマット、タイミング図、およびメモリーモデルの定義が含まれます。

CCI-P信号とプロトコルのほかに、このドキュメントでは次の内容を説明します。
  1. CCI-Pに準拠するAFUをデザインするために必要な必須AFUレジスター
  2. デバイス・フィーチャー・リスト (DFL)—モジュラーデザインおよび、ソフトウェアからのAFUフィーチャーの容易な列挙を促進するレジスター構成の標準
  3. インテル® FPGAベーシック・ビルディング・ブロック (BBB)—ハードウェア・モジュールとソフトウェア・モジュールで構成される再利用可能なFPGAライブラリーを定義するアーキテクチャー

CCI-Pは、PCIeやUPIなどのさまざまなプラットフォーム・インターフェイスの上に実装可能な抽象化レイヤーを提供します。それにより、CCI-Pに準拠するAFUの相互運用をプラットフォーム間で可能にします。

次の表は、AFUに向けたCCI-Pインターフェイス固有の機能をまとめています。

表 5.   CCI-Pの機能
機能 説明
MMIOリクエスト—AFU I/Oメモリーに対するCPUの読み出しおよび書き込み
  • MMIO読み出しペイロード—4B、8B
  • MMIO書き込みペイロード—4B、8B、64B
    • MMIO書き込みは、x86書き込み結合バッファーによって結合することができます。
    • 64BのMMIO書き込みには、64Bの書き込みを生成可能なCPUが必要です。
    • FPGA統合プラットフォームのCPUは、AVX512を使用して64BのMMIO書き込みを生成できます。
メモリーリクエスト
メモリーに対するAFUの読み出しまたは書き込み
  • アドレス指定モード—物理アドレス指定モード
  • アドレス指定幅 (CLにアライメントされたアドレス)—42ビット (CLアドレス)
  • データ長—64バイト (1 CL)、128バイト (2 CL)、256バイト (4 CL)
  • バイトアドレス指定—サポートされていません
FPGAキャッシュヒント (FPGA統合プラットフォームのみ) AFUは、FIUに対して特定の状態でCLをキャッシュするようリクエストすることができます。VL0に向けられるリクエストの場合、FIUはヒントとしてリクエストされた状態でデータのキャッシュを試みます。VH0およびVH1でのキャッシュ・ヒント・リクエストは、WrPush_Iを除き無視されます。
注: キャッシュヒントは単なるヒントであり、最終的なキャッシュ状態を保証するものではありません。キャッシュヒントを無視することはパフォーマンスに影響しますが、機能的に影響はありません。
  • <request>_I—キャッシュを行う意図はなし
  • <request>_S—共有状態 (S) でのキャッシュを要求する
  • <request>_M—変更済みの状態 (M) でのキャッシュを要求する
仮想チャネル (VC)

AFUには、仮想チャネルとして物理リンクが提供されます。AFUは、各メモリーリクエストに対して仮想チャネルを選択できます。

  • VL0—低レイテンシー仮想チャネル (UPIにマッピングされます)。 (FPGA統合プラットフォームのみ)
  • VH0—高レイテンシー仮想チャネル (PCIe0にマッピングされます)。この仮想チャネルは、大規模なデータ転送を処理するために調整されています。
  • VH1—高レイテンシー仮想チャネル (PCIe1にマッピングされます)。この仮想チャネルは、大規模なデータ転送を処理するために調整されています。(FPGA統合プラットフォームのみ)
  • 仮想オート (VA)—FIUは、利用可能な物理リンクすべてにわたって最大の累積帯域幅を達成するために最適化されているポリシーを実装します。
    • レイテンシー—高い分散が見込まれます
    • 帯域幅—高い定常状態の帯域幅が見込まれます
UMsg (FPGA統合プラットフォームのみ) CPUからAFUへの順序付けされていない通知です。
  • UMsgデータペイロード—64B
  • サポートされるUMsgの数—AFUあたり8
応答順序 順不同の応答
アップストリーム・リクエスト 利用可