インテルのみ表示可能 — GUID: ewa1399469100533
Ixiasoft
1. インテル® FPGA SDK for OpenCL™ の概要
2. インテル® FPGA SDK for OpenCL™オフライン・コンパイラーのカーネル・コンパイル・フロー
3. ソフトウェア、コンパイラー、カスタム・プラットフォームに関する一般的な情報の取得
4. FPGAボードの管理
5. OpenCLカーネルの構築
6. ホスト・アプリケーションの設計
7. OpenCL カーネルのコンパイル
8. OpenCLカーネルのエミュレーションとデバッグ
9. カーネルのreport.htmlファイルのレビュー
10. OpenCLカーネルのプロファイリング
11. インテル® Code Builder for OpenCL™ を使用するOpenCL™アプリケーションの開発
12. インテル® FPGA SDK for OpenCL™ のアドバンスト機能
A. OpenCL機能のサポート状況
B. インテル® FPGA SDK for OpenCL™ プロ・エディション・プログラミング・ガイドの改訂履歴
3.1. ソフトウェア・バージョンの表示 (version)
3.2. コンパイラー・バージョンの表示 (-version)
3.3. インテル FPGA SDK for OpenCL ユーティリティー・コマンド・オプション・リストの表示 (help)
3.4. インテル FPGA SDK for OpenCL オフライン・コンパイラー・コマンド・オプション・リストの表示 (引数なし、-help、-h)
3.5. 利用可能なFPGAボードとカスタム・プラットフォームのリスト表示 (-list-boardsおよび-list-board-packages)
3.6. OpenCLバイナリーのコンパイル環境の表示 (env)
5.1. カーネルの命名ガイドライン
5.2. データの処理効率を最適化するためのプログラミング手法
5.3. ローカル・メモリー・サイズへのポインターの最適化に向けたプログラミング手法
5.4. インテル® FPGA SDK for OpenCL™ チャネル拡張の実装
5.5. OpenCLパイプの実装
5.6. 任意精度での整数の実装
5.7. 条件付きコンパイルにおける定義済みプリプロセッサー・マクロの使用
5.8. __constantアドレス空間修飾子の宣言
5.9. 構造体データ型をOpenCLカーネルに引数として含める
5.10. レジスターの推論
5.11. 倍精度浮動小数点演算の有効化
5.12. 単一ワークアイテム・カーネルに向けた単一サイクル浮動小数点アキュムレーター
5.13. 整数のプロモーション規則
6.6.2.1. ホスト・アプリケーションとKhronos ICD Loader Libraryのリンク
6.6.2.2. ホスト・アプリケーションをコンパイルするためのフラグの表示 (compile-config)
6.6.2.3. OpenCLホスト・ランタイム・ライブラリーおよびMMDライブラリーへのパスの表示 (ldflags)
6.6.2.4. OpenCLホスト・ランタイム・ライブラリーおよびMMDライブラリーのリスト表示 (ldlibs)
6.6.2.5. OpenCLホスト・ランタイム・ライブラリーおよびMMDライブラリーに関する情報の表示 (link-config または linkflags)
7.1. ハードウェアのコンフィグレーション・ファイルを作成するためのカーネルのコンパイル
7.2. ハードウェアを構築せずに行うカーネルのコンパイル (-c)
7.3. ハードウェアを構築せずに行うカーネルまたはオブジェクト・ファイルのコンパイルおよびリンク (-rtl)
7.4. ヘッダーファイル位置の指定 (-I=<directory>)
7.5. インテル® FPGA SDK for OpenCL™オフライン・コンパイラーの出力ファイル名の指定 (-o <filename>)
7.6. 特定のFPGAボードとカスタム・プラットフォームに対するカーネルのコンパイル (-board=<board_name>) および (-board-package=<board_package_path>)
7.7. カーネルコンパイル時のハードウェア生成フィッティング・エラーの解決 (-high-effort)
7.8. カーネルのFmaxターゲットのスケジュール指定 (-fmax=<fmax target in MHz>)
7.9. カーネル・パラメーターを指定するためのプリプロセッサー・マクロの定義 (-D<macro_name>)
7.10. コンパイル進捗レポートの生成 (-v)
7.11. リソース推定使用率要約の画面表示 (-report)
7.12. インテル® FPGA SDK for OpenCL™オフライン・コンパイラーの警告メッセージの抑制 (-W)
7.13. インテル® FPGA SDK for OpenCL™オフライン・コンパイラーの警告メッセージのエラーメッセージへの変換 (-Werror)
7.14. コンパイラー・レポートのデバッグデータの削除および.aocxファイルのソースコードの削除 (-g0)
7.15. グローバルメモリーのバーストインターリーブの無効化 (-no-interleaving=<global_memory_type>)
7.16. グローバルメモリーのリング型相互接続の強制 (-global-ring)
7.17. グローバルメモリーへの書き込みスループット向上に向けたストアリングの複製 (-duplicate-ring)
7.18. コンスタント・メモリー・キャッシュ・サイズのコンフィグレーション (-const-cache-bytes=<N>)
7.19. 浮動小数点演算処理順序の緩和 (-fp-relaxed)
7.20. 浮動小数点演算における丸め処理の削減 (-fpc)
7.21. OpenCLコンパイルの高速化 (-fast-compile)
7.22. カーネルのインクリメンタル・コンパイル (-incremental)
7.23. メモリーの誤り訂正符号をともなうカーネルのコンパイル (-ecc)
7.24. ハードウェアのカーネル呼び出しキューの無効化 (-no-hardware-kernel-invocation-queue)
7.25. ハンドシェイク・プロトコルの変更 (-hyper-optimized-handshaking)
8.1. 高速エミュレーターの設定
8.2. エミュレーションに向けたチャネル・カーネル・コードの変更
8.3. エミュレーションに向けたカーネルのコンパイル (-march=emulator -fast-emulator)
8.4. OpenCLカーネルのエミュレーション
8.5. LinuxにおけるOpenCLカーネルのデバッグ
8.6. インテル® FPGA SDK for OpenCL™ Emulatorの制限
8.7. ハードウェアとエミュレーターの結果の不一致
8.8. 高速エミュレーターの環境変数
8.9. 高速エミュレーターでサポートされている拡張機能
8.10. 高速エミュレーターの既知の問題
8.11. レガシー・エミュレーターの使用
12.1.1. RTLモジュールとOpenCLパイプラインの理解
12.1.2. OpenCLライブラリーに向けたOpenCLヘルパー関数ファイルのパッケージ化
12.1.3. OpenCLライブラリーに向けたRTLコンポーネントのパッケージ化
12.1.4. RTLモジュールの検証
12.1.5. 複数のオブジェクト・ファイルのライブラリー・ファイルへのパッケージ化
12.1.6. OpenCLカーネルコンパイル時のOpenCLライブラリーの指定
12.1.7. シミュレーションによるOpenCLライブラリーのデバッグ (プレビュー)
12.1.8. シンプルな関数で動作するOpenCLライブラリーの使用 (例1)
12.1.9. 外部メモリーと動作するOpenCLライブラリーの使用 (例2)
12.1.10. OpenCLライブラリーのコマンドライン・オプション
12.1.1.1. インテルFPGA SDK for OpenCLパイプラインのアプローチの概要
12.1.1.2. RTLモジュールのインテル FPGA SDK for OpenCLパイプラインへの統合
12.1.1.3. ストールのないRTL
12.1.1.4. RTLモジュール・インターフェイス
12.1.1.5. Avalon Streaming (Avalon-ST) インターフェイス
12.1.1.6. RTLリセットおよびクロック信号
12.1.1.7. RTLモジュールのXML構文
12.1.1.8. RTLモジュールと外部メモリーの通信
12.1.1.9. RTLモジュールに入るスレッドの順序
12.1.1.10. RTLモジュールのOpenCL Cモデル
12.1.1.11. RTLモジュールとパーシャル・リコンフィグレーションにおける潜在的な非互換性
インテルのみ表示可能 — GUID: ewa1399469100533
Ixiasoft
6.3. カーネル実行中におけるプロファイル・データの収集
カーネルの実行がホスト・アプリケーションの完了後に終了する場合、カーネルの実行中にプロファイル・データを収集するよう、FPGAに対し明示的に要求することができます。 ほとんどのアプリケーションでは、カーネルの実行完了時にプロファイル・データを自動的にリードバックするデフォルトの動作で十分です。
コンパイル中にOpenCL™カーネルをプロファイリングすると、profile.monファイルが自動的に生成されます。その後プロファイル・データは、FPGAでカーネルの実行が完了した後にprofile.monに書き込まれます。ただし、カーネルの実行がホスト・アプリケーション終了後に完了した場合、そのカーネル呼び出しのプロファイル情報は、profile.monファイルに存在しなくなります。この場合、プロファイル情報をカーネルの実行中に取得するようホストコードを修正することができます。
重要: カーネルの実行中にプロファイル・データを収集すると、カーネルのレイテンシーが増加し、カーネルの実行にかなりのオーバーヘッドが追加される可能性があります。
カーネルの実行中にプロファイル・データを収集するようFPGAに要求するには、次のホスト・ライブラリー呼び出しを呼び出します。
extern CL_API_ENTRY cl_int CL_API_CALL clGetProfileInfoIntelFPGA(cl_event);
上記cl_eventは、カーネルのイベントです。このホスト・ライブラリー呼び出しに渡すカーネルイベントは、clEnqueueNDRangeKernel呼び出しに渡すものと同じである必要があります。
重要:
- clGetProfileInfoIntelFPGAの呼び出し前にカーネルの実行が完了した場合、この関数はイベント・エラー・メッセージを返します。
- clGetProfileInfoIntelFPGAおよびclGetProfileDataDeviceIntelFPGA関数呼び出しを使用しているホストプログラムには、CL/cl_ext_intelfpga.hヘッダーファイルを含む必要があります。
注意:
カーネルの実行中にclGetProfileInfoIntelFPGA関数を呼び出すと、プロファイル・カウンターが一時的に無効になり、 インテル® FPGA Dynamic Profiler for OpenCL™ がFPGAからデータを収集できるようになります。そのためいくつかのプロファイル情報がこの中断中に失われます。この関数を非常に短い間隔で呼び出すと、プロファイル・データがカーネルの実際のパフォーマンス動作を正確に反映しない可能性があります。
次のホストコードを例に説明します。
int main() { ... clEnqueueNDRangeKernel(queue, kernel, ..., NULL); ... clEnqueueNDRangeKernel(queue, kernel, .. , NULL); ... }
このホスト・アプリケーションは、カーネルが2回起動した後に完了するという前提で動作します。カーネルの呼び出しごとに1組のプロファイル・データが生成されるため、profile.monファイルには合計2組のプロファイル・データが生成されます。カーネルの実行中にプロファイル・データを収集するには、ホストコードを次のように変更します。
int main() { ... clEnqueueNDRangeKernel(queue, kernel, ..., &event); //Get the profile data before the kernel completes clGetProfileInfoIntelFPGA(event); //Wait until the kernel completes clFinish(queue); ... clEnqueueNDRangeKernel(queue, kernel, ..., NULL); ... }
clGetProfileInfoIntelFPGAへの呼び出しにより、profile.monファイルに新しいエントリーが追加されます。 インテル® FPGA Dynamic Profiler for OpenCL™ GUIはその後、レポートにこのエントリーを解析します。
インテル® FPGA Dynamic Profiler for OpenCL™ についての詳細は、次の章を参照ください。
- インテル® FPGA SDK for OpenCL™ : ベスト・プラクティス・ガイドのパフォーマンスのボトルネックを特定するためのカーネルのプロファイリング
- OpenCLカーネルのプロファイリング