インテルのみ表示可能 — GUID: ewa1399320399299
Ixiasoft
4.2.2. カーネル実行タブ
Kernel ExecutionタブIntel FPGA Dynamic Profiler for OpenCL GUIは、カーネルプログラム全体の実行プロセスをグラフィカルに表示します。 これは、各カーネルの実行時間を示し、異なるカーネル実行間の相互作用についての洞察を提供します。
たとえば、低速のネットワーク・ディスク・アクセスでネットワーク・ディレクトリーからホスト・アプリケーションを実行すると、ランタイムがプロファイル出力データをディスクに格納している間に、GUIはカーネル起動間の遅延を表示できます。
重要: カーネルの実行とホスト・アプリケーション全体の実行時間の増加を防ぐため、ローカルディスクからホスト・アプリケーションを実行してください。
図 66. Intel FPGA Dynamic Profiler for OpenCL GUIでのKernel Executionタブ

水平の棒グラフは、カーネルの実行時間を表します。最初のエントリー(fft1d)に示されている2つのバーの組み合わせは、合計時間を表します。 2番目と最後のエントリーは、時間間隔を占めるカーネルの実行を示します。これらのバーは、 output_kernelとinput_kernelの同時実行を表し、カーネルがメモリー帯域幅などの共通リソースを共有していることを示します。
ヒント: 特定の実行時間のプロファイル・データを調べることができます。上の例では、fft1dの左側のバーをダブルクリックすると、その特定のカーネル実行イベントのプロファイル・データを表示する別のウィンドウが開きます。
Kernel Executionタブには、ホストとデバイス間のメモリー転送に関する情報も表示されます。
図 67. カーネル実行タブ:ホストデバイスのメモリー転送情報

重要: 拡大または縮小して拡大率を調整すると、時間スケールの粒度が微妙に変化することがあります。
メモリー転送情報の表示をイネーブルするには、環境変数ACL_PROFILE_TIMERを値1に設定し、ホスト・アプリケーションを実行します。 ACL_PROFILE_TIMER環境変数を設定すると、メモリー転送の記録が可能になります。この情報はprofile.monファイルに格納され、Intel FPGA Dynamic Profiler for OpenCL GUIによって解析されます。