Intel® FPGA SDK for OpenCL™: ベスト・プラクティス・ガイド

ID 683521
日付 12/08/2017
Public
ドキュメント目次

4.2.1.1. ツール・オプション

カーネルソースコードに関する追加情報を入手するには、コード内のチャネルアクセス上にマウスを置いてツールチップをアクティブにします。
図 65.  Intel FPGA Dynamic Profiler for OpenCL GUI:ソースコードタブツールヒント
重要: カーネルが複数のメモリー動作を実装するハードウェア・リソースを統合するメモリー最適化を実行する場合、メモリー動作ごとに統計データを使用できないことがあります。統計データの1つのセットは、ハードウェアの統合ポイントにマップされます。
表 10.  Source Codeタブのツールヒントが提供する情報の種類
カラム ツールヒント 変更内容 メッセージの例 アクセスタイプ
属性 キャッシュヒット キャッシュを使用するメモリーアクセスの数。

キャッシュヒット率が高いと、メモリー帯域幅の使用率が低下します。

キャッシュヒット=30% グローバルメモリー
アラインメントされていないアクセス アラインメントされていないメモリーアクセスの割合。

アラインされていないアクセス率が高いということは、非効率的なメモリーアクセスを意味します。効率を向上させるために、カーネルコードのアクセスパターンを変更することを検討してください。

アラインメントされていないアクセス=20% グローバルメモリー
静的に融合 ロードまたはストア・メモリー動作が静的に結合されているかどうかを示す。

一般に、スタティック・メモリー統合は、連続するメモリーアドレスにアクセスする複数のメモリーアクセスを単一のワイドアクセスにマージします。

融合 グローバルまたはローカルメモリー
占有の割合 アクティビティー 述語チャネルまたはメモリー命令が有効になっている時間の割合(条件付き実行がtrueの場合)。
注: アクティビティーの割合は、命令の占有率よりも小さい可能性があります。
アクティビティー=20% グローバルまたはローカルメモリー、およびチャネル
帯域幅 バースト・サイズ メモリー動作の平均バーストサイズ。

メモリーシステムがバーストモード(例えば内蔵RAM)をサポートしていない場合、バースト情報は使用できません。

平均バーストサイズ= 7.6

(最大バースト= 16)

グローバルメモリー