インテルのみ表示可能 — GUID: ewa1403532268554
Ixiasoft
4.2.1.1. ツール・オプション
カーネルソースコードに関する追加情報を入手するには、コード内のチャネルアクセス上にマウスを置いてツールチップをアクティブにします。
図 65. Intel FPGA Dynamic Profiler for OpenCL GUI:ソースコードタブツールヒント

重要: カーネルが複数のメモリー動作を実装するハードウェア・リソースを統合するメモリー最適化を実行する場合、メモリー動作ごとに統計データを使用できないことがあります。統計データの1つのセットは、ハードウェアの統合ポイントにマップされます。
カラム | ツールヒント | 変更内容 | メッセージの例 | アクセスタイプ |
---|---|---|---|---|
属性 | キャッシュヒット | キャッシュを使用するメモリーアクセスの数。 キャッシュヒット率が高いと、メモリー帯域幅の使用率が低下します。 |
キャッシュヒット=30% | グローバルメモリー |
アラインメントされていないアクセス | アラインメントされていないメモリーアクセスの割合。 アラインされていないアクセス率が高いということは、非効率的なメモリーアクセスを意味します。効率を向上させるために、カーネルコードのアクセスパターンを変更することを検討してください。 |
アラインメントされていないアクセス=20% | グローバルメモリー | |
静的に融合 | ロードまたはストア・メモリー動作が静的に結合されているかどうかを示す。 一般に、スタティック・メモリー統合は、連続するメモリーアドレスにアクセスする複数のメモリーアクセスを単一のワイドアクセスにマージします。 |
融合 | グローバルまたはローカルメモリー | |
占有の割合 | アクティビティー | 述語チャネルまたはメモリー命令が有効になっている時間の割合(条件付き実行がtrueの場合)。
注: アクティビティーの割合は、命令の占有率よりも小さい可能性があります。
|
アクティビティー=20% | グローバルまたはローカルメモリー、およびチャネル |
帯域幅 | バースト・サイズ | メモリー動作の平均バーストサイズ。 メモリーシステムがバーストモード(例えば内蔵RAM)をサポートしていない場合、バースト情報は使用できません。 |
平均バーストサイズ= 7.6 (最大バースト= 16) |
グローバルメモリー |