インテルのみ表示可能 — GUID: ivu1504810590919
Ixiasoft
2.3.3. loop_coalesceを使用してネストループによって消費されるエリアの削減
ループが3つ以上の深さにネストされると、より多くのエリアが消費されます。
ネストされたループのレイテンシーを削減する方法を説明するためにorigとlc_testカーネルを使用する次の例を検討してください。
origカーネルはネストされたループを4の深さまでがあります。ネストされたループは、次のレポートに示すように、変数が保持されているためにエリアを消費する余分なブロック(ブロック2,3,4,6,7,8)を作成しました。
図 21. Loop Coalescingの前後のArea ReportおよびSystem Viewer
ループの合体により、 lc_testのレイテンシーが短縮されていることがわかります。 origカーネルのブロック5とlc_testカーネルのブロック12は、最も内側のループです。
図 22. lc_testとorigカーネルのエリアレポート