ツールキットの使用中に、モデルの FP32 形式と比較して、FP16 形式でのパフォーマンスOpenVINO™向上なし

コンテンツタイプ: メンテナンス & パフォーマンス | 記事 ID: 000095716 | 最終改訂日: 2023/08/01

詳細解決方法追加情報

環境

OpenVINO 2023年0月 Ubuntu 20.04 LTS インテル® Core™ i7-9850H CPU インテル® UHD グラフィックス 630

詳細

FP32 形式の同じモデルと比較した場合に、より高速な推論を実行する FP16 形式が期待されます。benchmark_appを使用して、両方の形式についてアプリケーションのデフォルト設定で推論を実行しますが、FP16 形式モデルと FP32 形式モデルを比較すると、パフォーマンスの向上 (FPS の上昇) は見られません。

$ omz_downloader --name bert-large-uncased-whole-word-masking-squad-0001
$ benchmark_app -m FP32/bert-large-uncased-whole-word-masking-squad-0001.xml -api async -t 5 -hint throughput -d {CPU, GPU}
$ benchmark_app -m FP16/bert-large-uncased-whole-word-masking-squad-0001.xml -api async -t 5 -hint throughput -d {CPU, GPU}

解決方法

benchmark_appを使用しながらFP32モデルをF32形式で実行するには、選択したデバイスに-infer_precision f32を追加します。

例えば：
$ benchmark_app -m intel/bert-large-uncased-whole-word-masking-squad-0001/FP32/bert-large-uncased-whole-word-masking-squad-0001.xml -d GPU -t 5 -api async -hint throughput -infer_precision f32

追加情報

GPU プラグインの場合、GPU プリミティブの浮動小数点精度は、精度で実行される <圧縮 f16 OpenVINO IR 形式を除き、OpenVINO IR での動作 f16 精度に基づいて選択されます。
CPU プラグインの場合、CPU プリミティブのデフォルトの浮動小数点精度は f32 です。f16 OpenVINO™ IR をサポートするために、プラグインは内部的にすべての f16 値を f32 に変換し、すべての計算は f32 のネイティブ精度を使用して実行されます。bfloat16 計算をネイティブにサポートするプラットフォーム (AVX512_BF16 または AMX 拡張子を持つ) では、パフォーマンスを向上させるために f32 の代わりに bf16 タイプが自動的に使用されます (実行モードのヒントを参照)。

CPU/GPU プラグインのデータタイプの詳細については、次を参照してください。

CPU プラグイン: https://docs.openvino.ai/2023.0/openvino_docs_OV_UG_supported_plugins_CPU.html#floating-point-data-types-specifics
GPU プラグイン: https://docs.openvino.ai/2023.0/openvino_docs_OV_UG_supported_plugins_GPU.html#supported-inference-data-types

免責条項

このページのコンテンツは、元の英語のコンテンツを人力翻訳および機械翻訳したものが混在しています。この内容は参考情報および一般的な情報を提供するためものであり、情報の正確さと完全性を保証するものではありません。インテルは不正確な翻訳があった場合でもいかなる責任を負いません。このページの英語版と翻訳の間に矛盾がある場合は、英語版に準拠します。このページの英語版をご覧ください。

ツールキットの使用中に、モデルの FP32 形式と比較して、FP16 形式でのパフォーマンスOpenVINO™向上なし

環境

詳細

解決方法

追加情報

関連製品

免責条項

ご質問はこちらへ