製品と性能に関する情報
1旧世代のプロセッサーと BF16 搭載インテル® DL ブーストをサポートする第 3 世代インテル® Xeon® スケーラブル・プロセッサーを比較した際、画像分類の ResNet-50 スループットで AI トレーニング・パフォーマンスを最大 1.93 倍向上。
新しい構成: 1 ノード、4 x 第 3 世代インテル® Xeon® Platinum 8380H プロセッサー (試作版 28 コア、250 W)、総メモリー 384GB (24 x 16GB、3,200GHz)、800GB インテル® SSD ドライブ、ResNet-50 v1.5、ucode 0x700001b、インテル® ハイパースレッディング・ テクノロジー (インテル® HT テクノロジー) 有効、インテル® ターボ・ブースト・マックス・テクノロジー 有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642769358b388d8f615ded9c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、ImageNet データセット、oneDNN 1.4、BF16、BS=512、インテルが 2020年5月18日にテストを実施。
ベースライン: 1 ノード、4 x インテル® Xeon® Platinum 8280 プロセッサー、総メモリー 768GB (24 x 32GB、2,933GHz)、800GB インテル® SSD、ucode 0x4002f00、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、ResNet-50 v1.5。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388d8f615ded0c213f10c99a、Model Zoo:
https://github.com/intelai/models -b v1.6.1、ImageNet データセット、oneDNN 1.4、FP32、BS=512、インテルが 2020年5月18日にテストを実施。
2FP32 を使用した旧世代のプロセッサーと BF16 搭載インテル® DL ブーストをサポートする第 3 世代インテル® Xeon® スケーラブル・プロセッサーを比較した際、画像分類の ResNet-50 スループットで AI トレーニング・パフォーマンスを最大 1.87 倍向上。
新しい構成: 1 ノード、4 x 第3 世代インテル® Xeon® Platinum 8380H プロセッサー (試作版、28 コア、250 W)、総メモリー 384GB (24 x 16GB、3,200GHz)、800GB インテル® SSD、ucode 0x700001b、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、ResNet-50 v1.5。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388e8r615ded0c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、ImageNet データセット、oneDNN 1.4、BF16、BS=56、5 インスタンス、28 コア / インスタンス、インテルが 2020年5月18日にテストを実施。
ベースライン: 1 ノード、4 x インテル® Xeon® Platinum 8280 プロセッサー、総メモリー 768GB (24 x 32GB、2,933GHz)、800GB インテル® SSD、ucode 0x4002f00、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、ResNet-50 v1.5。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388d8f615ded0c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、ImageNet データセット、oneDNN 1.5、FP32、BS=56、4 インスタンス、28 コア / インスタンス、インテルが 2020年5月18日にテストを実施。
3旧世代のプロセッサーと BF16 搭載インテル® DL ブーストをサポートする第 3 世代インテル® Xeon® スケーラブル・プロセッサーを比較した際、自然言語処理の BERT スループットで最大 1.7 倍の AI トレーニング・パフォーマンスの向上。
新しい構成: 1 ノード、4 x 第3 世代インテル® Xeon® Platinum 8380H プロセッサー (試作版、28 コア、250 W)、総メモリー 384GB (24 x 16GB、3,200GHz)、800GB インテル® SSD、ucode 0x700001b、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、BERT-Large (QA)。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388e8r615ded0c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、Squad 1.1 データセット、oneDNN 1.4、BF16、BS=12、インテルが 2020年5月18日にテストを実施。
ベースライン: 1 ノード、4 x インテル® Xeon® Platinum 8280 プロセッサー、総メモリー 768GB (24 x 32GB、2,933GHz)、800GB インテル® SSD、ucode 0x4002f00、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、BERT-Large (QA)。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388d8f615ded0c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、Squad 1.1 データセット、oneDNN 1.5、FP32、BS=12、インテルが 2020年5月18日にテストを実施。
4旧世代の FP32 搭載プロセッサーと BF16 搭載インテル® DL ブーストをサポートする第 3 世代インテル® Xeon® スケーラブル・プロセッサーを比較した際、自然言語処理の BERT スループットで最大 1.9 倍の AI 推論パフォーマンスの向上。
新しい構成: 1 ノード、4 x 第3 世代インテル® Xeon® Platinum 8380H プロセッサー (試作版、28 コア、250 W)、総メモリー 384GB (24 x 16GB、3,200GHz)、800GB インテル® SSD、ucode 0x700001b、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、BERT-Large (QA)。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388e8r615ded0c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、Squad 1.1 データセット、oneDNN 1.4、BF16、BS=32、4 インスタンス、28 コア / インスタンス、インテルが 2020年5月18日にテストを実施。
ベースライン: 1 ノード、4 x インテル® Xeon® Platinum 8280 プロセッサー、総メモリー 768GB (24 x 32GB、2,933GHz)、800GB インテル® SSD、ucode 0x4002f00、インテル® HT テクノロジー有効、インテル® ターボ・ブースト・テクノロジー有効、Ubuntu 20.04 LTS 実行、Linux 5.4.0-26,28,29-generic、BERTLarge (QA)。スループット:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base、commit#828738642760358b388d8f615ded0c213f10c99a、Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、Squad 1.1 データセット、oneDNN 1.5、FP32、BS=32、4 インスタンス、28 コア / インスタンス、インテルが 2020年5月18日にテストを実施。