P-cores 搭載インテル® Xeon® 6 プロセッサーを理解する: AI および分析ワークロード向けに開発されたプロセッサー
P-cores 搭載インテル® Xeon® プロセッサー 6700 シリーズは、P-cores 搭載インテル® Xeon® 6 製品の完全版ともいえる製品です。演算負荷の高い AI や HPC のユースケースから、ミッションクリティカルなリレーショナル・データベースや分析アプリケーションまで、データセンターのパフォーマンスに対する要求はこれまで以上に高まっています。インテル® Xeon® 6 プロセッサーは、P-core および E-core (Efficient-core) の 2 種類の製品ラインを通じた、さまざまなワークロードをターゲットとした性能向上により、IT チームを支援するように開発されています。
P-core は、演算負荷の高い AI、HPC、データサービスのワークロードを加速する内蔵マトリクスエンジンを搭載したハイパースレッド化したコアにより差別化されます。一方、E-core 搭載製品では、シングルスレッド・コアの高密度を重視してマトリクスエンジンを省略しています。
あらゆるインテル® Xeon® 6 プロセッサーは、P-core または E-core に関係なく、同じ命令セット、BIOS、および内蔵 I/O アクセラレーター (インテル® クイックアシスト・テクノロジー (インテル® QAT)、インテル® データ・ストリーミング・アクセラレーター (インテル® DSA)、インテル® インメモリー・アナリティクス・アクセラレーター (インテル® IAA)、インテル® ダイナミック・ロードバランサー (インテル® DLB) など) を備えています。
また、サポートしているドライバー、オペレーティング・システム、アプリケーションも同一で、データセンターが頼りにしている信頼性、可用性、保守性 (RAS) 機能についても変わりはありません。
P-core 搭載インテル® Xeon® 6 プロセッサーの利点を確認する
企業は、言語、ビジョン、画像認識、レコメンドシステム用の最先端の AI モデルを導入するコストと時間を節約し、HPC を駆使したシミュレーションと高度な分析から、より詳細なインサイトを生成することを目指しています。P-cores 搭載インテル® Xeon® 6 プロセッサーは、革新的なマトリクスおよびベクトルエンジン、超高速メモリーおよび I/O 帯域幅を備えた、多数のハイパフォーマンス・コアを提供することで、企業がこのような機会を活かせるよう支援します。
幅広いワークロードに適したハイパフォーマンスを実装する
最大 128 コア、12 のメモリーチャネル、ソケット当たり 96 の PCIe レーンに拡張可能な柔軟性を備えた P-cores 搭載インテル® Xeon® 6 プロセッサーは、オンプレミスやクラウド環境において、企業のさまざまなアプリケーション要件に対応できます。メモリー帯域幅のボトルネックを軽減したい IT チーム向けに、革新的な MRDIMM (Multiplexed Combined Rank) は最大 8,800MT/s を実現し、タスクを高速に完了することで TCO 削減にも貢献します。内蔵アクセラレーターは、対象とするワークロードをさらに加速し、パフォーマンスと効率性をさらに向上させます。
P-cores 搭載インテル® Xeon® プロセッサー 6700 / 6500 シリーズは拡張性を重視して構築されており、4S / 8S オプションに加えて 1 ソケット SKU のセットも提供されています。マルチソケット・プラットフォームは 1 ソケット当たり 88 レーンであるのに対し、1 ソケット・プラットフォームでは 136 レーンと、周辺機器やストレージデバイス向けの PCIe レーンを増やすことで、シングルソケットでの I/O が大幅に増加しています。このソケット当たりの I/O の向上により、電力 / レイテンシーの非効率性が解消され、プラットフォームのコストをより最適化できます。シングルソケット・プラットフォームで I/O 要件を満たすことができれば、お客様の TCO 改善を実現できます。必要な CPU 数が減ることで、サーバーコストの削減、ワット当たりのパフォーマンスの向上、CPU 当たりのライセンスコストの削減につながります。
CPU の強力な AI パフォーマンスを活用する
P-cores 搭載インテル® Xeon® 6 プロセッサーは、要求の厳しい多くの AI ユースケースをサポートするように設計されています。P-cores は、int8、BF16、FP16 (新規) データタイプをサポートするインテル® アドバンスト・マトリクス・エクステンション (インテル® AMX) などのアクセラレーション機能により、4 世代にわたるインテルの組み込み AI におけるリーダーシップをさらに強化しています。その結果、P-cores は、物体検出から中規模の生成 AI まで、複数の AI モデルのサービスレベル契約 (SLA) の対応に貢献します。また、オープン規格、高いパフォーマンス、RAS 機能、必要に応じて追加可能なアクセラレーターのサポートも実現しています。
P-cores 搭載インテル® Xeon® 6 プロセッサーは、AI アクセラレーション・システムにおいて AI アクセラレーターと組み合わせた最適なホスト CPU オプションとしても機能します。ホスト CPU には、優れた I/O パフォーマンス、高いシングルスレッド・パフォーマンス、高いメモリー帯域幅と容量の提供が求められます。P-cores 搭載インテル® Xeon® 6 プロセッサーがホスト CPU として最適な選択肢である 5 つの理由について、詳細をご覧ください。
汎用ワークロードのワット当たりのパフォーマンスを最適化する
P-cores 搭載インテル® Xeon® 6 プロセッサーは、あらゆる種類のワークロードで優れたパフォーマンスを発揮します。メインストリーム向けのシリーズでは、8~86 コアの幅広い範囲をカバーする製品、デュアル CPU 搭載システムではネットワーク用およびストレージ・アドイン・カード用に最大 176 の PCIe 5.0 レーンを備えた製品、そしてシングル CPU 搭載システムでは最大 136 の PCIe レーンを備えたシングルソケットの製品を提供しています。あらゆるインテル® Xeon® 6 プロセッサーの効率は、サーバーの使用率増加に伴い、スケーラブルなワット当たりパフォーマンスを提供する能力で顕著ですが、これは負荷曲線全体でほぼ線形の電力消費とパフォーマンスを実現します。パフォーマンスが要求されるワークロードの場合、このプラットフォームは、高負荷時に電力を効率的に使用し、タスクを高速に完了できることを意味します。
Performance-core のワークロード・パフォーマンスのメリット:
第 5 世代インテル® Xeon® プロセッサーとの比較:
- 幅広いワークロードでパフォーマンスが平均 40% 向上1
- インテル® AMX を搭載した Llama2 のパフォーマンスが最大 3 倍向上2
- HammerDB MySQL のパフォーマンスが最大 2 倍向上3
- 標準的な 40% のサーバー使用率で、ワット当たりのパフォーマンスが最大 1.58 倍向上4
- データベース分析のパフォーマンスが最大 1.45 倍向上5
- NGINX エッジ・ワークロードのパフォーマンスとワット当たりのパフォーマンスが 1.5 倍向上6
- MRDIMM により、HPCG ベンチマークでパフォーマンスが最大 2.5 倍向上7
第 2 世代インテル® Xeon® プロセッサーとの比較:
- ResNet – 50 BSX (INT8) でパフォーマンスが最大 17 倍向上8
- 一般的なコンピューティング・パフォーマンスが平均 3.9 倍向上1
- 17:1 サーバー・コンソリデーションにおいてインテル® Xeon® プロセッサー 6900 シリーズは、第 2 世代インテル® Xeon® プロセッサーと比較してパフォーマンス・レベルを維持9
- 5:1 サーバー・コンソリデーションにおいてインテル® Xeon® プロセッサー 6700 シリーズは、第 2 世代インテル® Xeon® プロセッサーと比較してパフォーマンス・レベルを維持し、TCO は平均 40% 向上10
競合他社との比較:
- AMD EPYC 9755 と比較して、AI パフォーマンスが平均で最大 2 倍向上11
- AMD EPYC 9655 と比較して、HPCG パフォーマンスが最大 1.52 倍向上12
セキュリティー機能の強化でビジネスの成長に対応する
機密データや規制対象のデータを扱う場合でも、オンプレミス、エッジ、クラウドサーバー全体で新しいビジネスモデルとデータ共有を追求できます。トラステッド・エグゼキューション環境 (TEE) を備えたコンフィデンシャル・コンピューティングは、使用中のデータと AI モデルの保護に役立ちます。P-cores 搭載インテル® Xeon® 6 プロセッサーにより、お客様のビジネス要件や規制要件に最適なコンフィデンシャル・コンピューティング・テクノロジーを選択できます。
P-cores を搭載したインテル® Xeon® 6 の両製品は、インテル® TDX Connect をサポートします。インテル® トラスト・ドメイン・エクステンションズ (インテル® TDX) は、仮想マシン (VM) レベルでワークロードを保護するインテルのコンフィデンシャル・コンピューティング・テクノロジーです。2023 年初頭に開催された Open Confidential Computing Conference (OC3) で初めて発表されたインテル® TDX Connect は、機密 VM と PCI Express 対応デバイス間のシームレスな暗号化通信を可能にします。この機能は、CPU だけでなく、GPU、スマート NIC、ストレージドライブなどの接続デバイスにまで機密使用モデルを拡張するために不可欠です。インテル® TDX Connect は、コンフィデンシャル・コンピューティング・インフラストラクチャーを強化するために設計されたアーキテクチャーのシンプルな拡張機能であり、I/O 仮想化のパフォーマンスも向上します。
インテルは、パートナー・エコシステム全体にインテル® TDX™ Connect 機能の導入を拡大するため、パートナーとの連携を急速に進めています。Microsoft ではすでに、Microsoft Azure インスタンスでインテル® TDX Connect をサポートできるようになることが決まっています。
「インテル® TDX Connect を将来世代の Azure コンフィデンシャル VM に製品化できることを非常に嬉しく思います。Microsoft では、ハードウェア開発者とソフトウェア開発者の間で初期開発が進められています。インテル® TDX Connect は、コンフィデンシャル・コンピューティングのパフォーマンスと拡張性を向上させる Microsoft の取り組みにおいて、大きなマイルストーンとなります。これにより、既存のワークロードや新たなワークロードにおいて、価格やパフォーマンスに妥協することなく、コンフィデンシャル・コンピューティングのプライバシー保証の恩恵を受けることができます。」
Vikas Bhatia、Microsoft Azure Confidential Computing 製品責任者
さらにインテルは、インテル® TDX Connect を支える PCIe プロトコルをサポートするよう、他のデバイスおよびアクセラレーター・ベンダーと積極的に協力しています。これにより、インテル® TDX ベースのコンフィデンシャル・コンピューティング機能をさまざまなお客様のニーズに合わせて拡張できます。
- アプリケーションの分離: インテル® ソフトウェア・ガード・エクステンションズ (インテル® SGX) は、使用中のデータを保護するために設計されたアプリケーションの分離機能を提供します。インテル® SGX は、現在市場で最も研究され、更新されているデータセンターのコンフィデンシャル・コンピューティング・テクノロジーです。
- 仮想マシン (VM) レベルの分離: インテル® トラスト・ドメイン・エクステンションズ (インテル® TDX) は、VM レベルでの分離と機密性を提供します。インテル® TDX の機密 VM 内で、ゲスト OS および VM アプリケーションは、プラットフォーム上のクラウドホスト、ハイパーバイザー、その他の VM によるアクセスから隔離されます。
P-cores に最適化された対象ワークロードを強化する
AI、HPC、リレーショナル・データベースなどのユースケースで、計算負荷の高いワークロードを管理する IT 意思決定者は、P-cores 搭載インテル® Xeon® 6 プロセッサーの導入により、最も大きな影響を受けるでしょう。MRDIMM メモリーのサポートが追加されたことで、インメモリー・データベースや、膨大なメモリー・フットプリントを必要とする大規模言語モデル (LLM) などのユースケースにおけるメモリーアクセスの制約の緩和にも役立ちます。
AI ワークフローを加速して競争力を維持する
P-cores 搭載インテル® Xeon® 6 プロセッサーは、強化されたコア、増強されたメモリー帯域幅、強力なマトリクスエンジンとの組み合わせにより、推論、微調整、検索拡張生成 (RAG) ユースケース用の小規模から中規模の生成 AI モデルをサポートする十分なコンピューティング能力をもたらします。さらに、TensorFlow や PyTorch など、一般的なディープラーニング・フレームワークのメインストリーム・ディストリビューションにはすでにインテル® Xeon® プロセッサーの最適化が組み込まれています。
複雑化が進む HPC の計算とシミュレーションを管理する
内蔵マトリクスエンジンに加えて、P-cores 搭載インテル® Xeon® 6 プロセッサーは、インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) を搭載し、科学シミュレーションに一般的なベクトルベースの数式処理を高速化します。このプラットフォームを搭載したクラスターは、3D レンダリング、科学研究、金融シミュレーション、コンピューター支援エンジニアリングのパワーをフルに解き放ち、結果に至るまでの時間を短縮できます。
新次元のインフラストラクチャーとストレージの最適化を実現する
P-cores および E-cores は、同じハードウェア・プラットフォームを共有しているため、企業は各タイプのコアとシステムを組み合わせて、供給電力の範囲内で、データのプライバシーとデータ主権に関する規制を遵守しながら、インフラストラクチャー内の多様なワークロードを管理できます。高い演算能力を持つ P-cores は、SAS など高負荷のビジネス分析ソフトウェアをサポートし、E-cores は、システムのバックアップやソフトウェアのアップデートなど低負荷で高アイドル時間のワークロードを実行するために使用できます。
エッジにおける生産性を向上し、レイテンシーの解消を支援する
高性能なコンピューティング・リソースをエンドユーザーやデバイスに近い場所に配置することで、エッジの生産性とレイテンシーを向上させます。P-cores 搭載インテル® Xeon® 6 プロセッサーは、エッジサーバーへの高度な AI モデルの導入を可能にし、数千もの IoT デバイスから迅速にインサイトを得るために必要な処理能力を提供します。また、136 の PCIe レーンを備えたシングルソケットのオプションでは、1 つのプロセッサーに多くのアドインカードを追加できるため、スペースに制約のある導入環境において、インフラストラクチャーの統合に役立ちます。
高速かつ応答性に優れた分析を維持しながら、リレーショナル・データベースを拡張する
P-core 搭載プロセッサーの高度なベクトルエンジンにより、高度なデータベースや分析のユースケースで一般的な、単一命令、複数データ (SIMD) に偏ったワークロードを効率的に実行できます。また、インテル® Xeon® 6 プロセッサーは、高レベルの非常に低レイテンシーのキャッシュを活用して、リソースの競合に伴う遅延を回避するのにも役立っています。このプラットフォームとインテル® QAT などのアクセラレーターを備えた、汎用性の高い構成では、複雑なデータタイプの分析と保存の際に、迅速に結果を得ることができます。
インテル® Xeon® 6 プロセッサーに関する詳細
E-cores および P-cores 搭載インテル® Xeon® 6 プロセッサーの両方を導入することには、多くのメリットがあります。両方の技術的および競争上の利点をよりよく理解するには、この Prowess Consulting による分析をダウンロードしてお読みいただき、インテルの担当者にお問い合わせください。