京都大学における HPC パフォーマンスの強化

京都大学の学術情報メディアセンター (ACCMS) は、その科学的研究のスピードおよび効果を拡張するためにインテル® Xeon® CPU マックス・シリーズの性能を最大活用しています。

概要:

  • 京都大学の学術情報メディアセンター (ACCMS) は、計算科学研究向けに複数の HPC システムを有し、コンピューティングおよびメディアの学術研究をサポートしています。

  • 最適化の継続的な追求が、同センターをインテルとの連携に導きスーパーコンピューティング・システムのアップデートに至りました。最新のインテル® Xeon® CPU マックス・シリーズを用いて、新しいシステムの設計はバランスに優れた HPC インフラにおいてユーザーが求める優れたメモリー帯域性能を満たし、メモリー容量の拡張が可能、そして優れた並列処理性能を発揮するものです。

技術的な革新の前線にあり学業水準に秀でる京都大学は、先進のコンピューティングおよびメディア研究の拠点である、学術情報メディアセンター (ACCMS) の母体です。ACCMS は、長年にわたり最先端のコンピューティング・リソースを介し、画期的な科学的研究や開発を推進する中心を担ってきました。その継続的な進化は、技術的革新の最前線にあり続ける決意の現れであり、コンピューティング研究の限界への挑戦でもあります。

こうした進化の中で、特定の課題の継続が明白になりました。研究プロセスに欠かせない複雑なシミュレーション・コードの多くは、既存のハイパフォーマンス・コンピューティング (HPC) リソース内のメモリー帯域幅による制約に直面しています。簡単に言えば、これらのコードがメモリーから読み書きできる速度が制限要因として浮上し、全体的なパフォーマンスに影響を与えているのです。

このメモリー帯域幅の制限は、計算科学研究者の継続的な課題です。コードのパフォーマンスを最大化するために、研究者はこの制約のある中でコードを最適化する方法を模索していました。これには、メモリーのより効率的な使用、HPC システムのメモリー階層に適合しやすいコードの調整、もしくはメモリー帯域幅への依存を低減する新しいアルゴリズムや手法の開発をも含みます。

この最適化の追求は、京都大学をスーパーコンピューティング・システムのアップデートにおけるインテルとの連携に導きました。最新のインテル® Xeon® CPU マックス・シリーズを用いた新しいシステムは、バランスに優れたハイパフォーマンス・コンピューティング (HPC) インフラ内で、非常に優れたメモリー帯域性能、メモリー容量の拡張、そして効率に優れた並列処理性能などのユーザーの要求を満たします。

「私たちは京都大学で使われるアプリケーション向けにユーザーが使い易い CPU を必要としていました。それは高い B/F 値を持つシステム、DDR5 対応かつ大容量メモリーの x86 システムを意味します。この中で高い B/F 値を持つシステムを実現するには、調べたかぎり、インテル® Xeon® CPU マックス・シリーズ以外には存在しませんでした」 - 京都大学 ACCMS コンピューティング研究部門 深沢圭一郎准教授

コンピューティング・リソース強化の必要性

効果的な科学研究において、結果の生成を速めることは不変の目標です。実行時間の短縮という要求以外にも、研究者は多くの重要な課題に取り組んでいます。超えるべきハードルは多岐にわたり、データ管理や分析の複雑さから、ひいては先進コンピューティング・リソースの必要性に及びます。研究者はこれらの課題を理解したり対処することがとても重要で、科学的研究の加速やイノベーションの促進につながります。

コンピューティングの急速な進化は、より高速で大規模な演算に対する需要を増大しています。京都大学においては、複雑化が進みコンピューティングの需要が増加し、より強力なリソースの必要性が明らかになりました。このような先進のリソースは、より短時間で結果を出し、研究の生産性の推進に必要なコンピューティング・パワーの提供に不可欠でした。しかし、実行時間の高速化の要求とは別に、重要な課題、ノード当たりのメモリー帯域幅を増やす必要性が生じます。ワークロードが増加し、より大きなスケールでタスクを処理する必要があるからです。

「研究成果の促進を求め、研究者は継続的に、より迅速かつ大規模なプログラムの実行に取り組んでいます」と京都大学 ACCMS コンピューティング開発部門准教授の深沢圭一郎氏は説明し、さらに「研究者はノード当たりに十分なメモリー容量があることも重要視しています」と付け加えた。

ソリューションとの出会い

科学的結果をすばやく得るために、処理速度を速めることやメモリー容量の拡大が重視され、それは研究コミュニティーの継続的な取り組みを反映しています。複雑さを増しデータ負荷の高い科学的課題への取り組みにおいて、計算科学システムの効率や能力の拡張は重要です。京都大学が ACCMS の HPC システムのアップデートに着手したときに求めていたものは、まさにこれです。

「数年前、当センターの主な HPC システムは、インテル® Xeon Phi™ プロセッサー 7250 を用いた構成でした。この構成は 16GB の MCDRAM を搭載し、ノードあたりのピークパフォーマンスは 3 TFlops、帯域幅はユニット当たり約 400GB/s を持ち、B/F 値は 0.1333になりました。この値は当時の DDR4 メモリーと比較して高い帯域幅を示していました。しかし旧システムの導入から約 5 年が経ち、コンピューター技術の進化は、より高速でより大規模なコンピューティングに対する需要を増大させました。さらに、インテル® Xeon Phi™ プロセッサーでは、CPU コアの問題に起因すると思われる、ベクトル化されていないアプリケーションでのパフォーマンス低下も確認されました」

 京都大学学術情報メディアセンター (ACCMS) の Camphor 3 スーパーコンピューター。

HPC およびスパーコンピューティングにおいては、大規模なシミュレーションや複雑な演算が一般的で、システム性能の最適化には演算能力とデータ転送効率、双方の考慮が必要です。Bytes/Flop 値 (B/F 値) はシステムがどの程度演算リソースを活用しているかのインサイトを、浮動小数点オペレーションごとに必要なデータの移動量により示します。これを踏まえ、深沢准教授が強調したのは、高い B/F 値を持つ CPU で現在のシステムを拡張することの必要性でした。

そこで深沢准教授の指揮で、ACCMS は新しいシステムの設計に着手しました。それは、ハイパフォーマンス・コンピューティング (HPC) に不可欠な、より高い帯域性能に対する要求に応える先端の技術を取り入れたものです。中核の設計理念の中心は 3 構成システムにあります。「3 構成システムを開始したのは 3 世代前です。我々のユーザのコードが必要とする、優れたメモリー帯域幅を持つ複数コアの演算能力、汎用性、大容量メモリーに焦点を置きました」と深沢准教授は述べています。

図 1.ACCMS の 3 構成システム。

同氏はさらにこの戦略の背景にある目標についても説明します。「3 つのシステムタイプ (図 1) - システム A (Camphor 3)、システム B (Laurel 3)、システム C (Cinnamon 3) - のうち、Camphor 3 は圧倒的多数のユーザーが使用します。これらのユーザーは主に科学演算向けのカスタムビルドのアプリケーションを使用する研究に参加しています。実際、多くのユーザーはこの期間に作られたアプリケーションを元の形で使う事を好みます。つまり、Camphor 3 上で実行されるアプリケーションの 80% 以上が高い B/F 値を必要とします。そのため、この要求を満たす CPU が必要でした」

インテル® Xeon® プロセッサーのパワーが導く優れたパフォーマンス

新たな設計の着手にあたり、深沢准教授とそのチームは最新のテクノロジーを調査し最新のインテル® Xeon® CPU マックス・シリーズのベンチマークを実行しました。これはインテル® Xeon® プロセッサーが特に CPU 性能において最大の価値を提供することから重要でした。インテル® Xeon® CPU マックス・シリーズは、インテル® Xeon® スケーラブル・プロセッサーを高帯域幅メモリー (HBM) で強化し、モデリング、人工知能、ディープラーニング、ハイパフォーマンス・コンピューティング (HPC)、データ分析などのデータ集中型のワークロードにおいてパフォーマンスを増強および検出を高速化する設計です。

インテル® Xeon® CPU マックス・シリーズは、コンパイラー、数学ライブラリー、オープンソース・アプリケーションなどの、幅広いソフトウェア・エコシステムの活用に最適化されています。ほかに主な利点として、インテル® Xeon® CPU マックス・シリーズがシームレスな体験の提供、さまざまなワークロードにおけるベストなパフォーマンスの実現が挙げられます。その性能上の利点に加えて、インテル® Xeon® CPU マックス・シリーズ搭載システムには、総合的なパフォーマンスを強化し研究行程を加速する HBM に対応しています。つまり、研究者は本来の研究に集中でき、コーディングや最適化に多くの時間を費やす必要はないのです。

深沢准教授は、Camphor 3にインテル® Xeon® CPU マックス・シリーズを採用した理由について、次のように説明しています。「京都大学のシステムのアプリケーションには、使い易い CPU が必要でした。つまり、それは高い B/F 値を持つシステム、DDR5 対応かつ大容量メモリーの x86 システムを意味します。この中でも、高 B/F システムを実現するには、調べたかぎりインテル® Xeon® CPU マックス・シリーズ CPU しか存在しませんでした。システムを刷新するにあたり、可能な限り高い B/F 値を備えた構成の選択が不可欠であったため、選択肢は HBM メモリーを搭載した CPU に限られます。その結果、必然的に、インテル® Xeon® CPU マックス・シリーズと、もう 1 つの CPU に絞り込まれました。しかし、演算性能を考えると、もう 1 つの選択肢である CPU では、演算性能がインテル® Xeon® CPU マックス・シリーズの半分程度にしかなりません。ですから、インテル® Xeon® CPU マックス・シリーズは私たちの要求を満たす理想的な選択でした」

「一方、Laurel 3 は Camphor 3 ほど B/F 値のニーズが高くないものの、旧システムより広いメモリー帯域幅の必要性を重視する意見がありました。そこで、DDR5 を使用する可能性を検討し始めたのですが、検討時点では DDR5 を正式にサポートし、必要なパフォーマンスを満たすことができる CPU の選択肢はわずかで、その候補に対しベンチマークを実施しました。最終的には、調達時期やその他の要因を考慮した上で、第 4 世代インテル® Xeon® スケーラブル・プロセッサーが選ばれました」と 深沢准教授は付け加えています。

図 2 は、Camphor 3 が前世代のシステムと比較して平均 4.7 倍の高速化を実現していることを示しています。脚注 1 を参照してください。

図 2.Camphor SPR+HBM と KNL システムの比較。

効果的な結果の提供

新システムの導入により、京都大学ではパフォーマンスの大幅な向上が現れ始めています。深沢准教授によると、「前世代のシステムとの比較において、Camphor 3 では平均 4.7 倍1、Laurel 3 では平均 3.7 倍の高速化をすでに達成しています。」1 (図 2 と図 3)

図 3 は、Laurel 3 が前世代のシステムと比較して平均 3.7 倍の高速化を実現していることを示しています。脚注 1 を参照してください。

図 3.Laurel SPR+DDR と Broadwell システムの比較。

深沢准教授は、インテル® Xeon® CPU マックス・シリーズがいかにパフォーマンスの優位性に貢献するかを強調し、次のように述べています。「当センターでは、プログラム・コーディング支援共同研究を行っています。これは、ユーザーのコードを受け取り、約 1 年間かけて最適化した上でユーザーに提供する行程が含まれます。インテル® Xeon Phi™ プロセッサーの場合は、しばしばパフォーマンスを引き出すためにアプリケーションを最適化する必要がありました。しかし、インテル® Xeon® CPU マックス・シリーズでは、インテルのコンパイラーとマス・カーネル・ライブラリーをそのまま使用するだけで、特別な最適化を行わなわずに容易に高いパフォーマンスを引き出すことができます」

さらに深沢准教授は、インテル® Xeon® CPU マックス・シリーズが研究開発の進化おいてどのように重要な役割を果たすのか例をいくつか挙げています。「私が最近取り組んだプロジェクトの 1 つは、3 次元 MHD シミュレーションによるグローバルな木星磁気圏に解明にかかわるアプリケーションでした。これは高い B/F 値を必要とするアプリケーションで、磁気圏のサイズは膨大で格子間隔が小さいために、時間経過の観察に 1 年以上かかります。しかし、インテル® Xeon® CPU マックス・シリーズを用いて、2 倍以上の速度で結果を得ることができました。もう 1 つの例は、地球温暖化の影響を調査する、さまざまなパラメーターでシミュレーションを行う大気循環モデル (GCM) です。GCM も高い B/F 値を要するアプリケーションで、インテル® Xeon® CPU マックス・シリーズの利点は研究者を助けます。このアプリケーションは、複数のパラメーターによるシミュレーション実行を助け、地球温暖化を緩和する可能性のあるパラメーターの特定が可能です」

将来に向けて

京都大学の ACCMS は、秀でた学術性および革新を導く位置にあり、先進研究における日本のリーダーシップの確立に取り組んでいます。知識および革新の探求に対するゆるぎない努力により、ACCMS はさまざまな分野において効果的な学術研究を継続します。

この取り組みにおいて、技術的リーダシップを持つインテルは、重要な役割を担います。ACCMS に対する強力なサポートを拡張し、インテルは科学、技術そしてさまざまな分野の開拓を助け、学術研究の効果の拡大を目指します。この連携をしながらの挑戦が示すのは、京都大学における学術探求の前進に対する気概に加え、日本国内外の多様な分野を総じた発展や進歩に対する広い貢献をする取り組みでもあります。この連携を通じインテルは触媒として、革新的な進化、イノベーションの育成、そして複数の領域における学術研究の将来を形成に取り組みます。

京都大学が示したマイルストーンの到達に向けてこの連携のさらなる必要性を示し、インテル株式会社 インダストリー事業本部 HPC 事業開発部長の矢沢克己は次のように述べます。「HPC 市場における B/F 値の重要性を十分に理解しています。HBM 実装のメモリー帯域幅に優れたソリューションは必然的に高価です。そのため、インテルは要求を理解しさまざまなメモリー技術を検討しています。近い将来、DDR と同じ形状でほぼ 2 倍のメモリー帯域幅を実現できる MCR-DIMM の提供による、B/F 値の向上を目指します。京都大学の信頼に応えられるよう、インテルは連携の強化を視野に、長期的な関係において HPC/AI 上の HBM ソリューションの要求を満たすロードマップ提供の機会を楽しみにしています」

PDF (英語) をダウンロードする ›