Marvell®/Cavium ThunderX2®
HPC向けハイエンドArm SoC(System-on-a-chip)「ThunderX2®」 プロセッサ
現在、HPC用途に向けたハイエンドArm SoC(System-on-a-chip)としては、Broadcom社のVulcanプロセッサを元に開発されたCavium社※のThunderX2® プロセッサ ファミリーがあります。
このプロセッサは、メモリ帯域幅と容量に重点を置いて設計されており、8つのDDR4メモリコントローラによりソケット当たり最大16枚のDIMMをサポート(最大2TB)します。デュアルソケットノードで4TBのメモリ搭載量となります。
Cavium社は、Xeon Skylakeプロセッサと比較して、メモリ帯域幅とメモリ容量が 33% 向上したとしています。
特にHPC分野では、メモリ帯域は性能を左右するとても重要なポイントです。
このプロセッサは、Hewlett Packard Enterprise (HPE)、Cray、GIGABYTE、Atos、Ingrasysなど多くのサーバベンダーによって採用されています。
※Cavium社は2018年7月Marvell Technology Group Ltdに買収されました。
FEATUREMarvell®/Cavium ThunderX2®の特徴
Marvell®/Cavium ThunderX2®プロセッサは、64ビット ARMv8.1 ベースのプロセッサで、現在16nmプロセスで製造され、最大32コア2.5GHzの仕様となっています。シングルおよびデュアル ソケット構成が可能で、8つのDDR4メモリコントローラによりソケット当たり最大16枚のDIMMをサポートします。
デュアル ソケット構成でのシステムブロック図
GIGABYTE R281-T94 System
FUNCTIONMarvell®/Cavium ThunderX2®プロセッサの主な機能
高性能なCPUコア機能
- 1コア4スレッドでout-of-order実行可能なコアを、1CPU辺り最大32個搭載。
- NEOMと呼ばれる演算ユニットで128ビットベクトル幅のSIMD命令に対応
- シングルおよびデュアル ソケット構成をサポート。
- 6Tbpsクロスバー経由で接続された低レイテンシL2キャッシュメモリ(32KB L1 / 256KB L2 / 32MB L3)
- 600GbpsのCaviumコヒーレントインターコネクト(CCPI 2)でプロセッサ間を接続
HPC・ハイエンドエンドサーバを想定した周辺機能
- DDR4 2666メモリコントローラを8チャンネル内臓。
4ソケット当たり最大16枚のDIMM、最大2TBの搭載をサポート。 - PCIe Gen3バス コントローラを14基内蔵。
1ソケットで合計56レーンが利用可能。 - 省電力およびシステム制御を行うマネージメント プロセッサを内蔵。
- SATAv3 x2 ポート、USB3.0 x2 ポート、GPIO を内蔵。
- GICv3に適合した割込コントローラ、およびシステム メモリ マネージメント ユニット
(SMMUv3) による I/O の仮想化に対応し、PCIe の SR-IOV もサポート - サーバクラスのRAS(Reliability:信頼性、Availability:可用性、Serviceability:保守性)
機能をサポートと仮想化支援機能を搭載
詳細は、以下をご参照ください。
ThunderX2® Arm-based Processors