12/8コア Opteron 6000シリーズで新たなパフォーマンスの領域へ

 2010年3月29日、AMDは新世代のOpteron 6000シリーズを発表した。"Magny-Cours"という開発コード名で知られていたこのOpteron 6000シリーズは、新しいSocket G34というパッケージで提供されるほか、対応するチップセットも一新され、プラットフォームも新しいものに切り替わった。新たなプラットフォームでは残念ながら従来のSocket FとのHW互換性はなくなってしまったが、最新のテクノロジーに対応するためあえて互換性を犠牲にしなくてはならない理由がそこにはある。

AMD Opteron(TM)プロセッサロードマップ

 1つ目の理由は、新たなサーバー向け製品のラインナップ構築である。元々サーバー向けの製品は、1P/2P/4P以上、というカテゴリー分けがなされていることが多かった。AMDも例外ではなく、オリジナルのSocket 940や、その後継のSocket FのOpteronの場合 ・Opteron 1xx/1xxx : 1Pサーバー向け
・Opteron 2xx/2xxx : 2Pサーバー向け
・Opteron 8xx/8xxx : 4P以上のサーバー向け
という3つのカテゴリーに分類された形で製品が提供されてきた。ここで問題になったのは、1P→2Pはそれほどプロセッサそのものの価格も、あるいはプラットフォームの価格も大きくは変わらないのに、2P→4P以上では大きく跳ね上がることが多かった点だ。もちろんプラットフォーム側は、2Pまでと4P以上では複雑さが格段に違うし、求められる機能も変わるので致し方ない部分も多かった。が、ことプロセッサに関しては、2Pと4P以上で大きくは変わらなくなりつつある。にも関わらず4P以上では高い価格付けが、これまでの慣習としてまかり通っていた。AMDではこれを"4P TAX"と呼んでいる。

 Opteron 6000シリーズはこの価格構造にメスを入れ、4P TAXの撤廃を目指した。今回発表のOpteronから、ラインナップは
・Opteron 4xxx : 1P/2Pサーバー向け
・Opteron 6xxx : 2P/4Pサーバー向け
と変更になった。Opteron 4000シリーズはローエンドのワークステーションから、それほど高い性能の要らないサーバーまでをカバーし、Opteron 6000シリーズがメインストリームのサーバーをエントリ向けからハイエンドまで幅広くカバーする形になる。もちろん1Pサーバーと4Pサーバーでは、当然プラットフォームの価格は変わってくるが、プロセッサの価格に関しては、それが2Pか4Pかはもはや関係がない。

 これまでも、例えば4P構成のプラットフォームに当初は2PだけCPUを装着して出荷、後からCPUやメモリを増強して4P構成にできるというアップセルのアイディアは多く出てきたが、実際にはこの"4P TAX"のお陰で、当初の2P構成システムのコストが高すぎて、実際には導入がほとんど進まないケースは多かった。しかし今後は現実的な価格での提供が可能になる。

 更に言えば、Opteron 6000シリーズは12/8コアの構成だから、従来のプロセッサ換算でいえば2倍のコアに相当する。つまりOpteron 6000シリーズの2Pというのは従来の4P相当、4Pというのは従来の8P相当になる計算だ。4Pの性能を2Pの価格で、あるいは8Pの性能を4Pの価格で利用可能になる、というわけだ。

 「なぜこの時期にプラットフォームを入れ替えるのか」という問いに対する直接的な答えが、DDR3メモリである。既にPC向けのメモリマーケットはDDR3メモリがメインストリームに切り替わり、DDR2メモリはむしろ割高になっているが、サーバー向けのRegistered/ECC DIMMに関しては、まだDDR2メモリの方が割安の状況が続いていた。少し専門的な話になるが、PC向けのメモリチップは、通常スポット市場と呼ばれる取引形態で入手されることが多く、サーバー向けのメモリチップはコントラクト市場と呼ばれる取引形態で入手される。コントラクト市場は、メモリチップベンダーとDIMMのベンダーが長期供給契約を結ぶ方式で、信頼性や供給保障が得やすい反面、価格の変動は緩やかである。一方スポット市場は過剰生産品などが流通するもので、価格は変動しやすいが品質はまちまちで、原則として長期供給保障などはない。そのため、メーカーのブランド品はコントラクト市場から、ノーブランド品はスポット市場からメモリチップを入手しているわけだが、先に書いた「DDR3がメインストリーム」というのはスポット市場での話であった。

 ところが2009年後半から、コントラクト市場でもDDR3メモリの価格がDDR2と大きな差がなくなってきた。しかも技術的には
・生産プロセスの進歩のため、より大容量のメモリチップを使いやすい
・DDR2(1.8V)よりも低い1.5Vの電圧で動作するので、省電力
・更に電圧を下げた(1.35V)DDR3Lの規格も決まりつつある
と優れた点が多く、大容量のメモリをより低い消費電力で利用できるDDR3は、PC向けよりもむしろサーバーに適したメモリとすらいえる。価格差がほとんどなくなってきた今だからこそ、DDR3を使い始めるには最適な時期であり、これが「今プラットフォーム」を入れ替える最大の理由といえる。

 ちなみにOpteron 6000シリーズの場合4chのメモリバスを搭載しており、各々のメモリバスに3本までDIMMを装着できる。4GB DIMMならばCPU1個あたり48GB、8GB DIMMなら96GBものメモリが利用可能であり、2P構成なら192GB、4P構成ならば384GBもの物理メモリを理論上は利用できる計算だ。仮想化環境やHPC環境など、とにかく大量のメモリを必要とするニーズにしっかり応えることができるだろう。

Socket G34 “Maranello” Platform

 付け加えるならばこのメモリ構成は、ハイエンドからローエンドまで全く同じである。ローエンドはメモリの動作周波数が下がるとか、メモリチャネルの本数が減るといったこともなく、どのメモリチャネルにもDDR3-1333 Registered DIMMを3本装着してフルスピードで動作させられる。単に容量だけではなく、利用できるメモリ帯域もまた大幅に向上していることがわかる。

利用可能なメモリ帯域

 これもまた広義には、"4P TAX"撤廃の一環とも言えるだろう。

 Opteron 6000シリーズの第一世代は、表に示すとおり8コアと12コアの製品があり、1.7GHz〜2.4GHzまでの動作周波数がラインナップされる。従来のOpteron同様、標準品以外に高性能向けのSEと低消費電力のHEが用意され、HPCなど高いスレッド当たりの性能を必要とする向きから、通信機器向けサーバーのように低い消費電力と多スレッド対応が求められる向きまで、様々な用途に最適な製品を選ぶことが可能である。

 性能自身も向上している。グラフは、6コアのOpteron 2435(2.6GHz駆動)と8コアのOpteron 6136(2.4GHz駆動)、それと12コアのOpteron 6174(2.4GHz駆動)の3つの製品について、SPECint 2006とSPECfp 2006の結果をまとめたものである。もちろんコアの数が多いから6コアより8コア、8コアよりも12コアの性能が高いのは当然であるが、単純にコアの数だけで比較すると、例えば6コア→8コアでは33%しか向上しないし、実際には動作周波数が下がっているからその分も勘案すると性能差は23%程度に留まるはずである。これは6コア→12コアも同じで、理論上は70%程度の性能差なるはずである。こうした理論値を超える性能改善は、より帯域の広いバンド幅でメモリを接続できることが効果的に作用した結果といえる。

SPEC、SPECint、SPECfpは、Standard Performance Evaluation Corporation の商標です。AMD Opteron(TM) プロセッサ・モデル 6174のベンチマーク結果は、Standard Performance Evaluation Corporationへ提出された2010年3月17日現在のデータに基づきます。AMD Opteron(TM) プロセッサ・モデル 6138のデータは、推定値に基づきます。上記のその結果はhttp://www.spec.org/cpu2006/results/に公開されている2010年3月17日現在のデータを反映しています。上記の比較は、AMD Opteron(TM) プロセッサ・モデル 2435、6136および6174とIntel Xeon プロセッサ・モデル X5570およびX5680を搭載した2ソケット・サーバーの最高値に基づきます。最新のSPECint(R)_rate2006およびSPECcfp(R)_rate結果については、http://www.spec.org/cpu2006/results/を参照してください。価格は、AMD 1KUトレイの予定プライジングとwww.intel.comに公開されている2010年3月17日現在のIntel 1KUトレイの予定プライジングを反映しています。

 またシステム構造も非常に柔軟である。2P及び4Pの典型的な構成を図にまとめたが、これはあくまで典型的な例でしかない。Opteron 6000シリーズは最大6.4GT/sec(25.6GB/sec相当)で通信できるHyperTransport 3のLinkを4本搭載しており、これを使うことで例えば4P構成なら全てのCPU同士が1-Hopで接続できるし、2P構成でもう少しI/Oが欲しいと思えば、各CPUにもう一つずつSR5960を接続して、2倍のレーン数のPCI Express Gen2を利用することもできる。HyperTransport Linkの数が増えたことで、ユーザーニーズに合わせてのより柔軟なマシン構成が、性能を犠牲にせずに実現することになる。

2P及び4Pの典型的な構成

 またこの新しいSR5960には、AMD-VIと呼ばれる新しい仮想化支援機能も搭載される。これは従来IO-MMUと呼ばれていたものである。従来AMD-Vで提供されていた仮想化支援機能は、仮想マシンからメモリアクセスを行う際の高速化を実現したが、AMD-Viでは仮想マシンからI/Oデバイスに対するアクセスを高速化できる。これにより、従来以上に仮想マシンの性能向上が期待できるというものだ。これは特にクラウドなどの用途に大きな威力を発揮するだろう。

 あえて安定したSocket Fのプラットフォームを捨て、新しいSocket G34プラットフォームに移行したことで、こうした数多くのメリットがもたらされることになった。もちろんこの新しいプラットフォームは、2011年に予定されている32nm SOIプロセスを使った"Bulldozer"という次世代アーキテクチャ搭載製品でもそのまま利用できることが明らかにされている。長らく利用されてきたプラットフォームを刷新するのに十分な性能と機能を持った、新しいSocket G34プラットフォームを存分に生かせるのが、Opteron 6000シリーズといえるだろう。


(2010年3月29日)
[Text by 大原 雄介]

<関連情報>
■日本AMD株式会社
http://www.amd.co.jp/
■「今ここにある」6コア AMD Opteron(TM) プロセッサプラットフォーム
http://ad.impress.co.jp/special/amd1003/enterprise/

<関連記事>
■日本AMD、12コアを搭載した最新プロセッサ「Opteron 6100シリーズ」
http://enterprise.watch.impress.co.jp/docs/news/20100329_357681.html
■AMD、最大12コアを内蔵したMagny-CoursことOpteron 6100シリーズ
http://pc.watch.impress.co.jp/docs/news/20100329_357660.html
■【仮想化道場】2〜4ソケットサーバーで使える低価格・12コアの「Opteron 6100」
http://enterprise.watch.impress.co.jp/docs/series/virtual/20100330_357638.html