Forrest Norrod氏（SVP and GM, Enterprise, Embedded, and Semi-Custom Business Group, AMD）。テーマはデータセンターなので，ゲーム用途と直接の関係はない

Naplesは32C64Tのサーバー向けCPU

32bitアーキテクチャを採用するx86系CPUとの互換性を維持しながら64bitアーキテクチャへ拡張させた「x64」（AMD64）

x64系CPUにおける仮想化技術「AMD-V」

x86系の異種混合マルチプロセッサ計画「Fusion」と，その結実としてのAPU

CPUとGPUといった異なるプロセッサ間でメモリ空間の一貫性を維持しつつデータを高速にやり取りする仕組み「HSA」（Heterogeneous System Architecture）

CPU側にメモリコントローラを統合するプロセッサ

CPUあたり8chのメモリアクセスに対応する

NaplesのPCI Express Gen.3レーン数はなんと128

サーバー向けとしては2-way構成が基本となり，その場合は64コア128スレッド対応システムとして稼働することになる。2ソケット間のデータインタフェースはInfinity Fabricだ

Radeon Instinct搭載のGPUサーバー用としても期待されるNaples

「DDR4メモリの容量512GB環境が構築できるのはNaplesだけ」ということで，Xeon E5-2699A V4ではメモリ不足エラーが出てしまった

GPGPU専用カードであるRadeon InstinctとNaplesの相性はいいというアピール。カードを4枚搭載しても，すべてがフル帯域でホストCPUと接続可能だ

※11：20頃追記

AMDから販売計画に関する情報のアップデートが入ったため，記事をアップデートしました。

北米時間2017年3月7日，AMDは次世代サーバー向けCPUである「」（ネイプルス，開発コードネーム）を2017年第2四半期に出荷すると発表し，また追加の製品情報を明らかにした。Naplesは，国内販売が始まっている新世代コンシューマ向けCPU「Ryzen 7」と同じ，「Zen」マイクロアーキテクチャをベースとするプロセッサだ。正式発表ではないため，最終製品名は未公表。発売は2017年第2四半期と予告されているが，今回はそんなNaplesの何がこのタイミングで明らかになったのか，2月に米サンフランシスコで開催となった事前説明会の内容をレポートしたい。登壇したのは，AMDでサーバー部門を統括し，Naples計画を指揮した（フォーレスト・ノーロッド）氏だ。Norrod氏ははじめに，近代CPUやその周辺技術の開発において，AMDが常に先端を切り開いてきたと強調した。具体的な内容は以下のとおりだ。そしてNorrod氏は「今回もまたAMDが最初にやってのけた！」と力強く述べたところで，Naplesが1チップで32基のCPUコアを統合し，SMT（Simultaneous Multi-threading）により64スレッドに対応することをあらためて表明している。これ自体は新情報ではないが（ 関連記事 ），「1チップで32コアを統合するx86系CPUはこれが初めて」なのは確かなので，強調したいということなのだろう。今回Norrod氏は，CPUのダイやパッケージの写真は公開しておらず，CPUの実体像は不明だ。Ryzenのように，4コアを「CPU Complex」（CCX）という1モジュールにまとめて，それを8基搭載するデザインなのかどうかも明らかにはなっていない。一方，CPUあたりのDDR4メモリコントローラが8chアクセス，16モジュール構成に対応することは公表された。メモリコントローラはDDR4-2400対応で，最大メモリ容量は1スロットあたり容量16GBのモジュールを搭載したケースの256GBとなる。1チップあたりのDDR4メモリインターフェースは8チャンネルの16基DIMMスロットに対応する。最大クロックは2400MHz。最大メモリ容量は1スロットあたりに16GB DIMMを搭載したときの256GBとなる。いわゆるノースブリッジ機能に相当するI/O機能も統合。PCI Express Gen.3レーン数は128と膨大だ。サーバーシステムとしては2ソケット構成まで対応するとのことで，1システムなら64コア128スレッド対応のシステムを構築できることになる。2-way構成の場合，PCI Express Gen.3のレーン数は1ソケットあたり64，2ソケットの合計で128という仕様になるそうだ。最大メモリ容量は単純に2倍の512GBとなる。なお，2つのソケットの互いのCPU間のデータのやりとりには， Ryzenで初採用となった「Infinity Fabric」 を採用している。「実際にどのくらい性能があるのか」についてAMDは，超多次元配列で持たせた3Dベクトルデータに対する演算を10回行わせるベンチマークを実際に実行し，完了までの速度比較を競合製品と行うことで誇示した。このような，「ベクトルデータの配列構造」を対象にする多次元グリッド計算は，地震学や気象学などの自然科学技術シミュレーション，医療技術や新薬開発のシミュレーション，建築学や機械工学，熱力学における構造解析では定番の計算モデルである。さて，最初のテストは，「500×1408×1408の3次元配列で管理される約10億個のベクトルデータを読み出して計算する」というものを，NaplesとXeon E5-2699A V4で比較するものだ。ここでは44コア88スレッド，DDR4-1866と条件を揃えたが，結果は，Naplesが比較対象に対して約半分の時間で計算を終えていた。続くテストは，データセットは変えず，Naplesはスペックに遠慮なしの64コア128レスレッド，DDR4-2400アクセスするというのものだ。こうなるとNaplesは，Xeon E5-2699A V4に対して2.5倍の速度性能を示す。最後は，直前のテスト条件から，取り扱うデータサイズだけ，2000×1408×1408の3次元配列で管理される約40億個のベクトルデータとしたものになるが，Xeon E5-2699A V4では，メモリ不足エラーが出て実行不能という結果に。これは「Naplesのほうがより大きいデータセットを扱える」ことのアピールというわけである。ちなみにNaples側の計算時間は，データ規模の拡大倍率分長くなるだけで済んでいた。地味な画面のテストではあったが，大規模データに対する計算速度，扱えるデータ量の限界値の高さという，現在のサーバーに求められる性能において，XeonよりNaplesのほうが優れているというアピールだったわけだ。さて，最後にNorrod氏は，発表済みのGPGPU専用GPUカード「Radeon Instinct」とNaplesの相性が抜群であると述べている。グラフィックス描画においては，描画コマンドを解釈してからGPU側で処理が“爆発”するので，CPUとGPU間のバス消費はPCI Express Gen.3の8レーン程度でも問題ないというのがAMDの見解だ（ 関連記事 ）。しかしGPGPU用途では，処理する対象データそのものをCPUとGPUとでやりとりする頻度が上がるため，GPUとはPCI Express Gen.3の16レーンで接続したほうがよい。その点Naplesのシステムならば，PCI Express Gen.3は128レーンも出ているので，仮に4基のRadeon Instinctを16レーン4で接続しても，また半分残っているというわけである。デスクトップPC市場でRyzen 7がちょっとしたセンセーションを巻き起こしたばかりのタイミングだが，今後AMDは，サーバー市場にも大きな波風を立てるかもしれない。今から要注目だ。