古いバージョンのブラウザーを使用しています。MSN を最適にご利用いただくために、サポートされているバージョンをご使用ください。

Zenコアの「EPYC」でサーバー市場奪還を目論む AMD CPUロードマップ

ザテレビジョン のロゴ ザテレビジョン 2017/05/22
Zenコアの「EPYC」でサーバー市場奪還を目論む AMD CPUロードマップ © KADOKAWA CORPORATION 提供 Zenコアの「EPYC」でサーバー市場奪還を目論む AMD CPUロードマップ

 AMDは5月16日(日本では5月17日の午前5時)、投資家向けとなるFinancial Analyst Dayを開催し、この内容をウェブキャストで全世界に配信した。ここで新製品の話が出てきたので、分野別にまとめて解説しよう。 サーバー向けCPU“EPYC”は4ダイ構成のMCM  連載400回で解説したZenコアベースのNaplesであるが、このブランド名が“EPYC”(エピック)になったと、CEOのLisa Su氏より明らかにされた。 テーマカラーはシルバーがかったブルーである EPYCチップを示すSu氏 テーマカラーはシルバーがかったブルーである EPYCチップを示すSu氏  このEPYCとRadeon Instinctでサーバー市場に殴り込みをかけよう、というのがAMDのサーバーに向けた基本戦略である。 Radeon InstinctはRadeon Technology GroupのRaja Koduri氏のセッションで細かく出てくる Radeon InstinctはRadeon Technology GroupのRaja Koduri氏のセッションで細かく出てくる  さてそのEPYCであるが、やはり想像通り4ダイ構成のMCM(Multi-Chip Module)であることが明らかにされた。パッケージを見る限りはシリコンインターポーザーは使わない、ただのMCMである。 筆者の推定図(後述)と比較すると斜めのリンクがないが、単に図から省いただけだろう ヒートシンクを外したEPYCチップを示すForrest Norrod氏(の右手) 筆者の推定図(後述)と比較すると斜めのリンクがないが、単に図から省いただけだろう ヒートシンクを外したEPYCチップを示すForrest Norrod氏(の右手)  筆者の推測が正しければダイの間はそれぞれx8程度のInfinity Fabricで接続されるだけで、後はDDR4、PCIe、それと電源/GNDだけで、HBM(High Bandwidth Memory)のような高速かつバス幅の広いI/Fは使わないため、MCMを利用する必要はないのだろう。  気になるのは、IO Hubに当たるチップが見当たらないことである。あるいはIOハブのみ裏面あるいはパッケージ内配線なのだろうか? 連載400回で筆者が推測したNaplesの構成図 連載400回で筆者が推測したNaplesの構成図  さて、ここからは市場と性能比較の話である。2016年の場合、サーバー市場全体の80%は2ソケット構成となっている。ただ右のグラフを見るとわかるが、性能はもちろんハイエンドの「Xeon E5-269X」が一番高いのだが、出荷量が一番多いのは「E5-264X」、次いで「E5-263X」、「E5-262X」、「E5-265X」という順で並んでおり、要するに出荷量の大半はそれほどコア数の多くないMCC(Mid Core Count)/LCC(Low Core Count)製品に集中しているとする。 右のグラフはウェブキャストでの表示とPDFが異なっており、折れ線の意味が抜けているのだが、この折れ線が出荷数量を示している(縦棒はSPECint_rate_base2006の結果で、ほぼ性能そのもの) 右のグラフはウェブキャストでの表示とPDFが異なっており、折れ線の意味が抜けているのだが、この折れ線が出荷数量を示している(縦棒はSPECint_rate_base2006の結果で、ほぼ性能そのもの)  これを前提に、ライブデモとして「Xeon E5-2650 V4」の2ソケット製品 vs. EPYCの1ソケット製品のベンチマークが行なわれた。デモは8つのVMを立ち上げるというものだが、EPYCの方が早く立ち上げられる、という結果が示された。この1P EPYCのボードも今回紹介されている。 テスト構成。EPYCはPre-Production(量産前の試作製品)だそうだ テスト構成。EPYCはPre-Production(量産前の試作製品)だそうだ 脚注によれば、2つのシステムはどちらも256GBメモリーの構成で、この上でVMware vSphereを利用してUbuntu 17.04が動くVMを8つ起動している 脚注によれば、2つのシステムはどちらも256GBメモリーの構成で、この上でVMware vSphereを利用してUbuntu 17.04が動くVMを8つ起動している インテルと比較して小さい、という話ではあるのだが、実際にはサーバー内部の他のパーツの配置とも絡むため、単純に小さければいいというものでもない。とはいえ最適化すればより高密度な実装が原理上可能という観点では望ましいところである。高さはATXと同じだが、奥行きはATXよりある。またGIGABYTEの印刷が見える インテルと比較して小さい、という話ではあるのだが、実際にはサーバー内部の他のパーツの配置とも絡むため、単純に小さければいいというものでもない。とはいえ最適化すればより高密度な実装が原理上可能という観点では望ましいところである。高さはATXと同じだが、奥行きはATXよりある。またGIGABYTEの印刷が見える  AMDはこれまでボリュームゾーンとして大量に出荷されていたローエンドの2ソケットサーバーを、このEPYC 1Pで置き換えられるとアピールしており、現在のXeon 2ソケットの市場の下側はEPYC 1ソケット、上側をEPYC 2ソケットでカバーできる、としている。 消費電力は、具体的な数字が出ていないので現時点では判断しがたいところ 消費電力は、具体的な数字が出ていないので現時点では判断しがたいところ 逆に言えば4ソケット以上は、EPYCでは手をつけるつもりはない、ということでもある。エントリーの1ソケットは、それこそRyzenでもカバーできるということだろう 逆に言えば4ソケット以上は、EPYCでは手をつけるつもりはない、ということでもある。エントリーの1ソケットは、それこそRyzenでもカバーできるということだろう  最後にロードマップであるが、現在のEYPCは14nmのZenコアベースであるが、これに続いて7nm世代のZen 2、そして7nm+世代のZen 3がそれぞれRome/Milanとして投入される予定になっていることが今回明らかにされた。 Rome/MilanがEPYCブランドになるかどうかを明らかにしない、というより変える可能性がある含みを持たせているのがおもしろいところだ Rome/MilanがEPYCブランドになるかどうかを明らかにしない、というより変える可能性がある含みを持たせているのがおもしろいところだ デスクトップ向けCPUはRyzen MobileとRyzen Proを年内に出荷  Ryzen 7とRyzen 5の発表はAMDにとって非常に大きなインパクトがあった。現時点で出荷数量の55%、売上げの79%が高いマージンの取れるPremium向け製品となっているそうだ。  そのRyzenであるが、第3四半期中にRyzen 3をリリース予定というのは従来発表があった通りである。現時点でマザーボードは92種類、システムも200以上があり、第2四半期からは大手ベンダーのシステムも期待できるとする。 従来Premiumに分類されるのは、競争力のなくなったAMD FXで、Kaveri/GodavariのAPUがメインストリーム/バリュー向けで辛うじてシェアを維持していた程度だったが、Ryzen 7/5は(従来製品と比較して)高い価格にも関わらず販売は好調なままで、これはAMDにとって大きな福音であることは間違いない 従来Premiumに分類されるのは、競争力のなくなったAMD FXで、Kaveri/GodavariのAPUがメインストリーム/バリュー向けで辛うじてシェアを維持していた程度だったが、Ryzen 7/5は(従来製品と比較して)高い価格にも関わらず販売は好調なままで、これはAMDにとって大きな福音であることは間違いない 第2四半期からは大手ベンダーのシステムも期待できるということだが、これに関しては特に目新しい話ではない 第2四半期からは大手ベンダーのシステムも期待できるということだが、これに関しては特に目新しい話ではない  さて、これに続く話であるが、まず今年第3四半期にRyzen Mobileが投入される。当初は2-in-1からゲーミングノートという範囲の製品をターゲットにすることになる。おそらくゲーミング向けのSKUはそのままAll-in-1タイプのデスクトップにも使えることになるだろう。 第3四半期にRyzen Mobileが投入される。ここではモバイル向けとなっているが、従来のAPUの代替という形でデスクトップにも投入されることになる 第3四半期にRyzen Mobileが投入される。ここではモバイル向けとなっているが、従来のAPUの代替という形でデスクトップにも投入されることになる  このRyzen Mobileであるが、連載399回でも解説した通り、統合されるGPUコアはPolaris世代ではなくVega世代になることが改めて確認された。性能に関しては、比較対象がなにしろExcavator+GCNのAPUなので、当然大きく向上するのはある意味当然ではあろう。 Ryzen MobileのGPUコアはVega世代になる。インテルで言えばCore mに相当する超低消費電力製品は当面見送りと思われる Ryzen MobileのGPUコアはVega世代になる。インテルで言えばCore mに相当する超低消費電力製品は当面見送りと思われる 第7世代APUといえばBristol Ridgeの世代で、性能よりも省電力性を追求した世代なので、これに比べて消費電力を50%削減というのは相当がんばった感じだ 第7世代APUといえばBristol Ridgeの世代で、性能よりも省電力性を追求した世代なので、これに比べて消費電力を50%削減というのは相当がんばった感じだ  このRyzen Mobileと同時期に発表されるのがビジネス向けのRyzen Proである。まずはデスクトップ向けのRyzen Proが投入され、年末~来年前半にはモバイル向けとなるMobile Ryzen Proが投入される形だ。このPro版はスペック的になにか違いがあるというよりも、ビジネス向けの長期保証(特にドライバー類のサポート)が付いたモデルで、ビジネスユーザー向けということになる。 Ryzen Proのロードマップ。ビジネス向けが1~2四半期半年ほど遅れて投入されるのは、従来のAPUの時も同じであった Ryzen Proのロードマップ。ビジネス向けが1~2四半期半年ほど遅れて投入されるのは、従来のAPUの時も同じであった  さて、最後に隠し玉的に発表されたのが、ThreadRipperである。今年の夏、ということは8月前後であろうと思うが、HEDT(High-End DeskTop)向けに最大16コア/32スレッドのCPUを投入するという話だ。競合製品は当然インテルの、それも噂されているBasin Fallsと併せて発表されるCore i9になると思われる。 ハイエンド向けのThreadRipper。説明の際に流されたビデオも、一切説明になっていないイメージ的なものだった ハイエンド向けのThreadRipper。説明の際に流されたビデオも、一切説明になっていないイメージ的なものだった  実態としてはEPYCの16/12コアモデルをそのまま持ち込む形になると想像される。おそらくパッケージそのものはEPYCと同じではないだろうか? ただEPYCの場合、4つのダイが搭載されていることを前提に、各ダイから2chづつDDR4が出るので、合計8ch/16DIMM構成となるが、ThreadRipperはおそらく2ダイ構成で4ch DDR4/8DIMMというあたりに落ち着くと思われる。もちろんダイあたり4コアで、4ダイで16コアという構成の可能性も若干は残されている。  このThreadRipperに関しては一切説明がなかった。このあたり、COMPUTEXのタイミングでもう少し細かい情報が出てくるだろうか? 最後に今後のロードマップを紹介しよう。説明の中では直接は触れられなかったが、同時に公開されたロードマップによれば、まず現在のZenに加えて、14nm+を利用するZenがあり、次いで7nmのZen 2、7nm+を使うZen 3が2020年までに投入されるとする。ここで謎なのが14nm+の表記である。 AMD CPUのロードマップ。Zenは2種類のダイがあることになる AMD CPUのロードマップ。Zenは2種類のダイがあることになる  GlobalFoundriesは、14LPE/14LPPの2つのプロセスをすでに立ち上げており、AMDは14LPPを利用してRyzenおよびPolarisを製造、Vegaも第1世代は14LPPを使うはずである。  ただGlobalFoundriesは続く10nmをスキップして、2018年後半にDUV(Deep UltraViolet:遠紫外線)の露光システムを使ってまず7nmを立ち上げ、次いで2019年にはEUV(Extreme UltraViolet:極端紫外線)に露光装置を入れ替える計画である。  このDUV/EUVが順調に行ったとしても、2年近くノードの更新がないことになる。すでにSamsungは10nm FinFETの量産を始めているし、TSMC/インテルもまもなく開始するため、ここでやや見劣りがする。  ひょっとすると、GlobalFoundriesは7nm世代までのつなぎとして、14LPPの改良版を出すつもりがあるのかもしれない。14nm+という表記はまさにそんな感じだ。  ちなみにこれはNVIDIAがVoltaで採用したTSMCの12FFとはおそらく違うものになると思われる。TSMCの12FFは、物理的な構成は16FF+と同じで、ただし高密度ライブラリーが新たに提供されることでロジック密度を上げたものだ。  もともとは16FF+(16nmの量産FinFETプロセス)→16FFC(低価格版)→12FFC(16FFCのスタンダードセルライブラリーを全部高密度版に入れ替えたもの。同じ回路ならより密度を上げられるし、省電力化も図れるが性能は落ちる)→12FF(16FF+に12FFCのライブラリを適用したものらしい)というやや複雑な過程で生まれた、今のところはNVIDIA専用プロセスとなっている。  要するに従来では7.5~10.5トラックだったものを、6トラック以下に切り替えたもので、効率は改善するが高速動作には向かない。実際Voltaの動作周波数がPascalよりもやや落ちてるあたりがこれを物語っている。  話を戻すと、GlobalFoundriesの14nm+がもし高密度版だとすると、ダイサイズの削減にはつながるし、省電力化も図れるだろうが、動作周波数は間違いなく落ちる。それでもシェーダーを増やせば性能があがるGPUはともかく、CPUで無駄にコア数を増やしてもそう性能改善にはつながらないわけで、実際には(14LPE→14LPPのように)微妙に寸法などをいじって性能改善するのであろう。  おもしろいのは、EPYCには14nm+を使ったZenコアが入る予定は今のところないことだろうか。このあたりはまた機会があったら確認してみたい。 Vegaのデモを披露  最後にグラフィックスである。今回はGPU全般ということで、説明の力点はクラフィックスというよりはGPGPU、それもAI向けにやや重点が置かれていたのは、昨今のAIブームからすれば仕方ないところか。まずは昨年のPolarisを振り返り、ビジネス的にもPolarisの功績が大きかったことを示した。 説明にあたったKoduri氏は、“Radeon Rising”の第1章を“Better Basics”としており、いわばボトムラインの底上げをPolarisで図った形だ 説明にあたったKoduri氏は、“Radeon Rising”の第1章を“Better Basics”としており、いわばボトムラインの底上げをPolarisで図った形だ GPU市場のシェアは、299ドル以上の高価格帯で21%→31%に、すべてのデスクトップで20%→28%にそれぞれ改善した。ボトムラインの底上げがこれで実現した GPU市場のシェアは、299ドル以上の高価格帯で21%→31%に、すべてのデスクトップで20%→28%にそれぞれ改善した。ボトムラインの底上げがこれで実現した  その上で、現在は200ドル未満の市場に向けてPolarisを投入しているが、今後はよりマージンの取れる高価格帯に製品を投入するとしている。その武器となるのがRadeon Vegaであるというのはこれまでも紹介されてきた話だ。今回もそのVegaの内部についての細かな紹介はなく、もう少し大きな枠での製品説明だった。 マージン、つまり粗利益だが、Polarisは低価格帯だからやはり粗利益は低めである。粗利全体の66%は、高価格帯製品で取ることになる マージン、つまり粗利益だが、Polarisは低価格帯だからやはり粗利益は低めである。粗利全体の66%は、高価格帯製品で取ることになる 今回もVegaの詳細はなし。ただしHBCC(High Bandwidth Cache Controller)のデモはあった。これは後述する 今回もVegaの詳細はなし。ただしHBCC(High Bandwidth Cache Controller)のデモはあった。これは後述する  まず最初が機械学習関連。Koduri氏曰く、機械学習(特に学習側)に関してはCPUだけでもGPUだけでもダメで、両方のコンビネーションが重要であり、AMDはその両者を提供する唯一の会社であるとした上で、その両者をつなぐキーとなるソフトウェア環境について説明をした後で、実際にRadeon Instinctを利用した性能比較を行なった。 GPUだけでもGPUだけでも、中央の山には登れないという意味をこめたスライド GPUだけでもGPUだけでも、中央の山には登れないという意味をこめたスライド  Radeon Instinctそのものは昨年12月に発表され、PolarisベースのMI6とFijiベースのMI8、それにVegaベースのMI25があることが明らかにされている。今回はそのVegaベースのカードを利用して、DeepBenchを実施した結果を示した。 DeepBenchはBaiduの開発した機械学習のベンチマーク。所要時間が短いほど高速である。まずはIntelのKnight LandingやNVIDIAのM40/P100の成績を示した DeepBenchはBaiduの開発した機械学習のベンチマーク。所要時間が短いほど高速である。まずはIntelのKnight LandingやNVIDIAのM40/P100の成績を示した 次がP100 vs Vegaのスコア。Vegaでは所要時間が100msを切っている 次がP100 vs Vegaのスコア。Vegaでは所要時間が100msを切っている これはライブデモの様子。青がVega、白がP100である。6種類のデモの合計時間が右端の棒グラフとなる これはライブデモの様子。青がVega、白がP100である。6種類のデモの合計時間が右端の棒グラフとなる  このデモに使われたカードが、今回発表になったRadeon VEGA Frontier Editionである。このカードがRadeon Instinctと異なるのは、映像出力も可能なことで、プロフェッショナル向けグラフィックスと機械学習その他の両方をカバーする形になる。ちなみに性能はFP32で約13TFlops、FP16で約25TFlopsとされ、16GBのHBM2を搭載するとする。出荷は6月末とされた。 Radeon VEGA Frontier Edition。右に怪しいネオンが。補助電源は8ピン×2である 「ペーパーローンチでない証拠にカードをご覧に入れたい」(Koduri氏) Radeon VEGA Frontier Edition。右に怪しいネオンが。補助電源は8ピン×2である 「ペーパーローンチでない証拠にカードをご覧に入れたい」(Koduri氏) FP32で大体13TFlopsであるから、先日GTCで発表されたNVIDIAのTesla V100の15TFlops(FP32)には、やや見劣りすることになるが、絶対性能としてはそう大きくは違わないことになる FP32で大体13TFlopsであるから、先日GTCで発表されたNVIDIAのTesla V100の15TFlops(FP32)には、やや見劣りすることになるが、絶対性能としてはそう大きくは違わないことになる  さて今回は個人向けの製品そのものへの言及はなかったが、1つデモとして紹介されたのはHBCCの効用である。HBCCをOnにすると、絶対的なフレームレート(55.8fps vs. 71.6fps)も改善するが、それよりも最小フレームレート(13.7fps vs. 46.5fps)が大幅に改善するのがHBM2をキャッシュとして利用することの強みである、とKoduri氏はアピールした。 実施しているのはRise of the Tomb Raider内蔵ベンチマークの最初のシーンである 実施しているのはRise of the Tomb Raider内蔵ベンチマークの最初のシーンである  ついでにロードマップも紹介しておくと、こちらもCPUと同様に14nm世代でVegaが2製品、7nmでまずNaviが投入され、7nm+を使う製品がさらに予定されているそうだ。この14nm+を使うものは、おそらくVega 2とこれまで呼ばれてきたものであろう。投入時期がいつごろになるのかは現時点では不明である。 まだ7nm+の世代についてはコード名が明らかになっていない まだ7nm+の世代についてはコード名が明らかになっていない  ということで、Financial Analyst Dayの内容をかいつまんでお届けした。具体的な製品はおそらく5月末から開催されるCOMPUTEX TAIPEI 2017で明らかにされるのではないかと思われる。

Zenコアの「EPYC」でサーバー市場奪還を目論む AMD CPUロードマップ

Zenコアの「EPYC」でサーバー市場奪還を目論む AMD CPUロードマップ
© KADOKAWA CORPORATION 提供

ザテレビジョンの関連リンク

ザテレビジョン
ザテレビジョン
image beaconimage beaconimage beacon