スパコンってなにがスーパーなの? 「早さだけを競うものじゃない」スパコンの現在地点を聞いてきた

2021年3月、新型コロナウイルスに関連する「飛沫の広がり方」シミュレーションがニュースとなりました。

これは布や不織布など、人が装着しているマスクの種類によって口からの飛沫の広がり方がどう変化するのかを調べたもの。不織布マスクの効果を再確認するだけでなく、様々なシチュエーションにおける飛沫の飛び方を明瞭に示し、多くの人が感染対策を怠ることのリスクを考えるきっかけになったかと思います。

この研究、およびシミュレーションに役立てられたのがスーパーコンピュータ(以下、スパコン)「富岳」。2021年に本格稼働がスタートした「富岳」は、稼働前に行われたスパコンの世界ランキングで1位を獲得。2011年に1位を獲得したスパコン「京」に続いて、2機目の「世界一のスパコン」となりました。

新型コロナウイルス関連でもニュースでその名前を聞くことが多くなった「富岳」。当時なにかとニュースを賑わせた京など、身近に感じられるようになったスパコン。しかし、「計算が早くできる」「大きな部屋にサーバーがいくつも並んでいる」など漠然としたイメージは持っていても、実際になにがスーパーなのか、私たちはよくわかっていないのでは?

知っていそうでよく知らないスパコンについて、東京大学情報基盤センター・スーパーコンピューティング部門、部門長の中島研吾教授に伺います。


中島 研吾(なかじま けんご)教授
東京大学情報基盤センター、スーパーコンピューティング部門・部門長。同大学院情報理工学系研究科数理情報学教授。専門は計算力学。中島教授が部門長を務める同部門は4台のスパコンを管理・運営しており、企業や研究機関、公共機関の関係者であれば申し込み、利用することができる。
Webサイト:東京大学情報基盤センター スーパーコンピューティング部門

「2位じゃダメ」というわけではない

——いきなりこんな質問になってしまうのですが……。「スーパーコンピュータ」と聞くと、「2位じゃダメなんでしょうか?」(※)を思い出してしまうんです。

中島教授:はい、ありましたね(笑)

※ 2009年の民主党政権時、スーパーコンピュータ京の研究開発予算の妥当性を指摘した、蓮舫議員の発言

——今の「富岳」の活躍を見ると「やっぱり順位も大切なんだ」と思ってしまうのですが、専門家から見ても、やはり2位じゃダメなのでしょうか?

中島教授:それはちょっと難しい問題になるんですよ。そもそも「富岳」は、最初から「TOP500」(※)で世界ランキング1位を目指して作ったマシンではないんです

※ 米国の研究者が世界中のスパコンの性能をテストし、毎年6月と11月の2回発表されているランキング。京は2011年の6月と11月、「富岳」は2020年の6月と11月、2021年の6月に1位を獲得している。性能比較には、共通の状況下で同じ計算処理(ベンチマークテスト)を行い、その結果を比較している

——どういうことでしょう?

中島教授:「富岳」は、開発の準備段階から、様々な実アプリケーションで高い性能を出す「アプリケーションドリブン」を目標に開発が進められていました。

TOP500の順位付けに使用されている、「HPL」、「LINPACK」というベンチマークにおける計算手法は、実際に計算科学、計算工学シミュレーションの現場で使用されているアプリケーションのそれとはやや異なります。「富岳」のターゲットは、ベンチマークではなく実アプリケーションで性能を発揮すること。

▲富士通による「富岳」Web サイトより。2020年より試行開始〜2021より本格稼働スタートした富岳に対して、京は2012年に稼働開始〜2019年に運用終了。およそ7年にわたる京の稼働期間は、他のスパコンと比較するとかなり長寿の部類なのだとか

中島教授:もちろん、様々なアプリケーションで高い性能を発揮するためには、スパコン自体にも十分なスペックが必要です。その結果としてTOP500でも1位が取れた、という状況なんですね。

——「様々な分野への適用」が重要で、TOP500で1位が取れたこと自体は結果でしかない。しかし、使いやすさを追うためには十分な性能も必要、ということですね。

中島教授:このコンセプトの設定には、先代の京の反省も生かされていたんだと思います。

そもそも、「富岳」という名前も「高い頂と広い裾野」、すなわち高い計算性能とともに、「裾野が広い富士山のように、幅広い分野で活用できるように」という由来で付けられたものですから。計算能力ばかりを追い求めるのではなく、スパコンを幅広い分野の多くの人に使ってもらって、世の中に貢献することが重要なんですよね。

——具体的に、アプリケーションドリブンである「富岳」にはどういった特徴があるんでしょうか。

中島教授:大きな特徴は、データ転送能力です。スパコンって送り込まれたデータを処理する「計算スピード」ばかりが注目されがちなんですが、計算に必要なデータを時間あたりどれだけのスピードで計算器に転送できるかという、「メモリバンド幅」も重要です

これは車のエンジンで例えるのがわかりやすいかもしれないです。どんなにエンジンが高性能でも、そこに適切なペースでガソリンを供給できないと、エンジン本来の性能は発揮できませんよね。実際のアプリケーションを動かすにあたっても同じで、いくらスパコン自体の計算能力が早くても、データ転送能力が高くないとそれを生かせないんですよ。

——「計算能力=処理スピード」と同様に、「データ転送能力」も重要なのだと。

中島教授:TOP500でスパコンをランク付けするにあたって、かつて行われていたテスト(LINPACKベンチマーク)ではデータ転送能力は測定していませんでした。極端な言い方をしてしまうと、計算能力さえ高ければいいテスト結果が出るようになっていたんですよ

「TOP500」Web サイトより、2021年6月のランキング。1位には「Supercomputer Fugaku」の文字が

——本来は計算能力だけで性能を見てはいけないのに。

中島教授:そういった問題を踏まえて、現在ではデータ転送能力も測れるような新しいベンチマークテスト(HPCG)も行われるようになっています。ちなみに「富岳」は、どちらのベンチマークテストでも現在世界1位ですよ。

——素晴らしい。

中島教授:確かに、こういったランキングで1位を取れるのは喜ばしいことです。しかし、「俺は『富岳』を使ってるぞ」と自慢できるくらいで、使う人にとってはあまり関係なかったりするんですよね。

「より早く、より大きく、より複雑に」分析を行うスパコンの強み

——「ランキングが使う人にとってはあまり関係ない」というのは、どういうことでしょう?

中島教授:それを説明するためには、「そもそもスパコンとは」という話になります。シンプルに説明すると、スパコンとは、一般的なパソコンにも入っているCPUをネットワーク経由で何千、何万とつないで、計算能力をより高めたパソコン(※)のことです。

もちろん表計算をしたり、大容量のデータを処理したりするときのように、簡単な計算処理だったら皆さんのパソコンでも常に行っているんですが、両者が違うのはその規模。スパコンだったら、「より速く」「より大きく」「より複雑に」計算することができます。

※ 例えば最新機種のiPhone 12は6コアCPU+4コアGPU(Apple A14 Bionic)。一方の「富岳」は独自開発した「A64FX」でCPUを約15万個接続している。GPUについては後ほど

——それぞれ具体的に教えてください。まず「より速く」とは?

中島教授:これはもう、単純な計算スピードの話です。例えば、地球上の大気の流れをコンピュータ上でシミュレーションする場合を考えましょう。地球温暖化の研究などで必要になるんですが、大気の流れをモデル化したプログラムに、地表面・海表面温度や海流の条件などの諸条件を入力して、実行します。

大気や水などの「流れ解析」は、非線形性が強く、とにかく時間がかかります。地球上のごく一部分のみを取り出したような計算でも、一般的なパソコンで実施すると何カ月もかかる場合があります。しかしスパコンを使えば、多数のCPUを同時実行する並列計算によって、ひと月かかっていたものが、1日で済む場合もあります(※)。

※ 複数のCPUを接続すれば計算速度は上がるものの、増やせば増やすほど、比例して速度が上がっていくわけではないので注意が必要

次の「より大きく」というのは、問題の規模の話です。先の大気の流れを例にして説明すると、例えば関東地方や日本列島周辺だけでなく、より広い領域、例えば地球全体のシミュレーションを実施することができます。

また、大気のシミュレーションでは、空間を細かいマス(格子、メッシュ)に区切って計算するのですが、より細かいメッシュを適用することによってより正確な解を得ることが可能になります。これは、モデルが大規模になるため、より大きな記憶容量、計算性能を有するスパコンが必要です。現在はひとマスが1km四方を下回るような精密なシミュレーションが可能となっています。

——画像データで言うところの「解像度」のようなものでしょうか。高画質な、解像度の高いデータをパソコンで表示しようとすると、相応の負荷がかかる。解像度の低い画像はすぐに表示できるものの、画質が荒い……。最後の「複雑に」というのは?

中島教授:これは、とても途方も無い話で。

流れ解析の一種として「走っている車がどのように空気抵抗を受けるか」といった検証をスパコンで行うとします。そこで、単純に「車のボディと、そこにあたった空気がどう流れるか」だけをシミュレーションしても、現実に起きうることを正しく予測するのは難しいんですよ。

——どうしてでしょう?

中島教授:言うまでもないですが、走行中の車は揺れます。外部から受けた力によって、ボディが微妙に変形することもあり、それによってさらに空気の流れが影響をうける可能性があります。ただ空気の流れを見るのではなく、そういった想定しうるできる限りの要素をパラメータとして計算に盛り込まないと、より正しい答えに近づけないんです。

これが「地球上の大気の流れ」になるともっと大変なことになりますよ。大気の流れと海流、地表の温度とか、土壌の状態、地域ごとの生態系とか、あげればきりがないくらいで。世の中の現象は、一つひとつが独立しているわけではないですから。

——高校物理の、「ただし◯◯は考慮しないものとする」というフレーズを思い出しました。そういった細かい要素もすべて考慮して、思いつく限りの要素を取り込んで計算できるのがスパコンだ、と。

飛沫や天気のリサーチのため「複数パターンの計算をする」処理も

——今年3月には「不織布マスクを付けている場合の飛沫の飛び方」をスパコンで分析した結果がニュースになっていましたが、最近は「富岳」の働きがニュースで大々的に報じられることも増えましたね。あれも、「富岳」の性能によるものなのでしょうか。

中島教授:そうですね。厳密に言うと、飛沫シミュレーションは「スパコンじゃないとできない」計算であることには間違いないんですが、「『富岳』じゃないとできない」わけじゃないんですよ。

——と、いうと?

中島教授:この飛沫シミュレーションは、「1つの大きな計算をやって、完結する」ものではなく、「ものすごくたくさんのパターンについて、同じような計算をする」分析だからです。

飛沫シミュレーションは、わかりやすく説明すると、条件を変えた計算をたくさん行って、それぞれの結果を比較することで結論を出します。「空気の流れ」とか「飛沫の性質」とか、条件や状況にあわせて細かくパラメーターを変えて、それぞれのパターンにおける傾向を見て、結論としているんです

▲この「パラメータを変えて複数パターンの計算を行う」のは、天気予報などでも行われる手法。気象庁が所有しているスパコンを使用し、50から100のパターンの結果を出して中長期の天気を予測するのだとか

中島教授:なので、一つひとつの計算は大規模ではないものの(※)、多くのパターンで結果を出さないといけないため、結果として似た計算を大量にやることになるんです。

※ 一方の「スパコン全体で大規模なひとつの計算を行う」例としては、心臓の活動シミュレーションなどがある。同研究では心臓の細胞一つひとつをさらに細かいメッシュに区切ってその活動を分析するため、大規模なスパコンのシステムすべてを使っても「心臓一拍の分析に丸一日」かかるそう

——「難しい作業に一点集中する」のではなく、「マルチタスクで、細かい作業をたくさん行う」感じでしょうか。

中島教授:これは、「富岳」のような大きなシステムでなくても、所要時間に多少の差はあっても、それなりの規模のスパコンであれば十分に行える計算ではあります。実際に、飛沫シミュレーションの計算には東大の情報基盤センターが持っているスパコン(※)も使っていますし。

※ 東京大学情報基盤センター・スーパーコンピューティング部門による「Oakbridge-CX(オークブリッジ・シーエックス)」が、飛沫シミュレーションにも活用されている。同シミュレーションは、神戸大学の坪倉誠教授らにより、超大規模熱流体ソフトウェア「CUBE」を使って行われた

▲東京大学の「Oakbridge-CX」(写真は東京大学情報基盤センター提供)。同部門が管理する他のスパコンと比較すると「とにかく使いやすい」(中島教授)のが特徴で、企業や研究機関から使用予約が殺到しているのだとか

——なるほど、さきほどの「使う人にとってはあまり関係がない」の意味がわかりました!

スパコンの電気代は? どうやって冷やす?

——ここからは、こんなきっかけがないと伺えない、スパコンのちょっと気になる「ド素人な」質問を伺おうと思っています。まずはこちらから……。

——例えば自宅にあるパソコンでも、日によってサクサク動くときとそうでない時がありますよね。同じようにスパコンでも調子が出る日と悪い日があるのかな、と。

中島教授:もちろんありますよ。これも皆さんのパソコンと同じで、本体が熱くなると調子が悪くなります。だから、スパコンの温度上昇を抑えるためにいろいろな設備を用意しています。

エアコンもありますが、スパコンは基本的には水冷。建物の屋上に水のタンクとチラーを設置したり。

——銭湯の水風呂と同じだ。スパコンも交互浴で「整っている」のかも……。

中島教授:仮に、冷却設備に障害が起きたら大変です。スパコンの方でリミッターがかかって、止まっちゃいます。

——いま設備のお話が出てきたので、流れでこの質問はいかがでしょうか。

——おそらくエアコン以外にも、とんでもない量の電気を使っていると思うんですが、いかがでしょうか?

中島教授:仮に「富岳」をフル稼働させると、30メガワットの電気を使います。これは、1時間のフル稼働で4人家族のおよそ6年分に相当する電気の使用量(※)。スパコンを動かす電気代だけでもばかにならないんですよ。

※ 家庭の電気使用量は総務省の調査による。東京大学のスパコンは、設備の管理・運営のため、利用者には電気代相当の負担金を支払ってもらっているのだとか。ちなみに、スパコンの繁忙期はサラリーマンと同じく年度末。企業の次年度に向けた準備と学生の論文執筆のタイミングが重なるのが理由と思われるが、「卒論を書くなら、年が明けた頃にスパコンを使ってデータを揃えているようじゃ遅い」(中島教授)とのこと

——素人から考えると「研究のためなんだから、電気代なんて気前よく払ってよ」と思ってしまいそうですが、そういうわけにもいかない金額ですね。

中島教授:情報機器の技術進歩に関する指針のひとつとして、「ムーアの法則」というものがあります。「技術の進歩によって、集積回路上のトランジスタ数は2年ごとに倍になる」というものなのですが、この法則通りに技術が発展すれば、回路もコンパクトになって、回路同士をつなぐ送電線も短くなる。そうすると発熱量が減るから、消費電力も下がる、ということになります。

実際に「富岳」と京を比較すると、消費電力当たりの計算性能は20倍近く、「富岳」の方が良くなっています(※)。でも2030年以降は技術進歩も飽和して、ムーアの法則が適応できなくなっていて……。これ以上、消費電力を抑えるのは難しいかもしれないです。

※ 消費量だけを考えると、「富岳」は京のおよそ2倍の電気を使う。しかし、「富岳」は京のおよそ40倍の計算速度があるため、両者で同様の処理をする場合を考えると、計算処理を圧倒的に短時間で終えられる「富岳」のほうが省エネ、ということになる

——なるほど。「富岳」と京の違いのお話から気になることが出てきたのですが、こんな質問はいかがでしょうか?

——さきほど「京と比較して、『富岳』はアプリケーションドリブンになっている」との話だったのですが、表舞台に出てこないものまで、世界中にはスパコンってたくさんありますよね。実際にそれぞれで、「計算速度」以外の特徴や違いってあるのでしょうか?

中島教授:「性能や使い勝手に違いが出るか」という話なら、「計算処理にGPUを使うかどうか」という差はあります。

GPUとは「Graphics Processing Unit」の略で、CPU同様の演算装置の一種です。一般的にはパソコン上の画像処理に活用されるもので、人によってはゲーミングPCのスペックで耳にしたこともあるかもしれませんね。GPUはデータ転送能力がとても高いので、最近はその能力をスパコンでも使うようになっています。

——GPUという名前なのに、絵は描かないんですね。CPUと比較して、どういった性能があるんでしょう?

中島教授:CPUは汎用性が高い演算装置です。一方でGPUは、高い計算処理能力があっても、単純な計算処理しかできない。例えば、「パソコンを動かすためのOSを立ち上げる」といった複雑な動作ができないんです。ホストであるCPUの指示をうけて、GPUが動くイメージですね。

——そういえば、過去に「アメリカ空軍が1700台のプレイステーション3を組み合わせてスパコンを作った」というニュースがありましたが、あれって……。

中島教授:ゲーム機のCPUに採用されているCell Broadband Engine(CBE)は、高いデータ転送能力を有している点ではGPUと同じで、そこに目をつけたのだろうと思います。

GPUを搭載したシステムでは、CPUとGPUを連携させるために、プログラミングがより複雑になります。従来のCPUのみで動いていたプログラムを書き換えなければならないので、準備が大変なんですよ。

▲同じく、東京大学が管理するスパコン「Oakforest-PACS(オークフォレスト・パックス)。2020年6月の「TOP500」で18位(日本3位)を獲得しているスパコンで、京の退役から「富岳」の稼働スタートまでの間、日本最大のシステムとして使用されることを見越して立ち上げられた(写真提供:東京大学情報基盤センター 撮影:三浦健司)。Oakbridge-CX(2020年6月のTOP500にて60位)よりも計算速度は優れているものの、性能を引き出すためには、プログラムをスパコンにあわせてチューニングする必要があるそう

中島教授:ちなみに、「富岳」はGPUを搭載していません。だから、「GPUを搭載しないとデータ転送能力が向上しない」というわけでもないんです。

——「ユーザー側の使い勝手」がそういった部分にも影響する、と。「用途に応じて使うものを変える」と考えると、普通のパソコンとも共通する部分もあるんですね。

「計算」は、真理を追求するうえで必要

——情報基盤センターさんのWebサイトを拝見すると、ものづくりや地球科学、宇宙科学などのシミュレーションにおけるスパコン活用事例がたくさん紹介されていますよね。

中島教授:確かにシミュレーションはスパコンの用途として特に多いです。今後、東大で力を入れてやろうとしているのが、地震のシミュレーションです。

例えば、大規模な地震が発生したとします。その結果として発生する地震動(強震動)がどのように伝わって行くのか。単に計算によるシミュレーションだけでなく、全国各地の地震計の観測データを使ってシミュレーション結果を修正しながら、より正確な予測に役立てようとしています。

地震が発生してから数十秒以内に、計算だけでなく、全国各地から観測データを収集して、シミュレーション結果を修正しながらさらに計算を進める「データ同化」と呼ばれる手法が、正確な被害予測には必要になります。

——揺れが始まってから研究者が収集したデータをスパコンに持ち込んで、パラメータを設定して、計算して……とやっている時間はないですからね。スパコン側に自動的にデータが持ち込まれて、計算が行われるようにしておかないといけない。

中島教授:今年の5月から、東大で新しく稼働スタートした「Wisteria(ウィステリア)/BDEC-01」は、これまでのスパコンのような計算処理を行う「シミュレーションノード群」に加えて、「データ・学習ノード群」を設けています。

一言でいうと、計算科学シミュレーションとデータ処理・機械学習を連携させることができる仕組みで、こういったコンセプトで開発された本格的なスパコンは世界初なんですよ。

▲2021年5月から本格稼働をスタートさせた、東京大学情報基盤センターによる「Wisteria/BDEC-01」(写真は東京大学情報基盤センター提供)

——なるほど。今後のスパコンは速度ではなく、それ以外の部分で個性を出すようになっていくのかもしれないですね。

中島教授:スパコンを使ったシミュレーションに代表される「計算科学」は、実験と理論との間を埋めることができる「第3の科学」であると言われています。しかし、高校生までは「計算科学」にふれる機会があまりないため、自然科学を好きな高校生が将来の進路選択をする際には「実験か、理論か」という観点で考えてしまいがちになります。「計算科学」という分野があることがそもそも知られていないんですよね。

もっと若いころから、それこそ小中学生が当たり前のようにスパコンを使うようになれば、「コンピュータを使って実験をする」ということが、もっと当たり前になっていくのでは、と思っています。「計算をする」ということは、真理を追求するうえで必ずやらないといけないことですから。

——スパコンを動かしている小学生……。ちょっと末恐ろしい感じはありますが、そんな未来も楽しみです。本日はありがとうございました!

文=伊藤 駿/編集=黒木貴啓(ノオト

この記事が気に入ったらいいね!しよう

いいね!するとi:Engineerの最新情報をお届けします

プライバシーマーク