share_log

Cerebras Systems Announces 130x Performance Improvement on Key Nuclear Energy Simulation Over Nvidia A100 GPUs

Cerebras Systemsは、Nvidia A100 GPUよりも主要な原子力エネルギーシミュレーションのパフォーマンスが130倍向上したことを発表しました

Businesswire ·  2023/11/13 10:00

実行可能な連続エネルギーモンテカルロ粒子輸送カーネルは、高度に最適化されたGPUバージョンを上回り、核エネルギーのHPCシミュレーションカーネルにおいてNvidia A100 GPUの130倍のスピードアップを実現し、Argonne National Laboratoryの研究者が開発した。この結果は、Cerebras Wafer-Scale Engine(WSE-2)のパフォーマンスと汎用性を証明し、米国がエネルギーおよび防衛アプリケーションのスーパーコンピューティングのグローバルリーダーであることを保証しています。

カリフォルニア州サニーベール--(BUSINESS WIRE)--世界初のAI生成加速を目的としたCerebras Systemsは、本日、Argonne National Laboratoryの研究者が開発した核エネルギーHPCシミュレーションカーネルにおいて、Nvidia A100 GPUの130倍のスピードアップを実現しました。これによって、CerebrasのWafer-Scale Engine(WSE-2)のパフォーマンスと汎用性が証明され、米国がエネルギーや防衛のアプリケーションにおいてスーパーコンピューティングのグローバルリーダーであることが確保されます。


モンテカルロ粒子輸送は、放射線輸送の高精度なシミュレーションを提供し、核分裂および核融合炉の設計に不可欠です。この研究協力では、Cerebras CS-2システムが、モンテカルロ中性子粒子輸送アルゴリズムの最も要求の厳しい部分であるマクロスコーピック断面積の検索カーネルにおいて、高度に最適化されたGPUの実装を大幅に上回りました。このカーネルは、多くの核エネルギーアプリケーションにおいて、合計ランタイムの85%に相当する、最も計算資源が必要な部分を表します。この研究により、Cerebrasシステムがモンテカルロ粒子シミュレーションに最適なバンド幅と低レイテンシーを提供し、外部の研究者が自分たちのHPCアプリケーションをCerebras構造に合わせて最適化することができることも証明されました。

「私はこのカーネルを半ダース以上のプログラミングモデルに実装し、過去10年間にわたってほとんどすべてのHPCアーキテクチャで実行しています」と、アシスタント計算科学者のJohn R. Trammは語ります。「私たちのチームがCerebrasマシンから得た性能数字は印象的で、これまでCPUまたはGPUアーキテクチャで可能だったものをはるかに進歩させています。私たちのチームの仕事は、AIアクセラレータがHPCシミュレーションの分野でGPU支配を破壊する可能性を持つことを示す証拠が増えていることを示しています。」

モンテカルロ中性子粒子輸送は、放射線輸送の高精度なシミュレーションを提供する重要なアルゴリズムであり、核分裂および核融合炉の設計に必要不可欠です。このアルゴリズムでは、マクロ断面積ルックアップカーネルが、幾何学的形状とさまざまな素材との相互作用をシミュレートしながら、粒子が移動する際の振る舞いのランダムサンプルを生成するために使用する統計分布データを構成します。ANLの科学者たちは、Cerebras SDKとCSLプログラミング言語を使用して、最適化されたマクロ断面積ルックアップカーネルの実装を行いました。この実装では、最大850,000コアと40GBのオンチップSRAMを備えたCerebras CS-2のウエハスケールアーキテクチャを生かし、モンテカルロ粒子シミュレーションに最適な高帯域幅・低レイテンシーの組み合わせを提供しました。この研究は、外部研究者がCerebrasアーキテクチャに合わせてHPCアプリケーションを自分たちで開発し、さまざまな計算問題において新たな性能レベルを発揮することを証明しています。

「これらの結果の発表によって、CS-2の信じられないほどの性能だけでなく、そのアーキテクチャの効率性が強調されました」と、Cerebras SystemsのCEOで共同設立者のAndrew Feldmanは述べています。「WSE-2プロセッサで動作するCerebras CS-2システムは、A100よりも48倍のトランジスタを備えていますが、130倍のスピードアップを実現しており、GPUに最適化された問題に対して2.7倍のアーキテクチャの効率性が示されています。」

さらに、Cerebras CS-2はスケーリング性が強く、小規模から大規模のシミュレーションの両方で高いパフォーマンスを発揮することができました。研究者たちは、小規模なシミュレーションにおいて、並列処理されるGPUの数量はどれだけ多くても、単一のCS-2に匹敵する性能を発揮できないことを指摘しています。

Cerebras SystemsのCS-2は、生成AIと科学アプリケーションに特化したシステムです。科学計算において「100倍」と表現されるような目覚ましい成果を達成しています。特に、King Abdullah University of Science and Technology(KAUST)によって実施された多次元地震処理プロジェクトでは、48台のCS-2クラスターが、世界最速のスーパーコンピューターに匹敵する性能を発揮しました。同様に、National Energy Technology Laboratoryの研究者たちは、Jouleスーパーコンピューターの470倍の速度で計算流体力学を実行するために、CS-2を使用しました。また、TotalEnergiesでは、ステンシル計算をGPUベースのソリューションと比較して228倍高速化しました。

「効率的なアルゴリズム(Efficient Algorithms)」と題された論文の全文を読むには、こちらをご覧ください。

Cerebras Systemsについて

Cerebras Systemsは、深層学習研究者、コンピューターアーキテクト、ソリューションスペシャリストなどが共に取り組み、世界中の企業や組織に生成AIを提供するために設立されました。世界最大かつ最速のAIプロセッサーであるWSE-2によって動作する当社の代表的な製品であるCS-2システムにより、分散コンピュータリンクの複雑さを回避することで、大規模なモデルのトレーニングを簡単かつ簡略化することができます。私たちのソフトウェアツールは、展開やトレーニングプロセスを簡素化し、深い洞察を提供し、最高の精度を確保します。私たちは経験豊富なML研究者や実践者のチームを擁し、最も先進的なAIモデルの開発と展開に数十年にわたって取り組んできたノウハウを活用して、お客様をAIの最前線に位置する企業に導いてきました。Cerebrasのソリューションは、クラウド、Cerebras AI Model Studio、またはオンプレミスで利用可能です。詳細については、次のサイトをご覧ください。


連絡先

Kim Ziesemer
pr@zmcommunications.com

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする