share_log

招商证券:文生视频模型SORA表现效果超预期 带动算力网络建设需求

中国招商:文生のビデオモデルであるSORAのパフォーマンスは予想以上に優れ、コンピュータネットワークの構築ニーズを促進しています

智通財経 ·  02/20 00:57

智通財経アプリによると、招商証券は研究レポートを発表し、Soraは視覚分野の応用空間を開くことができ、算力ネットワークの供給が持続的に不足していることがハードウェアインフラストラクチャの構築需要を引き起こしています。行は、Soraモデルのトレーニングには約7万900枚のH100画像を1ヶ月間に約1週間必要です。推論側では、関連研究によると、1枚の画像を生成するための必要な算力量は、約256語のコストです。これに基づいて、1分間のショートビデオの算力消費量は、1回のテキスト対話の千倍以上に相当すると推定されます。行は、中短期的に算力が不足するため、推論側の需要を十分に満たすことができないと考えています。

イベント:2月16日、OpenAIは文生ビデオモデルのSoraを発表しました。テキストコマンドに基づいて、現実味のある想像力に富んだシーンを作成し、複雑なシーンを生成できる高精細ビデオを生成できます。Soraは、複数のキャラクタ、特定の種類の動き、そして主体と背景の正確な細かい点を持つシーンを生成でき、長さは1分に達することができます。Soraの超予想は、Transformerモデルが視覚分野で有効であることを示し、視覚モデルの加速イテレーションの基礎を築きました。

招商証券の意見は以下の通りです:

Soraモデルの表示効果は驚くばかりで、視覚モデルのマイルストーンを設立しました。

以前の視覚モデルとは異なり、OpenAIのSoraは視覚データの汎用モデルであり、モデルに複数のフレームを提供することで、一時的に視野から外れてもテーマを維持できる課題を解決しました。それは、時間的に異なる、アスペクト比の異なる、解像度の異なるビデオや画像を生成することができます。そして、最大1分間の高精細ビデオを出力することができます。Soraのコアの利点は、一貫性、柔軟性、安定性です。Soraは、さまざまなピクセル数と画像のアスペクト比を生成でき、画像からビデオを生成することもできます。他のモデルと比較して、Soraが生成する1分間の場合、前後のテーマを一貫して維持できる能力は、以前の視覚モデルが持っていなかったものです。同時に、Soraは物理的なルールの理解能力を生み出し、人為的な拘束がなくても、画面を物理学的なルールに準拠させるようになりました。

視覚モデルのGPT3クラスターは、モデルのイテレーションが加速期に入りました。

Sora以前は、大規模言語モデルは成功に伴い主要な研究方向になっていたが、拡散モデルはまだ大規模言語モデルの主導的地位にある。DALL·E、StableDiffusionなど、広く使用されている視覚モデルは、拡散モデルを採用しています。Googleが大言語モデルを提唱した2023年、ビデオ領域での大言語モデルの性能が悪い主要な理由は、モデル自体ではなく、ビデオを変換するための良好な表現形式がないことを示しています。Soraのブレークスルーは、DiT構造に基づいて、大規模言語モデルと拡散モデルの共同の利点を結合したものです。これが、Diffusionモデルをスケーラブルにすることができ、GTP4式の奇跡も視覚分野で「涌現」効果を発揮できることを証明しています。Soraは、拡散+言語モデルの統合路線の成功を示しており、将来的には、GPT3のマイルストーン意義に値するような、より現実的な視覚モデルが登場する可能性があります。この道を継続的にイテレーションすると、次の1〜2年で、より逼真的な視覚モデルを生成できる可能性があります。

Soraは、アルゴリズムの大量を必要とし、ハードウェア開発に大きな需要を引き起こしています。

DiTモデルの創設者であるシーサル博士によると、Soraモデルのパラメータサイズは約30億です。トレーニング可能なデータ量の研究成果に基づいて、海外の大規模なビデオサイトが1分あたりに約500時間のビデオコンテンツをアップロードするようです。このため、行は、Soraモデルのトレーニングにおよそ7万900枚のH100画像が1ヶ月で約1週間必要であると推定しています。推論側では、関連研究により生成するために必要な算力は、約256語のコストだとされています。これに基づいて、1分間のショートビデオの算力消費量は、1回のテキスト対話の千倍以上に相当すると推定されます。短期および中期的に、算力が不足しており、推論側の需要を十分に満たせない可能性があります。

投資提案:Soraは、視覚分野のAIGCの応用空間を開き、算力ネットワークの供給が継続的に不足しているため、ハードウェアインフラストラクチャの構築需要を空けます。

光モジュール部門では、同社は北米の光モジュールコアサプライヤーであるZhongji Innolight(300308.SZ)、Eoptolink Technology Inc.(300502.SZ)をお勧めします。その上流の主要サプライヤーであるSuzhou TFC Optical Communication(300394.SZ)および国内光チップリーダーであるUnisplendour Corporation(688498.SH)に注意が必要です。

スイッチングモジュール部門では、同社は中国の代替ドラゴンヘッドであるZiguang Guofen(000938.SZ)、Ruijie Networks(301165.SZ)に注意を払うと同時に、国内の交換機チップリーダーであるShengke Communications(688702.SH)を推奨し、国内のICT大手であるZTE(000063.SZ)を推奨します。

ビデオエンコード/デコードモジュール部門では、同社はEoptolink Technology Inc.(688039.SH)、Weihaid(301318.SZ)などの高品質なビデオエンコード/デコード企業に注目しています。

リスク提示:主計算パラメータの仮定が適切でない場合、Soraモデルの導入スピードが予想に満たない場合、業界の競争環境が悪化します。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする