share_log

国金证券:Sora开启创意领域iPhone时刻 关注文生图/视频投资机会

國金證券:Sora開啓創意領域iPhone時刻 關注文生圖/視頻投資機會

智通財經 ·  02/19 01:04

文生圖和文生視頻是當下AI應用端落地焦點,海外相關技術產品迭代迅速。

智通財經APP獲悉,國金證券發佈研究報告稱,Sora問世,視頻創作領域迎來“iPhone時刻”。從本輪AI應用端發展實踐來看,以文本創作、圖像創作、視頻創意爲代表的創意創作領域因其高容錯率、高投入度,在AI浪潮之初就被市場廣泛認爲將會成爲最先被AI深刻賦能的產業之一。該行認爲文生圖和文生視頻是當下AI應用端落地焦點,海外相關技術產品迭代迅速。國內推薦關注萬興科技(300624.SZ)和美圖公司(01357)等創意軟件龍頭投資機會。

國金證券觀點如下:

Sora問世,視頻創作領域迎來“iPhone時刻”。

2023年2月15日,OpenAI發佈視頻生成大模型Sora,通過文本指令,Sora可以直接輸出長達60秒的高清視頻,包含高度寫實的背景、複雜的多角度鏡頭以及富有情感的多角色敘事,更爲可貴的是,Sora生成的視頻表現出對於真實世界物理常識的深刻理解。部分媒體報道驚歎—“Sora之後,現實將不再存在”。從本輪AI應用端發展實踐來看,以文本創作(小說、劇本)、圖像創作(繪畫、平面設計、攝影)、視頻創意(廣告、短視頻、傳統影視、遊戲)爲代表的創意創作領域因其高容錯率、高投入度,在AI浪潮之初就被市場廣泛認爲將會成爲最先被AI深刻賦能的產業之一;

從本輪AI模型發展演繹來看,以ChatGPT爲代表的文本創作(以Midjourney、Stable Diffusion爲代表的圖像創作(以Runway、Sora爲代表的視頻創作的發展速度無疑是極爲驚人的。該行認爲,從文字到圖像到視頻,AI內容創作的信息升維越來越考驗模型的創作效率與生成結果的穩定性(早期版本的Midjourney存在生成時間長、生成結果違揹物理常識或者“AI感”明顯的問題;Runway Gen-1/2也存在生成視頻時長較短且生成視頻邏輯連貫性較弱等缺陷),但正如Midjourney V5/6已逐步廣泛實現多行業的商業化落地,該行認爲Sora的問世有望推動着視頻創作領域的“iPhone時刻”到來。

Sora取法Tokens文本特徵標記,是基於Patches視覺特徵標記的Diffusion Transformer模型。

OpenAI研究團隊從LLM中汲取靈感,認爲LLM範式的成功在一定程度上得益於Tokens的使用,故而通過將視頻信息分解爲帶有時空特徵的Patches訓練了Diffusion Transformer模型。從訓練角度而言,基於Patches視覺特徵標記對原生視頻進行採樣擴大了可用樣本的規模且省去了標準化樣本的步驟。從推理角度而言,基於原生視頻訓練的模型在生成新視頻方面改善了構圖和取景。OpenAI目前發佈的Sora視頻大模型主要具備文生視頻、視頻編輯、文生圖三類功能,在文生視頻過程中,用戶通過輸入Prompt提示詞(DALL·E生成圖像(Sora生成視頻。

文生圖和文生視頻是當下AI應用端落地焦點,海外相關技術產品迭代迅速。

據Discord,按邀請頁面流量排序的十大AI應用程序中,有5個是圖片生成應用程序,2個是音頻生成應用程序,2個是視頻生成應用程序,其中,Midjourney位列第一,Pika位列第二,圖片約佔前10名流量的74%,視頻約佔前10名流量的8%。文生圖領域,海外有Adobe(老牌創意軟件巨頭,現已發佈下一代Firefly支持多種文生圖功能)、Midjourney(文生圖模型新銳,現已廣泛實現商業化落地)。文生視頻領域,海外有Pika(AI初創公司,支持一鍵生成3秒共計72幀視頻)、Runway(擁有最早商業化的T2V模型Runway Gen-2)。

國內推薦關注萬興科技和美圖公司等創意軟件龍頭投資機會。

萬興於2023年9月宣佈即將發佈國內首個專注於以視頻創意應用爲核心的百億級參數多媒體大模型“天幕”,具備一鍵成片、AI美術設計、文生音樂、音頻增強、音效分析、多語言對話等核心能力。2022年底至2023全年萬興對旗下T2V/I多款拳頭產品進行AI功能更新,AI賦能之下訂閱收入佔比及訂閱續約率取得雙增。美圖公司於2023年12更新視覺大模型MiracleVision 4.0,具備文生視頻、圖生視頻、視頻生視頻等多模態能力,AI賦能之下訂閱業務收入佔比逐年增長。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論