share_log

平安证券:GPT-4o性能与实用性双突破 有望加速大模型应用落地

平安證券:GPT-4o性能與實用性雙突破 有望加速大模型應用落地

智通財經 ·  05/14 23:51

當前全球範圍內的大模型逐漸呈現由單方面的性能角逐,轉向性能與實用性並重的發展趨勢。

智通財經APP獲悉,平安證券發佈研報稱,當前全球範圍內的大模型逐漸呈現由單方面的性能角逐,轉向性能與實用性並重的發展趨勢。大模型能力達到一定水平時必然會走向應用,大模型廠商通過提升其產品性價比,助推下游應用端的推广部署,有望加速大模型產業鏈商業閉環的形成,繼續看好AI主題的投資機會。

平安證券主要觀點如下:

GPT-4o的文本、推理及編碼能力對標GPT-4Turbo

GPT-4o可接受文本、音頻和圖像的任意組合作爲輸入,並可生成文本、音頻和圖像的任意組合作爲輸出。GPT-4o在英語文本和代碼方面的性能可對標GPT-4Turbo,在非英語文本方面的性能顯着提高,同時API的速度也更快,且成本降低50%。其中,在文本評價方面,根據OpenAI官網信息,相比Llama3 400b等主流大模型,GPT-4o在0-shotCOTMMLU(常識問題)上創下了88.7%的新高分,在傳統的5-shotno-CoTMMLU上,GPT-4o創下了87.2%的新高分。

GPT-4o在視覺和音頻理解方面實現突破

根據OpenAI官網信息,在GPT-4o之前,使用語音模式與ChatGPT對話,GPT-3.5/GPT-4的平均延遲分別爲2.8/5.4秒。而GPT-4o可以在短至232毫秒的時間內響應音頻輸入,平均時長爲320毫秒,與人類在一次談話中的響應時間相似。主要是由於,此前的語音模式是由三個獨立模型組成的管道:一個簡單模型將音頻轉錄爲文本,GPT-3.5或GPT-4接收文本並輸出文本,第三個簡單模型將該文本轉換回音頻。在這個過程中GPT-4丟失了大量信息,它無法直接觀察音調、多個說話者或背景噪音,也無法輸出笑聲、歌唱或表達情感。GPT-4o跨文本、視覺和音頻,端到端地訓練了一個新模型,這意味着所有輸入和輸出都由同一神經網絡處理。

GPT-4o提速降價,高可用性助推大模型應用側加速滲透

根據OpenAI官網信息,面向C端用戶:GPT-4o的文本和圖像功能已經於發佈當日開始在ChatGPT的免費套餐中推出,並向Plus用戶提供高達5倍的消息限制。OpenAI將在未來幾周內在ChatGPTPlus中推出新版本的語音模式GPT-4oalpha。面向開發者:開發人員可以在API中訪問GPT-4o的文本及視覺模型功能。與GPT-4Turbo相比,GPT-4o速度提高2倍,價格降低50%。OpenAI計劃在未來幾周內在API中向部分合作夥伴開放GPT-4o新音頻和視頻功能。GPT-4o的推出是OpenAI大模型產品在實用性方面的重大突破。

根據幻方AI公衆號消息,此前,國內AI公司深度求索(DeepSeek)於2024年5月6日發佈的大模型DeepSeek-V2性能比肩主流大模型,DeepSeek-V2通過全方位的模型架構創新,實現成本的大幅下降,定價策略相比GPT-4-Turbo,性價比優勢凸顯。國內外大模型逐漸呈現由單方面的性能角逐,轉向性能與實用性並重的發展趨勢,更加註重性價比,有望通過降低下游大模型部署成本,加速大模型在各場景的應用落地。

推薦標的:1)算力方面,中科曙光(603019.SH)、紫光股份(000938.SZ)、神州數碼(000034.SZ)、龍芯中科(688047.SH),建議關注寒武紀(688256.SH)、景嘉微(300474.SZ)、拓維信息(002261.SZ)、軟通動力(301236.SZ);2)算法方面,推薦科大訊飛(002230.SZ);3)應用場景方面,強烈推薦中科創達(300496.SZ)、盛視科技(002990.SZ),推薦金山辦公,建議關注萬興科技(300624.SZ)、同花順(300033.SZ)、彩訊股份(300634.SZ);4)網絡安全方面,強烈推薦啓明星辰(002439.SZ)。

風險提示:1)國內大模型算法發展可能不及預期;2)AI算力供應鏈風險上升;3)大模型產品的應用落地低於預期。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論