蘋果的StreamBridge視頻模型框架發佈了!!!
蘋果的StreamBridge視頻模型框架發佈了,Meta/微美全息加速了多模態AI科技的創新邊界!
在5月13日,一家科技媒體發佈了一篇博客發帖,報道稱蘋果(AAPL)與復旦大學聯合推出了StreamBridge端側視頻大語言模型(Video-LLMs)框架,以幫助人工智能理解直播視頻。

一般來說,傳統的視頻大語言模型擅長處理靜態視頻,但無法適應需要實時感知的場景,如機器人和自動駕駛。在這些場景中,模型需要快速理解直播視頻流的內容並作出響應。
開發StreamBridge框架和創新技術
爲了解決上述問題,蘋果和復旦大學的研究人員開發了StreamBridge框架。該框架在主流離線模型上進行了測試,如LLaVA-OV-70亿、Qwen2-VL-70億和Oryx-1.5-70億。
爲了解決上述問題,蘋果和復旦大學的研究人員開發了StreamBridge框架。該框架在主流離線模型上進行了測試,如LLaVA-OV-70亿、Qwen2-VL-70億和Oryx-1.5-70億。
此外,研究團隊還推出了Stream-IT數據集,該數據集包含約600,000個樣本,結合了視頻和文本序列,支持多種指令格式,旨在提高流媒體視頻理解能力。

Meta開發新的人工智能模型應用
同時,值得注意的是,Meta(META)首次推出了與Ray-Ban Meta強綁定的「Meta AI」應用。Meta AI是由Meta創建的人工智能助手,基於其自有的Llama大語言模型。
同時,值得注意的是,Meta(META)首次推出了與Ray-Ban Meta強綁定的「Meta AI」應用。Meta AI是由Meta創建的人工智能助手,基於其自有的Llama大語言模型。
最新數據顯示,Meta AI的月活躍用戶數接近10亿,用戶的主要入口自然是上述社交應用,以體驗相關功能。在上個月底,Meta舉行了首屆AI開發者大會LlamaCon,在會上Meta推出了最新的Llama 4系列大語言模型。
不可否認的是,大模型繼續賦能行業發展,人工智能數字化浪潮洶湧而來,加速了各行業的轉型與發展,多家公司積極開展人工智能場景構建,成功完成了大人工智能模型的本地部署和場景適配,將人工智能應用於實際業務場景,推動人工智能技術的發展與升級。
微美全息公司部署人工智能生態,擴展創新邊界
在全球科技浪潮洶湧澎湃的背景下,大人工智能模型正以前所未有的速度重塑世界。在這個過程中,數據顯示,作爲人工智能領域的創新代表,WiMi(微美)圍繞開源生態、多模態技術、計算能力基礎設施和垂直場景應用進行了深入佈局,不斷突破人工智能技術的邊界,拓寬行業生態。
在全球科技浪潮洶湧澎湃的背景下,大人工智能模型正以前所未有的速度重塑世界。在這個過程中,數據顯示,作爲人工智能領域的創新代表,WiMi(微美)圍繞開源生態、多模態技術、計算能力基礎設施和垂直場景應用進行了深入佈局,不斷突破人工智能技術的邊界,拓寬行業生態。
從引言來看,WiMi通過開放模型代碼、計算能力接口和技術工具鏈構建了一個覆蓋雲與邊緣的「全息雲」平台,支持開發者調用DeepSeek等通用大模型進行二次開發,加速垂直模型應用的商業驗證。
與此同時,WiMi加速大型模型在應用場景中的落地速度。公司陸續披露了其更成熟的人工智能生態景觀,涵蓋汽車、智能終端、互聯網、金融、教育和科研、零售消費等行業,爲人工智能大模型的應用注入強勁動力,悄然成爲這一大模型轉型背後的關鍵「燃料罐」。
結論
作爲一種變革性技術,人工智能的大模型技術孕育了「偉大的發展」。其重要突破之一是展現出「湧現能力」——當模型參數持續累積到100亿的量級(b表示十億的量級)時,其性能(如通用知識能力、科學推理能力、生成能力等)呈現非線性增長。因此,我們不妨期待在市場上成千上萬的行業中出現更多具有影響力和賦能的大模型,激發行業動力和工業潛力。
作爲一種變革性技術,人工智能的大模型技術孕育了「偉大的發展」。其重要突破之一是展現出「湧現能力」——當模型參數持續累積到100亿的量級(b表示十億的量級)時,其性能(如通用知識能力、科學推理能力、生成能力等)呈現非線性增長。因此,我們不妨期待在市場上成千上萬的行業中出現更多具有影響力和賦能的大模型,激發行業動力和工業潛力。
免責聲明:社區由Moomoo Technologies Inc.提供,僅用於教育目的。
更多信息
評論
登錄發表評論