Sora登場,意味著什么?
-
收藏
0
OpenAI2月16日凌晨發布“王炸”文生視頻大模型Sora,再次引爆科技圈。在OpenAI官網分享的演示視頻中,Sora可以直接輸出有多個角色、多種場景和運鏡的畫面。這對比一年前 AI 生成的視頻,簡直是天差地別,其視頻長度方面就“碾壓”同行。
方正證券分析師鄭震湘領導的團隊在題為《AI巨輪滾滾向前》報告中直言,文生視頻大模型Sora震撼登場,AIGC新時代已至。Sora完美繼承DALL·E 3的畫質和遵循指令能力,并利用了GPT擴寫,具備超長生成時間(60s)、單視頻多角度鏡頭、理解物理世界三大突出優勢:
模型對物理世界的理解愈加接近現實,已具備商業化落地價值,創作內容產業革命來臨,AIGC新時代到來了。
方正證券在報告中指出,英偉達正式發布Chat With RTX,AI加速普及,通用人工智能時代也正加速來臨。在高性能AI處理器的加持下,AI+N類終端的時代浪潮已至,AI改變的不只是 PC 與手機,科技賦能將全方位滲透,消費電子也將迎來全新的增長機遇:
我們認為MR是AI最佳落地終端,泛社交、B端應用拓展也擁有想象空間。
報告稱,核心公司業務進展近況進一步印證了現階段塊發展兩個核心要素:AI方向的持續產品迭代、龐大的國產化算力需求。預計在AI算力需求高景氣的背景下,國內AI算力產業鏈將在2024年迎來更加快速的發展。
01
AIGC新時代已至
方正證券在報告中指出,從Runway、Pika 到 Sora,文生視頻大模型頻出,視頻長度從表情包長度的3s、4s 到主流短視頻長度的60s,模型對物理世界的理解愈加接近現實,已具備強大的商業化落地價值,創作內容產業革命來臨,AIGC 新時代已至:
在算力需求大、高質量數據集短缺、可控性較差等挑戰下,文生視頻是AIGC的高地,除Runway、Pika之外,Stability AI 也發布了 Stable Video Diffusion 視頻模型,用戶可根據需要調整各種參數,如迭代步數、重繪幅度等,以協助創作者精確掌控畫面生成過程,Meta推出了兩項基于AI的視頻編輯新功能;在開源上,AnimateDiff、MAKEAVIDEO、MagicAnimate 等也在布局 AI 視頻生成賽道。
報告稱,Sora震撼效果的原因主要有:
1)訓練端:基于 Transformer 架構的擴散模型,降維并通過Patche 進行訓練;采樣的靈活性與獨特的訓練路徑(原始 尺寸、時長訓練);利用DALL·E 3 re-captioning 功能,給訓練用的視頻素材都加上高質量文本描述;
2)輸入端:利用 GPT 先將用戶輸入的提示詞精準詳盡擴寫,再將擴寫后的提示詞交給 Sora:
Sora 是一種擴散模型,可在學習大量先作的時候,學會圖像內涵與圖像之間的關系,采用 Transformer 架構(主流視頻生成擴散模型較多采用 U-Net 架構),OpenAI 認為 之前在大語言模型上的成功得益于 Token,Token 可以把代碼、數學以及各種不 同的自然語言進行統一,進而方便規模巨大的訓練,因此 OpenAI 創造了對應 Token 的 Patche,用于訓練 Sora。
為減少 Transformer 帶來的計算量壓力,OpenAI 開發了一個視頻壓縮網絡,把視頻先降維到潛空間(latent,用更少的信息去表 達信息的本質),然后再去拿這些壓縮過的視頻數據去生成 Patche,這樣就能使輸入的信息變少。
方正證券認為,AI大模型的發展正不斷加速AGI通用人工智能的到來,縱觀整個AI產業鏈,硬件和軟件的配合才能更好地實現多種終端應用的價值化落地,可以預見的是,未來的 AI 時代又是生產力的爆發式革命:
其中上游的基礎層包括AI模型生產工具(AI 算法框架+AI 開發平臺+AI 開放平臺+預訓練大模型)、AI 算力基礎 (AI 芯片+服務器+智算中心+云服務)、AI 數據資源(AI 基礎數據服務+數據治 理);
中游的技術層包括計算機視覺、智能語音、自然語言處理、知識圖譜和機器學習;
下游的應用層則是百花齊放,以 AI+泛安防/泛互聯網/媒體/金融/醫療/工 業/零售/政務為代表,還包括對話式 AI、機器人、自動駕駛、無人機等。
02
“AI+終端”智能化加速
方正證券認為,手機、MR、機器人等新品迭出,諸多新品亮相,AI終端時代來臨。英偉達、AMD、高通分別推出GeForceRTX 40 SUPER 系列、銳龍8000G 系列、驍龍XR2+ Gen 2 等高性能處理器,性能水平實現躍升,助力AI加速滲透PC、汽車、智能家居等終端場景:
我們看到,三星大力布局人車互聯生態;英特爾在發布AI PC 平臺的同時,推出SDV SoC 賦能AI+汽車;戴爾靈越系列搭載英特爾酷睿Ultra 7,AI 能效再度提升;聯想十余款AI PC 產品發布,規?;涞刂鸩酵七M。華碩搭載酷睿Ultra 9,各系列產品針對不同的目標客戶進行性能或配置上的優化,滿足差異化需求。
我們認為,在高性能AI 處理器的加持下,AI+N 類終端的時代浪潮已至,AI 改變的不只是PC 與手機,科技賦能將全方位滲透,消費電子也將迎來全新的增長機遇。
報告指出,MR為AI最佳落地終端,高度賦能MR 內容與硬件,泛社交、B 端應用拓展也擁有想象空間:
1)辦公場景:Workrooms 是一個身臨其境的虛擬辦公室,無論是戴著 Meta Quest 頭戴式耳 機,還是從 2D 屏幕上加入,都可以在這里與隊友會面、集思廣益、分享演示文 稿并完成工作。同時,Workrooms 還支持 Zoom,讓連接更方便。
2)政府服務:首爾市政府正式開展元宇宙服務,建立涵蓋經濟、教育、稅務和行政等領域的行 政服務平臺。該市還打算在接下來的五年里陸續推出更多涉及政府、商業、旅游和文化的服務。
3)金融服務:中國工商銀行虛擬營業廳率先構建 “VR 智能眼鏡+元宇宙+智慧金融”場景。在 虛擬營業廳中,用戶仿佛置身于真實的全景環境,不僅能體驗行走的空間感、縱 深感,對網點的格局、設施、產品展示、展品細節、空間的大小也都能一目了然。
4)醫療場景:內置 AI 醫療系統的 AR 眼鏡可以用于病情診斷、遠程會診和醫療教學。
03
算力創新與需求共振
方正證券認為,英偉達以及AMD等核心公司的業務進展近況進一步印證了現階段板塊發展兩個核心要素:AI方向的持續產品迭代、龐大的算力需求:
首先從英偉達來看:H200 出貨在即,B100 在路上。2023年11月13日,英偉達發布首款搭載HBM3e 的GPU H200,借助HBM3e,H200 能以每秒4.8 TB 的速度提供141GB 內存,與NVIDIA A100 相比,容量幾乎翻倍,帶寬增加2.4倍。搭載HBM3e 的H200 在處理700 億參數的大模型時,推理速度較H100 快了整整一倍,能耗降低了一半。受HBM3E 供應限制,預計H200 將于24Q2 實現出貨。
英偉達B100原計劃發布時間為2024Q4,但由于AI 需求的火爆,已經提前至2024Q2,目前已經進入供應鏈認證階段,B100 將能夠輕松應對1730 億參數的大語言模型,比當前型號H200 的兩倍還要強大。
此外,B100 將采用更高級的HBM 高帶寬內存規格,有望在堆疊容量和帶寬上繼續突破,超越現有的4.8TB/s。根據英偉達產品路線圖,預計2025 年將推出X100,進一步豐富GPU 產品矩陣,鞏固英偉達AI 芯片龍頭地位。
與此同時,英偉達進軍定制AI芯片領域。根據 CNBC,英偉達目前正在策劃建立全新部門旨 在為云計算企業和其企業提供定制化芯片業務。根據 CNBC,定制化芯片或將專注 于滿足特定設備或者系統的性能和功耗要求,其中或將包含特定的處理單元,傳 感器集成、專用硬件加速器,以滿足特定領域的需求。
從AMD來看:MI300 正式發布,2024 年銷售收入上調。CoWoS+SoIC 賦能3.5D 封裝。2023 年12 月6 日,AMD 在Advancing AI 活動上宣布推出Instinct MI300X,采用了AMD CDNA3架構,搭載了8 塊HBM3,容量達192GB。與MI250X 相比,計算單元增加了約40%、內存容量增加1.5 倍、峰值理論內存帶寬3 增加1.7 倍。在某些工作環境中,性能可達H100的1.3 倍。
MI300X 采用3.5D 封裝,即通過混合鍵合技術實現XCD、I/Odie 的3D 堆疊,其次在硅中介層上實現與HBM 的集成,從而實現了超過1500 億個晶體管的高密度封裝。該封裝方案由臺積電提供,搭配SoIC 技術與CoWoS 技術共同實現。
報告稱,AI浪潮也在推動光模塊、交換機配套升級 :
Coherent:800G產品環比持續高增,2025 年順應AI 發展推進1.6T 商業化。2023Q4Coherent 實現收入11.31 億美元,高于指引中值,yoy-17.45%,qoq+7.41%。受益于人工智能的蓬勃發展, AI/ML 相關數據收發器連續第三季獲得強勁訂單,800G 產品季度收入突破1 億美元,環比增長超100%,800G出貨量持續強勁增長,FY2024 公司預計超50%的數據通信收發器收入將來自人工智能相關應用,2025 年向1.6T 產品商業化發展前進以順應AI 發展。
Arista:云、AI 和數據中心核心業務發展勢頭迅猛。Arista 在2023 年的核心業務由云、Al 和數據中心產品組成,建立在高度差異化的Arista 可擴展操作軟件系統堆棧上,部署了10G、25G、100G、200G 和400G 的速度。
Arista 云網絡產品提供了節能、高可用的區域,而不會增加冗余成本,因為數據中心對前端、后端存儲和計算集群的帶寬容量和網絡速度都有很高需求。Arista 預計400 和800 千兆以太網將成為Al 后端GPU 集群的重要試點,預計2025 年實現Al 網絡收入至少7.5 億美元。
本文主要來源于方正證券報告《AI 專題:AI 巨輪滾滾向前》分析師:鄭震湘(S1220523080004)佘凌星(S1220523070005)鐘琳(S1220523070006)劉嘉元(S1220523080001)有刪節。
免責聲明:本網站所有文章僅作為資訊傳播使用,既不代表任何觀點導向,也不構成任何投資建議?!?/div>
猜你喜歡
連連數字正式接入DeepSeek 聚焦智能研發、智能運營、智能辦公等領域應用
連連數字正式對外宣布已完成DeepSeek大模型的私有化部署。奇富借條APP登陸鴻蒙 以大模型打造金融端云一體服務
奇富科技最新發布的基于多模態大模型技術打造的AI伴侶小奇,也將很快在鴻蒙版本發布。
錦緞
共205篇文章
為上市公司提供知識產權解決方案