中國算力的想象力有多大?
-
收藏
0
2023年初,在青島、濟南、日照等12座城市,一座座嶄新的大型數據中心拔地而起。
其中,最引人矚目的屬2月23日,在青島嶗山區的青島人工智能計算中心。這是山東省第一個上線運行的人工智能計算中心,算力規??蛇_250P。
在青島這座城市,既有像卡奧斯這樣的工業互聯網平臺型企業,也有像創新奇智、極視角、以薩技術等人工智能服務商。這些企業對算力、算法和數據有著龐大的需求。
像青島人工智能計算中心這樣的項目,最近兩年不在少數。而如今,人工智能再一次引爆算力需求。
前有ChatGPT誕世,后有百度“文心一言”,還有鮮為人知的claude+,由Anthropic公司開發;騰訊近日也宣布研發ChatGPT聊天機器人。
為什么ChatGPT爆火后,國內外大廠都前仆后繼地參與?又為什么OpenAI的ChatGPT被稱為“一直被模仿,從未被超越”?
1956年,人工智能開始發展,60年一直不溫不火,直至2017年,Alphago打敗圍棋世界冠軍,才算AI破圈的開始。決定AI的三大核心要素是數據、算法和算力。
首先,全球最不缺的就是數據,尤其在中國,14億人口平均人手1.6部智能手機,未來隨著物聯網技術的完善,每人會生產出更龐大的數據量;其次是算法和算力,一個形象的比喻是,數據等于廚師炒菜用的食材,算法是菜譜,算力則相當于廚師的廚藝。而在中國,拖后腿的是算法和算力。
據OpenAI近日發布的數據,截止目前人們對算力的需求已增長超30萬倍。然而,就在各國加速布局算力產業之際,2022年美國商務部禁止了高端芯片設備及人工智能芯片的對華出口。這直接影響了英偉達和AMD兩大供應商對A100和H100兩款高端加速卡的出口。
“1萬枚英偉達A100芯片是做好AI大模型的算力門檻”,這是行業內公認的標準。H100則是比A100性能更高的芯片。
ChatGPT能有今天的突破,微軟功不可沒。構建“永遠改變人機交互方式”的超級計算機,是OpenAI五年前的豪言壯志。為了幫助實現這個大膽的想法,微軟斥資數億美元做了一場賭注。這其中面臨的難題是前所未有的,比如在Azure云計算平臺上連接幾萬個英偉達A100芯片,再比如打造指數級增長的網絡GPU集群規模等。還好,微軟賭贏了。
在算法上,ChatGPT依然使用2017年論文中發布的Transformer,該算法原本的應用場景是翻譯,因此它不僅具備英語語言能力,也有中文語言系統,這解釋了為什么GPT能夠進行中文對話;但性能提升主要在算力上,ChatGPT這種大規模分布式訓練已經超出了摩爾定律的限制,上萬個A100芯片讓算力暴漲1萬倍,這種算力消耗前所未有。目前,ChatGPT依賴于A100芯片,未來若投入H100,性能會有更大提升。
AI技術不斷演進,對算力的需求也呈指數增長。據中國信通院預測,到2030年,近70%的公司都會用到人工智能。企業數字化轉型也需要算力支撐,在中美芯片競爭博弈背景下,自建算力系統迫在眉睫。
王堅在3月30日出席財富全球科技論壇時也談及到算力的重要性,“算力與‘電氣化’同等重要。而算力和電力一樣,只有極少數技術能幫助人類去做創新,這就是算力的重要性?!薄?
回到文章開篇的兩個問題,之所以國內外大廠有能力開發聊天機器人,是因為其背后所需的技術并不難,像百度和華為都有自研芯片,文心一言就依賴于百度自研的昆侖芯;而之所以“從未被超越”,是因為ChatGPT背后巨大的算力支持,至少從現在來看,國內還需要時間。
一
一個萬億級的算力市場
ChatGPT打破了摩爾定律的限制,也引爆了對AI算力的需求。GPT-4的算力消耗遠大于GPT-3和3.5,OpenAI也在不斷對Plus付費用戶調低閾值,將訪問限制由第一天的150 msg/4hr降至最近的25msg/3hr,簡言之,就是減少用戶的提問次數,從而降低算力消耗。
具體來看,據GPT-4的公開數據,在32K的上下文長度下,每1000個token的提問成本為0.06美金,回答完成成本為0.12美金。與GPT-3的成本對比,GPT-4的輸入成本增加了50%-200%,輸出升本增加200%-500%。
由ChatGPT帶來的算力恐慌也蔓延到了國內。
近日,多只國產芯片股大漲。截至3月29日13:39,芯片 ETF 龍頭漲幅 4.37%,立昂微、北方華創漲停,中微公司漲超 9%,思瑞浦、瀾起科技漲超 8%,滬硅產業-U、兆易創新、景嘉微漲超 5%。
可以說,中國是一片巨大的算力藍海。一方面,人工智能的發展帶動數據流量增長,從而使算力規模激增;另一方面,算力深度融入互聯網、電信、金融、制造等行業,助推各行業各領域完成數字化轉型。據中國信通院統計,截至2022年,算力需求最大的行業是互聯網,占整體算力份額的近一半,其次,政府、服務和電信業也在加大算力投入,占比分別為12%、10%、7.2%。
中國各行業算力應用分布情況
從電商到社交,從游戲到金融,從醫療到教育,互聯網各行各業都需要算力。以電商巨頭阿里為例,每天數十億的交易數據,單是搜索引擎就需要處理數百億個商品數據,這還只是在搜索和推薦商品的場景。另外,阿里還有兩大塊風控系統,一塊是金融領域,主要業務是支付寶,另一塊非金融領域,如新零售、高德、大文娛等。這些都需要巨大的算力在背后支撐,進行存儲和分析數據,或識別和預防欺詐。
2022年8月30日,阿里云啟動了張北超級智算中心,AI算力總規模為12 EFLOPS(每秒1200億億次浮點運算),據說超過了谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成為全球最大的智算中心。2023年3月,百度也完成了陽泉智算中心的升級,算力規模達4 EFLOPS,成為目前亞洲最大單體智算中心。
智算中心的建設是為AI大模型訓練、自動駕駛、空間地理等人工智能探索應用,提供智能算力服務。近年來,智能算力增長最為迅速。據IDC發布的數據,2022年,我國智能算力規模達268 EFLOPS,預計未來5年,我國智能算力規模的年復合增長率將達52.3%。
而國家大力布局智能算力產業的背后,是智能算力存在的巨大供給“鴻溝”。據IDC預測,未來三年新產生的數據量將超過過去三十年的總和。這個鴻溝就表現在,數據總量在增長,真正被有效利用的數據占比卻不足1%。中國工程院院士王恩東在《瞭望》新聞周刊中說道,“目前無法具體統計AI算力缺口數據,但中國在加速數字化轉型”,在這過程中,需要AI算法利用深度學習,訓練出深度神經網絡模型,這需要足夠強的算力支撐。
未來,74.5%的企業都會用到AI,在智能算力方面,主要應用包括AI語音技術、大數據分析與機器學習、圖像識別與處理及自然語言處理。像電商、智能家居、在線教育和人工智能等互聯網行業對智能算力需求非常大。比如,阿里旗下的天貓需要智能算力開發“推薦算法”和“超級搜索”,或用于個性化定制和營銷策略;再比如小米生態鏈公司Yeelight的智能家居系統,也需要算力實現智能化聯動和語音控制。
如今,各國間的算力博弈進入白熱化階段。據中國信通院統計,2022年,我國服務器規模約2000萬臺,算力規模超150 EFlops,位居世界第二,僅次于美國;預測2023年,在ChatGPT引爆算力需求的背景下,中國算力規模將超200 EFlops。
巨頭入場和“東數西算”的助推,讓中國離這個萬億級算力藍海更近了一步。
二
巨頭造芯,算力能否跨越“卡脖子”困境?
2021年,字節下場造芯了,先是從百度截胡了三位芯片相關人才,而后又去華為海思、Arm、高通等公司“三倍(薪資)挖人”。這一波波操作引發了互聯網大廠的“芯片人才熱”。
早在自研芯片這一信號傳出之前,字節跳動就接連投資了RISC-V公司睿思芯科、AI芯片公司希姆計算、GPU芯片設計獨角獸摩爾線程、泛半導體行業智能制造商潤石科技、數據中心網絡芯片公司云脈芯聯、開發衍射光學芯片的公司光舟半導體等。
字節下場造芯只是一抹縮影,高薪挖人也是互聯網大廠追逐芯片夢的慣用手法。除了字節跳動,還有阿里、百度和騰訊。在一眾互聯網大廠中,最先吃螃蟹的人是百度。
故事開始于2010年,“這在當年是百度的一個秘密項目。”百度高級副總裁曾透露。百度最初嘗試用FPGA架構研發AI芯片,然而它一開始并沒有完全自研,而是同Arm、紫光展銳和賽靈思等公司合作,推出數款AI芯片,后來才走上自研的道路。2018年7月,百度正式發布其自研AI芯片“昆侖芯”,并于2020年量產。
2021年,昆侖芯的業務被獨立了出來,由百度芯片首席架構師歐陽劍出任昆侖芯片公司CEO。同時,該公司也在3月完成獨立融資,首輪估值約130億元,自此,中國誕生了一家國產芯片超級獨角獸。
阿里也緊跟步伐。在百度開始“秘密項目”的五年后,2015年,阿里巴巴宣布與集成電路設計企業杭州中天微合作,兩年后又向中天微注資5億元,宣布向芯片基礎架構設計領域進軍。2017年10月,阿里達摩院成立,成立之初就將芯片列為研究領域之一。到了2018年,阿里進一步收緊腳步,于8月聯合中天微成立平頭哥半導體芯片公司。
從這一年開始,阿里的成績就尤為顯赫。從玄鐵902到玄鐵910,從含光800到倚天710、羽陣600,這些是阿里5年的成績單。2023年3月2日,阿里平頭哥首次展示RISC-V生態全景,并預測到2025年RISC-V架構芯片有望突破800億顆。中國工程院院士倪光南在會上表示,“今天RISC-V是中國CPU領域最受歡迎的架構,中國芯片產業和整個芯片生態將會越來越多地聚焦于RISC-V架構,中國的巨大市場也將成為支撐RISC-V的重要基地?!?
而早有造芯意識的馬化騰,卻是最后一個入場,動作也略顯低調。2016年,騰訊參與了可編程芯片公司Barefoot Networks的2300萬美元C輪融資。隨后銷聲匿跡了兩年,在2018年,馬化騰在論壇演講中表達了做芯片的想法。三年后,才在騰訊官網上看到其發布的招聘信息:芯片架構師、芯片驗證工程師、芯片設計工程師等。對此,騰訊回應,只是在特定領域有芯片研發的嘗試,比如AI加速和視頻編解碼。
騰訊除了在芯片領域的投資,自研方面的成績在一波三折后,終于柳暗花明。
早在2015年,FPGA剛進入主流視野,沒有硬件基因的騰訊做過一次“造芯”的探索,但FPGA畢竟是“半定制”的電路,云端商業化還是失敗了,最后團隊人員遺憾告別。然而受挫之后,騰訊并沒有放棄對硬件之路的思考,中國芯片行業也在2018年回暖。一年后,騰訊內部傳來了聲音,“AI芯片,要不要做?”雖然這一聲音遭遇過反對,但騰訊還是進行了小規模地試水,“蓬萊”芯片也就此誕世。
2020年1月,蓬萊芯片流片完成,經過四次嘗試,“蓬萊”被點亮了。2021年11月,在騰訊數字生態大會上,又一口氣發布了三款專用芯片:紫霄、滄海和玄靈,分別專注于AI計算、視頻優化和智能網絡。
如今,字節、百度、阿里、騰訊全部跨界,齊聚芯片行業,究其原因,無非是由需求端和供給側,兩者的合力共同拉動。
“字節跳動光服務器所需要的芯片就是幾十萬塊,只要達到自產自銷就能降低成本。何況還有Pico,一旦VR/AR產業爆發,算力就是瓶頸,所以現在自研芯片也算是未雨綢繆。”華南一家AI芯片公司的資深架構工程師李波透露。
不僅是字節,騰訊也是如此。2019年,騰訊迎來云計算業務上的里程碑——云服務器規模突破100萬。以更低成本提供更高的網絡性能,成為當時騰訊面臨的一大難題。
除了中國的互聯網巨頭,美國的亞馬遜、谷歌也在自研芯片。2014年,谷歌為數據中心設計了服務器芯片,2019年又在印度組建團隊,其芯片用途主要在云端和智能設備上;亞馬遜也于2018年發布其首款自研云服務器CPUGraviton,未來預計還會推出應用于物聯網和智能設備的芯片。
從需求端來看,互聯網大廠和云計算公司造芯是未雨綢繆。未來,大部分互聯網廠商都會進入物聯網和智能設備等領域,而這些領域十分倚重硬件。所以,軟硬一體是未來互聯網公司和云計算廠商的必由之路。另外,很重要的一點,在市場層面,想要守住市場地位,實現差異化,底層硬件設施是關鍵,它直接影響著上層軟件的性能。
對于國內互聯網大廠紛紛跨界造芯,除了美國限制高端芯片的對華出口,還有兩點更重要的原因——成本和針對性。早前,在英偉達芯片還沒有嚴禁向中國出口時,很多互聯網大廠就已經表示過,由于算力需求龐大,英偉達的GPU芯片又太貴,大規模購買成本十分高昂。而且英偉達芯片屬于通用型,并不能針對特定某家企業算法做優化。那么對芯片有不同場景需求的互聯網大廠,比如在AI加速器和視頻編解碼場景,想實現成本功耗最低、性能最優,自研是必選項。
從供給側來看,國內芯片廠商和互聯網大廠造芯都已具備足夠成熟的技術。而需求方下場做芯片最大的優勢在于,對需求的理解和洞察最深刻。
以阿里的含光為例,在2019年云棲大會上,阿里用4顆含光800芯片,就代替了40顆傳統GPU才能完成的視頻處理任務。而前者的成本,是后者的十分之一。騰訊的紫霄也打破了算力的瓶頸點,在圖片和視頻處理、自然語言處理、搜索推薦等應用場景下,性能是業界標品的2倍。
應用于百度“文心一言”的昆侖芯則更勝一籌。從算力和成本上,昆侖芯都要強于英偉達 A100芯片,只是在訓練量上還相對較弱。據官方介紹,昆侖芯基于7nm工藝打造。在業界,7nm的蝕刻尺寸意味著,芯片的工藝水平更高,單位體積內的集體管更多,芯片性能也就更強。昆侖芯的算力可達到 256TOPS@INT8 以及 128 TFLOPS@FP16。目前,昆侖芯在百度內部已落地了搜索、小度、無人駕駛等AI業務場景。
芯片是一個全球性的產業,從芯片制造角度分析,沒有任何一個國家能自己完成芯片的制造,這是不爭的事實。另外,我國芯片行業發展的另一大難題是芯片人才短缺。據相關數據統計,2025年我國芯片專業人才缺口將超30萬人。但從長遠來看,互聯網大廠跨界造芯、高薪搶人,也向供給端發送了芯片人才短缺的信號。
盡管如此,互聯網公司下場造芯,已經解決了一部分問題,在特定場景下,應用性更強,成本也更低。算力也因此有望跨越“卡脖子”困境。
三
中國的算力有多大想象力?
為什么說芯片是全球性產業,任何國家都很難不借助外力造出來?
第一,芯片的科學原理很難。這一點可以從芯片人才短缺上去理解,目前,只有清華、上交、復旦、中科大、電子科技大學等幾所知名高校設有芯片相關專業。從這一現象就足以窺探,芯片科學原理的難度。
第二,芯片的工藝制造很難突破瓶頸。芯片加工和制造就是兩個最難的環節。芯片制造離不開光刻機,一臺光刻機至少有10萬個零部件,而一臺汽車的使用零部件只有5000個,足以想像光刻機的制造難度之大。制造芯片更是需要數百道工藝,有些工序還要循環數十遍。
第三,EDA軟件(電子設計自動化軟件)也是國內一大瓶頸。EDA軟件的用處是讓電子設計師實現在電腦上設計芯片,否則就需要人工設計、試驗,要耗費的人力和時間成本不計其數。但目前我國應用的十幾種EDA軟件都來自美國。如果自己做EDA研發十分困難,它的算法就決定了芯片設計的優劣。而如果EDA軟件質量不夠,設計師就不可能設計出高質量的芯片。
除了芯片層面,我國算力產業發展還受到建設方面的問題。比如不同芯片、操作系統、固件、整機系統兼容性不強,制約了產業的進一步發展。中國信通院王駿成認為,“算力應用存在標準缺失、數據共享不夠、資源接口不統一等壁壘”,導致算力供需失衡。
對此,國家已于2022年初提出建設“東數西算”工程,助力打通我國東西部數字產業的“大動脈”,為經濟發展注入新動能。國家信息中心郭明軍表示,通過該工程實現東西部算力資源的流通,依托算力網絡,把算力真正用起來,實現“算力入戶”、“算力入企”、“算力入園”、“算力入?!?。
在算力網絡建設層面,三大運營商成為算力網絡的主導者。據《財經十一人》,2022年三大運營商云業務總營收1352億元,增速超過100%。“三大運營商每年都要花費千億元規模的資本開支用于基礎設施建設。2022年,中國移動、中國電信和中國聯通的資本開支分別為,1852億元、952億元和742億元?!逼滟Y本投入已超過BAT三大互聯網公司。
目前來看,國家層面、運營商和企業都在加大力度布局算力網絡。在此前提下,這一輪生成式AI技術演變能帶來多大規模的算力爆發?對產業格局會產生怎樣的影響?
首先,生成式AI會消耗巨大的算力,從而帶動對算力產業的需求。當下,互聯網大廠BAT早已憑借自身在芯片領域的多年沉淀,開始投入大模型研發。所以,最先受益的會是ICT企業。
其次是頭部大公司,互聯網廠商自研芯片,也會將能力外溢給合作平臺和客戶,從而讓頭部廠商受益。
最后一輪機會則留給創業公司,生態產業鏈的完整會受益千行百業,這也是生成式AI對各行業的顛覆,只是等到創業公司感受到變化,還需要一段時間。
免責聲明:本網站所有文章僅作為資訊傳播使用,既不代表任何觀點導向,也不構成任何投資建議。】
猜你喜歡
“算力天使”光模塊,是如何從中國卷向全球的?
在全球整個AI算力產業鏈分工上,“算力天使”正是當下中國的比較優勢板塊。毋論英偉達還是Meta,都在這一細分領域離不開它的中國產業鏈伙伴。“困在”服務器里的浪潮信息,還能搭上AI風口嗎?
近期,OpenAI基于視覺美學推出首個文生視頻模型Sora,迅速成為全球科技圈熱點,新型AI服務器時代浪潮信息能否吃到這波紅利呢?“算力沙皇”的權杖,圈出了AI 2024的方向
英偉達本周公布了最新季報。比起超預期的財務數據,電話會議才是真正的看點:AI的2024怎么走?“算力沙皇”的權杖,指明了潮水的方向。本文主要記錄電話會紀要內容。多種手段虛增收入,算力概念熱門股鴻博股份“觸雷”
今年漲幅最高超500%的算力概念股鴻博股份(002229.SZ)忽然“觸雷”。由于通過多種手段虛增主營業務收入,收到監管警示函。