隨著云服務商優(yōu)先考慮AI研發(fā)、而非傳統(tǒng)服務器升級,資本支出正迎來一波猛增。
云基礎設施正在經(jīng)歷一場劇變,各家服務提供商爭相部署和配置用于AI模型訓練的服務器,甚至不惜以推遲其標準服務器硬件的正常更新周期為代價。
這波生成式AI熱潮正在重塑眾多云服務商的優(yōu)先事項序列。最近一份報告顯示,今年云數(shù)據(jù)中心基礎設施的資本支出將增長30%。
但Omdia云與數(shù)據(jù)中心研究主管Vlad Galabov進一步表示,哪怕是這樣的預測恐怕也跟不上現(xiàn)實情況的發(fā)展。
Galabov指出,“一部分云服務提供商剛剛表示,他們可能會將資本支出提高到超出此前預測的水平。再次提醒,預估的資本支出已經(jīng)增加了約三分之一,如果說還要進一步提高,那么將達到前所未有的規(guī)模。”
事實上,根據(jù)Omdia目前的估計,今年AI服務器將占到整體服務器資本支出的一半以上(66%),Galabov表示這的確非同尋常。
他同時提到,“我們從未見過如此顛覆性的態(tài)勢。現(xiàn)在,我們在此前的支出預測基礎上又上調(diào)了約100億美元。”
這筆大規(guī)模投資來自更廣泛的群體,而不僅僅是三大云服務商——也就是亞馬遜云科技、Azure和Google Cloud。其中涵蓋前十大云服務提供商,但同時也囊括了越來越多像CoreWeave這樣正在大力投資于專業(yè)AI云服務的提供商。
雖然目前66%的服務器支出用于支持AI硬件,但這部分開銷所對應的系統(tǒng)仍未占據(jù)云數(shù)據(jù)中心的大部分部署比例。事實上,根據(jù)Omdia的數(shù)據(jù),AI服務器僅占出貨量的19%,這也從側(cè)面表明這些塞滿GPU的設備有多么昂貴。
這就引發(fā)了新的問題:所有這些AI系統(tǒng)上的支出,是否會影響云服務商對現(xiàn)有服務器的更新能力。而且實際情況似乎還更加復雜,畢竟各大云基礎設施運營商還在更多定制化芯片上砸下了數(shù)十億美元,希望讓相應平臺運行得更加高效。
Galabov指出,“在最大的云服務提供商當中,我們正在積極整合其非AI服務器基礎設施,盡可能幫助其降低AI之外的成本。”
他告訴我們,最典型的例子之一就是谷歌對其視頻處理服務器的處置。該公司開發(fā)了一款名為視頻編碼單元(VCU)的定制化處理器,針對H.264視頻進行了優(yōu)化,其中一個協(xié)處理器甚至能夠取代兩臺英特爾Skylake服務器。
這意味著在公司的下一波更新期間,他們不再使用較新的服務器一對一替換Skylake服務器,而是通過一套配置有12個VCU的系統(tǒng)替換多臺舊服務器。
除此之外,谷歌還針對一種更加高效的視頻壓縮格式VP9優(yōu)化了該處理器,也就是說一臺擁有20塊VCU的服務器可以直接取代好幾個機架的Skylake服務器。
Galabov解釋稱,“也就是說他們無法更新好幾個服務器機架,而可以用一臺針對該應用程序高度加速和高度優(yōu)化的服務器將其替代,借此大大節(jié)約資金。”
“我們預計這種情況后續(xù)會越來越多。Meta也在做類似的嘗試,這很可能成為一種普遍趨勢。數(shù)據(jù)庫應用程序可能也會經(jīng)歷類似的優(yōu)化周期,Web基礎設施應用程序同樣如此。”
(例如Pliops等公司已經(jīng)推出了硬件加速器,能夠提高許多數(shù)據(jù)庫的底層鍵值存儲性能。)
與此同時,不少企業(yè)也沒有放棄自己的基礎設施、轉(zhuǎn)頭使用公有云資源,近期反而出現(xiàn)了一種將部分工作負載帶回內(nèi)部的趨勢——也就是所謂“云遣返”。
其中一個原因就是,許多公司發(fā)現(xiàn)使用公有云資源的成本可能根本就不比自主運營IT系統(tǒng)低,甚至往往更高。這背后雖然有著諸多因素的影響(亞馬遜云科技就常被指責存在計費方式過于復雜的問題),但多數(shù)情況下似乎主要由資源管理不善所引發(fā)。
Galabov表示,“基礎設施成本膨脹和基礎設施利用不足,導致許多企業(yè)投入云懷抱”。但在轉(zhuǎn)向云后,一部分用戶繼續(xù)沿用過去的管理實踐,即在習慣上仍然保留大量冗余基礎設施容量,最終導致需要為并未實際使用的資源而付費。
出于這個原因,Galabov認為未來市場應當更多關(guān)注設施規(guī)模的合理性,或者將工作負載放置在最合理的位置。Omdia將其稱為“云智能”,Galabov則表示這種表達已經(jīng)成為行業(yè)術(shù)語。
Galabov表示至少在不久的將來,他相信企業(yè)將越來越多地依賴IT即服務平臺(例如Dell Apex或者HPE Greenlake)進行內(nèi)部計算。
這些平臺既能夠為客戶提供與公有云服務相同的好處,同時設施又位于他們自己的數(shù)據(jù)中心或者主機托管站點之內(nèi)。供應商可以提供完整且預先配置的基礎設施,負責提供管理服務,并設有隨用隨付等計費選項。
他表示,“我個人認為應該不會出現(xiàn)大規(guī)模的下云趨勢,這更像是一種小規(guī)模的優(yōu)化手段。”
這方面的證據(jù)是,企業(yè)在云基礎設施服務上的支出比以往任何時候都更加強勁,今年第一季度的增幅達21%,來到760多億美元。
目前,所有這些支出中約有72%都流向了三大云服務商。不過同一項調(diào)查也發(fā)現(xiàn),Snowflake、MongoDB和甲骨文等二線云運營商的同比增長率更高。
也許這些挑戰(zhàn)者以及CoreWeave等專業(yè)AI提供商將逐漸削弱三大云巨頭的主導地位,或者說目前針對三大廠商的反壟斷審查將進一步推動市場開放,讓云領(lǐng)域的競爭變得愈發(fā)激烈。無論最終結(jié)果如何,云服務都將屹立不倒、堅定前行。