如今,我們正在見證計算領域巨大的創(chuàng)新階段,全球5G的快速部署與數(shù)據(jù)密集型工作負載以及生成型人工智能的突破性發(fā)展交織在一起。整個計算生態(tài)系統(tǒng)對靈活性的需求從未如此強烈,以創(chuàng)新和探索新型加速、新穎的系統(tǒng)架構(gòu)以及滿足不斷增長的數(shù)據(jù)消費需求的新方法。半導體設計成本上升和全球能源預算收緊帶來的額外挑戰(zhàn)意味著我們正處于全球計算基礎設施轉(zhuǎn)型之中。
5G與人工智能的結(jié)合蘊藏著巨大的機遇。5G技術(shù)可以提供人工智能應用收集、傳輸和處理大量數(shù)據(jù)所需的高吞吐量、低延遲和可靠的連接。作為回報,人工智能可以幫助5G網(wǎng)絡動態(tài)分配資源、管理流量和檢測異常。人工智能還可以利用5G為用戶和設備提供個性化、情境化的智能服務。這兩項技術(shù)將共同真正改變我們的溝通、工作和生活方式。
但每個故事都有兩個方面。5G 和人工智能給數(shù)據(jù)中心運營商和客戶帶來了重大挑戰(zhàn),因為兩者都會產(chǎn)生大量數(shù)據(jù),需要以靈活、及時、經(jīng)濟和節(jié)能的方式存儲、處理和分析。為了充分利用這個機會,數(shù)據(jù)中心架構(gòu)師需要圍繞計算的設計、構(gòu)建和部署方式尋找變革性方法。
5G虛擬RAN:邊緣數(shù)據(jù)中心的關(guān)鍵推動者
支持5G的關(guān)鍵創(chuàng)新之一是虛擬無線接入網(wǎng)絡 (vRAN)。vRAN 是一種相對較新的部署模型,正在流行。它將蜂窩基帶處理功能與硬件解耦,并將其作為軟件在通用服務器上運行。
這可以在部署和管理5G網(wǎng)絡時提供更大的靈活性、可擴展性和效率。虛擬化5G基礎設施的規(guī)模經(jīng)濟可以通過多種方式實現(xiàn)。第一,結(jié)合相同的計算基礎設施來服務5G連接和邊緣應用,使連接和數(shù)據(jù)處理更接近源;其次,軟件驅(qū)動的云原生基礎設施可實現(xiàn)動態(tài)資源分配、負載平衡、更快的配置和自動化網(wǎng)絡管理,這對運營效率產(chǎn)生巨大影響。第三,借助光纖連接,vRAN可以將多個基站匯集到一個集中式服務器池中,從而降低5G基礎設施的成本和復雜性。
通過使計算能力更接近最終用戶及其設備,vRAN可以促進邊緣計算,同時減少延遲并提高性能。
但為了充分發(fā)揮其潛力,vRAN需要計算平臺能夠支持高吞吐量、低延遲和確定性的無線電信號處理,同時保持非常高的計算效率。它還需要高速網(wǎng)絡接口來處理服務器、無線電和終端設備之間的大量數(shù)據(jù)流量,這進一步強調(diào)了對變革性方法的需求。
當今的5G數(shù)據(jù)中心:CPU和DPU
傳統(tǒng)通用CPU無法處理5G vRAN堆棧復雜且多樣化的工作負載。通過將所有網(wǎng)絡功能虛擬化為軟件,包括操作系統(tǒng)、網(wǎng)絡層、應用程序和協(xié)議,數(shù)據(jù)中心內(nèi)的流量急劇增加,從而降低了CPU效率。為了應對這一挑戰(zhàn),CPU需要一個補充性的專用加速設備,可以卸載CPU的網(wǎng)絡任務,以提高性能和效率。當今5G數(shù)據(jù)中心最流行的加速設備之一是數(shù)據(jù)處理單元 (DPU)。
5G 基礎設施中的人工智能(來源:Arm)
DPU是具有嵌入式處理器或可編程邏輯的網(wǎng)卡,可以執(zhí)行網(wǎng)絡功能,例如數(shù)據(jù)包處理、加密/解密、壓縮/解壓縮、負載平衡、防火墻、路由/交換和服務質(zhì)量 (QoS)。DPU可以通過接管部分網(wǎng)絡相關(guān)任務來幫助降低服務器的CPU利用率和功耗,從而實現(xiàn)根據(jù)不同場景配置和優(yōu)化網(wǎng)絡功能的靈活性和可編程性。
異構(gòu)計算為未來的工作負載增加了更多靈活性
雖然當今的5G數(shù)據(jù)中心已經(jīng)利用CPU和DPU來支持vRAN和其他5G應用,但下一代5G數(shù)據(jù)中心將需要在硬件架構(gòu)、軟件平臺和服務模型方面提供更大的靈活性。例如,數(shù)據(jù)中心可能使用GPU來處理復雜的數(shù)學、圖形、視頻或其他大型數(shù)據(jù)集;用于機器學習工作負載的GPU或TPU;以及用于可編程邏輯的FPGA,以解決更多自定義工作負載。
這種類型的異構(gòu)計算有助于提高融合智能邊緣數(shù)據(jù)中心的性能、效率和可擴展性,這些數(shù)據(jù)中心可以提供更接近最終用戶的RAN服務、云計算能力和人工智能應用服務。最終,將更專業(yè)的計算移至更靠近設備和最終用戶的位置,可以改善延遲并實現(xiàn) 5G 所承諾的許多下一代用例。
軟銀、英偉達和Arm最近宣布合作,旨在為人工智能和高性能計算 (HPC) 創(chuàng)建世界上最先進的數(shù)據(jù)中心。它是當前此類數(shù)據(jù)中心轉(zhuǎn)型的最佳示例之一,具有專門的處理功能。此次合作預計將為基于Nvidia GH200 Grace Hopper超級芯片的生成式AI和5G/6G應用提供一個開創(chuàng)性的平臺,軟銀計劃在日本各地新的分布式AI 數(shù)據(jù)中心推出該平臺。與過去使用的數(shù)據(jù)中心相比,新數(shù)據(jù)中心的分布將更加均勻,并可處理人工智能和5G 工作負載。這將使他們能夠以低延遲更好地以峰值容量運行,并大幅降低總體能源成本。
軟銀將與Nvidia合作建立數(shù)據(jù)中心,為在全球范圍內(nèi)快速部署生成式AI應用和服務鋪平道路,該數(shù)據(jù)中心可以在多租戶通用服務器平臺上托管生成式 AI 和無線應用,從而高效節(jié)能、降低成本并提供更多服務。
此類創(chuàng)新代表了5G和人工智能的重要拐點。整個數(shù)據(jù)中心圍繞專業(yè)處理提供的目標性能而構(gòu)建,為運營商提供實現(xiàn)vRAN潛力所需的運營效率。此外,專業(yè)處理使運營商能夠在同一物理位置共同托管計算密集型服務,例如人工智能或3D視頻會議 - 更靠近數(shù)據(jù),更靠近用戶。這一點至關(guān)重要,因為靈活性、低延遲和性能效率確保了計算資源及其所需資本和能源成本的最佳利用,從而改變了整個數(shù)據(jù)中心的TCO(總擁有成本)。
當我們展望下一代5G數(shù)據(jù)中心時,對靈活高效的計算平臺的需求至關(guān)重要。為了滿足在 5G 和人工智能的推動下對數(shù)據(jù)中心服務不斷增長的需求,下一代數(shù)據(jù)中心將被定義為適應新技術(shù)和工作負載的能力,并提供企業(yè)和消費者所需的性能和效率。因此,我們將繼續(xù)將高效、專業(yè)的芯片視為該領域創(chuàng)新和轉(zhuǎn)型的基礎。