隨著生成式人工智能(GenAI)日益普及,很多組織的CIO開始優(yōu)化他們的IT系統(tǒng),以充分挖掘AI技術的潛力。例如,美國電信巨頭AT&T部署了3000多個AI機器人實施重復性任務,達美航空公司(Delta Airlines)使用AI IT運營管理平臺來減少服務中斷對客戶的影響。
然而,隨著IT環(huán)境的更新,也需要對IT基礎設施進行更新和改造。數(shù)據(jù)中心的發(fā)展速度難以跟上AI為組織帶來的好處。其中許多組織針對AI進行了優(yōu)化,以實現(xiàn)運營自動化、改善資源管理、增強網(wǎng)絡安全并提供更好的服務。
盡管如此,數(shù)據(jù)中心仍無法提供大規(guī)模開發(fā)和實施AI應用所需的資源,一個新的生態(tài)系統(tǒng)應運而生,那就是AI工廠。
AI工廠是做什么的?
AI工廠或AI數(shù)據(jù)中心是為滿足AI的特定需求而設計的設施,為部署復雜的AI應用程序和模型提供基礎設施和資源。
AI工廠的目的類似于數(shù)據(jù)中心和生產(chǎn)工廠。就像工廠生產(chǎn)產(chǎn)品一樣,AI工廠生產(chǎn)“智能”,然后采用智能運行AI模型和其他資產(chǎn)以及IT系統(tǒng)。
Artefact咨詢總監(jiān)Nina Abide表示,“AI工廠通過標準化流程簡化了AI模型的生產(chǎn),實現(xiàn)了跨行業(yè)的高效擴展。它們涵蓋了從數(shù)據(jù)準備到模型部署的各個階段,并利用自動化來提高速度和效率。”
AI工廠的一個固有特征是生成智能。AI工廠處理大量數(shù)據(jù),以產(chǎn)生智能并更新其運營的系統(tǒng),或者創(chuàng)建包括文本、圖像、視頻或音頻內容在內的輸出。AI工廠產(chǎn)生的智能也可以作為命令來控制機器人或超級計算機等系統(tǒng)。
2024年3月,英偉達CEO黃仁勛在GTC大會上發(fā)表演講時介紹了AI工廠的藍圖,他將其定義為“將原材料轉化為有價值的新產(chǎn)品的地方”。他將AI工廠稱之為“新工業(yè)革命的家園”。
他說,“AI工廠輸入的原材料是數(shù)據(jù)和電力,生產(chǎn)的產(chǎn)品是數(shù)據(jù)令牌(tokens)。令牌是不可見的,可以發(fā)送到世界各地,它是非常有價值的。”
企業(yè)構建AI工廠的方法
作為專門建造的設施,AI工廠允許在IT環(huán)境中全面實施AI。這些量身定制的數(shù)據(jù)中心擁有將GenAI部署到IT運營中所必需的硬件和軟件,從而提高效率、可擴展性和創(chuàng)新性。
Arcadis全球制造總監(jiān)Martijn Karrenbeld說,“AI工廠可以通過流程自動化和工作流程優(yōu)化來提高效率。其中一個真正的好處是能夠通過簡化制造過程來降低運營成本。這為未來的擴大業(yè)務規(guī)模提供了更多的組織靈活性和可擴展性,從而加快了上市速度。”
AI工廠是如何運作的?
AI工廠背后的理念是訓練AI模型來產(chǎn)生智能。為此,相關數(shù)據(jù)被輸入到計算系統(tǒng)的模型中,這樣它就可以分析數(shù)據(jù)并做出預測。
如果這些預測是準確的,AI模型就會得到訓練,并可以通過AI推理過程開始執(zhí)行所需的任務。
與傳統(tǒng)數(shù)據(jù)中心相比,AI工廠需要更多的電力、能源和冷卻解決方案。事實上,由于這些設施通常是為處理大量數(shù)據(jù)和開發(fā)或培訓新系統(tǒng)而設計的,因此需要采用高性能服務器機架、專用硬件加速器、大型存儲系統(tǒng)和網(wǎng)絡基礎設施。
為了能夠處理相關的工作負載,AI工廠采用專門的IT硬件建造,其中包括定制設計的AI芯片和圖形處理單元(GPU)。