隨著人工智能(AI)技術(shù)的快速發(fā)展,全球?qū)?shù)據(jù)的需求正以前所未有的速度增長保護好。大容量數(shù)據(jù)中心作為數(shù)據(jù)存儲和處理的核心能力和水平,面臨著前所未有的挑戰(zhàn)。本文將探討在AI數(shù)據(jù)需求飆升的情況下充足,數(shù)據(jù)中心如何保持冷靜註入了新的力量,即如何有效應對這些挑戰(zhàn)。
技術(shù)趨勢與挑戰(zhàn)
高速傳輸技術(shù)的發(fā)展
根據(jù)中興通訊的報告異常狀況,為了應對數(shù)據(jù)量的激增說服力,數(shù)據(jù)中心需要采用高速傳輸技術(shù),如超過400Gbit/s的單波傳輸更多可能性、波段擴展深刻變革、空間分割復用(SDM)、光層運維管理(OAM)以及性能監(jiān)測等技術(shù)分析。這些技術(shù)的進步不僅在學術(shù)研究中得到體現(xiàn)至關重要,也在行業(yè)標準化中發(fā)揮作用。預計到2030年,人類將進入堯字節(jié)級別的數(shù)據(jù)量時代逐漸顯現,網(wǎng)絡(luò)通信需要處理2000億個連接,接入帶寬需求高達太比特每秒重要性,單纖容量突破100Tbit/s著力增加。
AI算力的增長
華為預測,到2030年全球AI計算算力將超過105ZFLOPS(FP16)系統穩定性,AI計算算力成為數(shù)據(jù)中心發(fā)展的最大驅(qū)動力和決定性因素背景下。這意味著數(shù)據(jù)中心需要在算力規(guī)模、架構(gòu)發展契機、算法優(yōu)化穩定、跨網(wǎng)協(xié)同等領(lǐng)域持續(xù)創(chuàng)新和快速迭代。
應對策略
提升能源使用效率
數(shù)據(jù)中心的總耗電量在ICT行業(yè)占比超過80%齊全,提升能源使用效率廣泛關註、實現(xiàn)綠色低碳是數(shù)據(jù)中心可持續(xù)發(fā)展的首要任務。例如機製,美國政府通過數(shù)據(jù)中心優(yōu)化倡議(DCOI)要求新建數(shù)據(jù)中心PUE低于1.4.老舊改造數(shù)據(jù)中心PUE低于1.5.
跨數(shù)據(jù)中心資源整合
隨著云計算各項要求、低時延大帶寬網(wǎng)絡(luò)互連技術(shù)的發(fā)展,跨多個數(shù)據(jù)中心的資源整合成一個“虛擬數(shù)據(jù)中心”發力,實現(xiàn)業(yè)務的Regionless化優勢與挑戰,即業(yè)務部署對地域無感知,實現(xiàn)數(shù)據(jù)的高可靠越來越重要的位置、業(yè)務的連續(xù)性去地域化問題分析。
基于AI的高可靠技術(shù)
數(shù)據(jù)中心將利用AI技術(shù)提前預防發(fā)現(xiàn)隱患迎來新的篇章,與內(nèi)部環(huán)境和外部環(huán)境結(jié)合,利用AI預防算法深度自學習不負眾望、大數(shù)據(jù)分析算法共同學習,進行災難關(guān)聯(lián)智能預測,并做到自動化預防響應改善。
數(shù)據(jù)中心數(shù)字孿生技術(shù)
數(shù)字孿生技術(shù)通過歷史數(shù)據(jù)、實時數(shù)據(jù)、算法模型等推廣開來,實現(xiàn)對物理實體全生命周期的模擬空白區、驗證、預測密度增加、優(yōu)化應用優勢、控制。在數(shù)據(jù)中心設(shè)計信息化、建設(shè)發展需要、運維階段的應用將大幅提升數(shù)據(jù)中心自動化、智能化水平全方位。
異構(gòu)算力池化
隨著AI大模型及元宇宙數(shù)字孿生時代的到來信息,云上GPU/NPU異構(gòu)算力將逐步取代通用CPU成為AI大模型訓練推理的關(guān)鍵生產(chǎn)資料。通過軟件定義的GPU/NPU池化算力管理,實現(xiàn)CPU與GPU設(shè)備的解耦廣泛關註,提供更有彈性的資源。
無損數(shù)據(jù)中心網(wǎng)絡(luò)
為了實現(xiàn)無損網(wǎng)絡(luò)組建,在數(shù)據(jù)中心內(nèi)部將引入超融合交換技術(shù)覆蓋,實現(xiàn)零丟包、10us級的低時延轉(zhuǎn)發(fā)能力進展情況。同時重要的作用,跨數(shù)據(jù)中心也需要具備無損網(wǎng)絡(luò)的能力,為時延敏感類應用提供零丟包研究、確定時延的通信保障搶抓機遇。
結(jié)論
大容量數(shù)據(jù)中心在AI數(shù)據(jù)需求飆升的情況下,需要通過技術(shù)創(chuàng)新去創新、資源整合相互配合、智能化管理等策略來保持冷靜。這不僅涉及到硬件和軟件的升級品質,也涉及到數(shù)據(jù)中心運營模式的轉(zhuǎn)變。通過這些措施慢體驗,數(shù)據(jù)中心可以更有效地應對AI時代帶來的挑戰(zhàn)深化涉外,為數(shù)字經(jīng)濟提供更可靠的支持全會精神。
來源:千家網(wǎng)