宋慶春指出,當前數據中心異構算力需求正在不斷提升,主要包括三個方面,一是HPC高性能業(yè)務不斷增長;二是AI應用對算力需求正在不斷提升,包括大規(guī)模訓練、推薦、推理系統(tǒng)等均需要大規(guī)模算力支撐;三是數字孿生、元宇宙等技術發(fā)展,對高性能、AI算力需求快速增長。多種異構算力需求場景的涌現也對數據中心算力基礎設施發(fā)展帶來巨大挑戰(zhàn),用戶一方面需要算力平臺提供高可靠的算力性能,另一方面又希望算力平臺的功耗維持在較低水平。
“在傳統(tǒng)計算架構中,CPU要參與到除加速計算外的所有事情,容易產生系統(tǒng)性能瓶頸,在性能和能耗間難以實現協(xié)同提升。”宋慶春講道。對此,他認為云原生超級計算架構能夠有效平衡性能提升和節(jié)能減排,是未來數據中心計算架構的重要方向。
宋慶春表示,云原生超級計算架構的核心是將原先由CPU執(zhí)行的操作卸載到DPU上,將存儲、計算框架等管理平面上的操作同樣卸載到DPU上,釋放CPU、GPU資源,使CPU、GPU能夠更加集中的處理業(yè)務,DPU上的算力也可實現算力共享,最終確保CPU、DPU、加速器和網絡協(xié)同工作,數據在哪里,計算就在哪里,由此形成更高性能、更環(huán)保、更安全的計算平臺。
最后,宋慶春總結道,NVIDIA將持續(xù)關注網絡異構計算的發(fā)展,為用戶提供高性能、低功耗的計算、存儲及網絡產品,提供高品質的云原生超級計算架構,促進數據中心異構計算向前發(fā)展。