給數(shù)據(jù)中心運維帶來極大挑戰(zhàn)
數(shù)據(jù)中心云化帶來了資源池化共享、業(yè)務(wù)快速發(fā)放、自動化部署等等諸多好處的同時,也給網(wǎng)絡(luò)運維帶來巨大的挑戰(zhàn)。據(jù)統(tǒng)計,隨著數(shù)據(jù)中心云化,5年間管理對象已增加10倍,網(wǎng)絡(luò)故障數(shù)增加了18倍以上,傳統(tǒng)的運維管理方式已經(jīng)明顯力不從心。
同時,大數(shù)據(jù)技術(shù)的蓬勃發(fā)展也加速了商業(yè)創(chuàng)新,企業(yè)對業(yè)務(wù)可用性的要求持續(xù)提高,業(yè)務(wù)中斷將為企業(yè)帶來巨大的經(jīng)濟損失,故障牽一發(fā)而動全身,因此,數(shù)據(jù)中心網(wǎng)絡(luò)急需更先進更高效的運維解決方案。
當前數(shù)據(jù)中心運維管理普遍最頭疼的問題,就是傳統(tǒng)運維手段只能看到設(shè)備的通斷和靜態(tài)指標,實際出現(xiàn)問題,往往反而是業(yè)務(wù)部門先于網(wǎng)絡(luò)部門感知到,而且傳統(tǒng)問題定位手段欠缺,快速故障根因定位和業(yè)務(wù)恢復(fù)更是一種奢望。
AI加持的智能運維
為云化中心管理帶來曙光
傳統(tǒng)的運維管理手段,為什么不能滿足云化中心的管理要求?
首先,目前業(yè)界使用的管理平臺基本都是基于SNMP協(xié)議,采用分鐘級輪詢機制來監(jiān)管網(wǎng)絡(luò)狀態(tài),通常5分鐘輪詢一次,如果周期過短會對設(shè)備CPU造成比較大的壓力,運維人員無法精確掌握現(xiàn)網(wǎng)狀態(tài)。
其次,傳統(tǒng)管理平臺故障定位完全依賴于人工經(jīng)驗,運維人員每天面對海量告警根本無從下手,被動響應(yīng)加長了故障定位和修復(fù)周期,對于企業(yè)無疑是雪上加霜。

再者,傳統(tǒng)管理平臺只能看到設(shè)備通斷和一些離散的指標,運維人員對于網(wǎng)絡(luò)整體質(zhì)量情況不能全盤把握,每天網(wǎng)絡(luò)健康巡檢需要花費大量時間,還需手工繪制巡檢報告,增加了企業(yè)的人力成本投入。
面對如上諸多挑戰(zhàn),急需下一代運維解決方案。
華為重磅推出iMaster NCE-FabricInsight(以下簡稱FabricInsight,下同)智能運維分析系統(tǒng),內(nèi)置強大AI引擎,是專為應(yīng)對大數(shù)據(jù)時代數(shù)據(jù)中心網(wǎng)絡(luò)的下一代運維解決方案。

揭秘FabricInsight為何能成為
數(shù)據(jù)中心網(wǎng)絡(luò)運維的必備神器
- FabricInsight完全摒棄了傳統(tǒng)SNMP低效的輪詢機制,采用下一代數(shù)據(jù)采集技術(shù)Telemetry,網(wǎng)絡(luò)設(shè)備會將所需信息主動秒級上送,以達到全網(wǎng)設(shè)備關(guān)鍵指標秒級甚至亞秒級監(jiān)管。
- FabricInsight獨家首創(chuàng)網(wǎng)絡(luò)健康度AI評估體系,依托設(shè)備高性能AI芯片和分析器本地強大的AI分析引擎,實現(xiàn)設(shè)備和分析器兩級AI聯(lián)動,分工明確又相輔相成,真正達到邊緣智能。從多維度全面評估整網(wǎng)健康狀況,實時或定期發(fā)送網(wǎng)絡(luò)體檢報告,極大提高巡檢效率,降低人力成本。

- FabricInsight獨創(chuàng)網(wǎng)絡(luò)故障根因分析和演練學習AI引擎,通過故障演練引擎,將華為30多年、現(xiàn)網(wǎng)500多萬臺設(shè)備的數(shù)據(jù)中心運維經(jīng)驗,持續(xù)注入到根因分析引擎中進行演練學習,強化根因分析算法,不斷提升故障定位效率,同時更進一步引入AI網(wǎng)絡(luò)知識圖譜,以使故障根因分析更加精準。

- FabricInsight擁有業(yè)界唯一的故障自閉環(huán)體系,依靠強大的故障根因分析引擎,典型故障可做到1分鐘識別,3分鐘定位根因,與華為控制器聯(lián)動自閉環(huán)處理,達到5分鐘快速恢復(fù)。

- FabricInsight支持單機版部署,只需一臺服務(wù)器,提供更強大功能的同時,降低部署成本。同時,對網(wǎng)絡(luò)組網(wǎng)解耦,無論是否SDN組網(wǎng)、無論是軟硬SDN組網(wǎng),都能發(fā)揮價值。