如今,數(shù)據(jù)無時無刻不在生成。據(jù)IDC預(yù)測,截止2025年,全球數(shù)據(jù)量將從2019年的45ZB增長至175ZB,年復(fù)合增長率達61%左右。175ZB這個數(shù)字似乎有些抽象,但IDC在《數(shù)據(jù)時代2025》白皮書給出了幾個形象的比喻--如果將175ZB的數(shù)據(jù)存入藍光光盤中,那么這些光盤疊起來的高度將是地球到月球距離的23倍,這些光盤圍起來也可繞地球222圈;而若以25Mb/秒的速度下載175ZB的數(shù)據(jù),所需的下載時間則為18億年。
對企業(yè)與組織而言,數(shù)據(jù)量的激增將帶來諸多影響,首當(dāng)其沖便是存儲與治理方面的難題。無論是使用本地存儲或是云存儲,存儲大量的數(shù)據(jù)都意味著一筆不菲的開銷。在治理上,麻煩更是層出不窮,暗數(shù)據(jù)是諸多棘手難題的核心。
暗數(shù)據(jù)泛指那些沒有被發(fā)掘、理解的數(shù)據(jù),可涵蓋多種形式,如文本、圖像、音頻、視頻等等,既可能是結(jié)構(gòu)化的數(shù)據(jù),也可能是非結(jié)構(gòu)化的數(shù)據(jù)。根據(jù)Veritas早前開展的《數(shù)據(jù)冰山》調(diào)研,對于大多數(shù)企業(yè)而言,在他們存儲的數(shù)據(jù)中,僅15%的數(shù)據(jù)是關(guān)鍵業(yè)務(wù)數(shù)據(jù),33%的數(shù)據(jù)則為ROT數(shù)據(jù),也就是那些冗余、過期或不重要數(shù)據(jù),而剩下的52%數(shù)據(jù)則為既不可見、價值也未知的暗數(shù)據(jù)。
暗數(shù)據(jù)就像水面下龐大未知的冰山,諸多問題潛伏其間,高額的成本開支便是其一。以大多數(shù)企業(yè)的平均數(shù)據(jù)存儲量10PB為例,10PB的數(shù)據(jù)量意味著企業(yè)存儲著約合231億個文件,按照比例進行測算,其中,至少約120億個的文件,企業(yè)對其一無所知--部分文件或許很有價值,但更多的是冗余、年代久遠(yuǎn)且瑣碎的文件。根據(jù)存儲1PB數(shù)據(jù)每年約花費500萬美元的平均值來進行計算,存儲10PB數(shù)據(jù)每年將給企業(yè)帶來約合5000萬美元的開銷,而其中2600萬美元都花在了存儲價值未知、用處也未知的暗數(shù)據(jù)上,形成了極大的投資浪費。另一個在開支上需要深思的問題是,Veritas的調(diào)研報告提出,企業(yè)的數(shù)據(jù)量將以每年39%的速度不斷累積,但大多數(shù)企業(yè),顯然并未準(zhǔn)備與之相應(yīng)的預(yù)算增幅。

暗數(shù)據(jù)給企業(yè)在運維層面帶來重重挑戰(zhàn)
暗數(shù)據(jù)可能帶來的第二個挑戰(zhàn)則與日益嚴(yán)苛的數(shù)據(jù)合規(guī)緊密相連。近兩年間,許多國家及地區(qū)陸續(xù)出臺了數(shù)據(jù)安全領(lǐng)域的法律法規(guī),除名聲在外的歐盟通用數(shù)據(jù)保護條例(GDPR),以及于今年1月1日生效的美國加州消費者隱私法(CCPA)外,周邊國家諸如韓國、日本、新加坡等,都先后制定了針對個人信息、隱私保護的法律條文。我國也于今年正式提出,將盡快制定個人信息保護法、數(shù)據(jù)安全法等法律法規(guī),此舉成為近兩年間,我國在數(shù)據(jù)安全立法領(lǐng)域的重磅動向。
但以生效2年多的GDPR為例,目前企業(yè)在數(shù)據(jù)合規(guī)方面的情況不容樂觀。官方數(shù)據(jù)顯示,僅2019年,歐盟就對違反GDPR的企業(yè)級機構(gòu)開出了累積4.28億歐元的罰單,特別是2019年下半年來,歐洲各國執(zhí)法機構(gòu)逐漸打破GDPR生效初期的慎重,接連開出了數(shù)張上千萬歐元的罰單,榜單上不乏一些大眾耳熟能詳?shù)拇笮涂鐕髽I(yè)。
在日益嚴(yán)峻的合規(guī)背景下,大量不明的,未進行分類的企業(yè)數(shù)據(jù)就像隨時可能噴發(fā)的火山,而距離下一次危機爆發(fā)只差一次成功的黑客攻擊。而更糟糕的是,隨著云和移動環(huán)境在企業(yè)辦公中日趨偏重,它們也逐漸成為了企業(yè)數(shù)據(jù)安全中最薄弱的一環(huán),這些環(huán)境中的大部分?jǐn)?shù)據(jù)未經(jīng)分類且未受保護。在Veritas的調(diào)查中,僅有5%的全球企業(yè)表示,其公有云中的全部數(shù)據(jù)均以實行分類管理,6%的全球企業(yè)表示,他們對移動設(shè)備中的數(shù)據(jù)全部進行了分類管理。在中國,這兩個數(shù)據(jù)均徘徊在1%左右。

提高數(shù)據(jù)可見性,發(fā)現(xiàn)數(shù)據(jù)真正的價值
想要應(yīng)對數(shù)據(jù)大爆炸及暗數(shù)據(jù)帶來的難題,企業(yè)需建立高效的數(shù)據(jù)管理策略,對數(shù)據(jù)進行全生命周期的管理。在Veritas看來,對數(shù)據(jù)“洞察力”和“可見性”的投資是跨越幽谷的關(guān)鍵,企業(yè)對數(shù)據(jù)了解的越透徹,就越能夠準(zhǔn)確判斷其中的價值與潛在風(fēng)險。
首先,對數(shù)據(jù)的可見是評估企業(yè)信息資產(chǎn)價值、并進行相應(yīng)決策的關(guān)鍵。在“可見”的基礎(chǔ)之上,企業(yè)才能更好地確定應(yīng)保留哪些數(shù)據(jù),并確定保留時長,同時發(fā)現(xiàn)無用數(shù)據(jù)和敏感數(shù)據(jù),進行相應(yīng)的分類處理,從而最大化地消除管理浪費并降低潛在風(fēng)險。
其次,對數(shù)據(jù)的可見性也是施行訪問控制的基礎(chǔ)。在數(shù)據(jù)合規(guī)日益受到公眾矚目的當(dāng)下,企業(yè)需確保對數(shù)據(jù)訪問權(quán)限的分配是合宜的,雇員無法訪問他權(quán)限之外的其他內(nèi)容。此外,企業(yè)也需對訪問情況進行審核和跟蹤,從而了解對數(shù)據(jù)的訪問及更改明細(xì),而這也恰巧與“數(shù)據(jù)可見性”息息相關(guān)
再來,對數(shù)據(jù)的可見性也可幫助企業(yè)識別用戶風(fēng)險,探查可能存在的惡意或異常行為。盡管大多數(shù)“異常行為”通常最后都被證明是良性的,但企業(yè)并不能百分百保證雇員、供應(yīng)商不會存在惡意的數(shù)據(jù)收集或獲取行為。在對數(shù)據(jù)全局的洞察之上,管理員能循跡特定員工的文件活動、訪問及行為情況,及時洞察潛在風(fēng)險。
最后,對數(shù)據(jù)的可見性也可有效暴露企業(yè)數(shù)據(jù)中的潛在風(fēng)險,防止數(shù)據(jù)被盜及泄露。當(dāng)PB級的信息分散存儲多處時,如不對信息擁有全局的洞察,便很難分辨其中隱藏的風(fēng)險以及公司或因此存在的連帶責(zé)任?梢娦詫椭髽I(yè)識別風(fēng)險,并對各類敏感及風(fēng)險數(shù)據(jù)進行優(yōu)先級排序,從而制定更好的防護策略。
以四個方面來看,“可見性”與“洞察力”將有效地幫助企業(yè)明確內(nèi)部數(shù)據(jù)留存策略中現(xiàn)存的問題與漏洞,“點亮”此前不為人所知的“黑暗角落”。而在具體落實上,企業(yè)不妨施用信息歸檔類和數(shù)據(jù)風(fēng)險類解決方案為先導(dǎo),先做好“數(shù)據(jù)洞察”,清點現(xiàn)有數(shù)據(jù)庫存,再以此為基礎(chǔ)根據(jù)現(xiàn)實需要構(gòu)建全新的數(shù)據(jù)運維策略,從而在更好治理、合規(guī)遵從的基礎(chǔ)上,真正發(fā)現(xiàn)數(shù)據(jù)的價值。
關(guān)于 Veritas
Veritas Technologies 是全球數(shù)據(jù)保護及數(shù)據(jù)管理領(lǐng)域的領(lǐng)導(dǎo)者。超過八萬家企業(yè)級客戶, 包括 87% 的全球財富 500 強企業(yè),均依靠Veritas化解 IT 復(fù)雜度并簡化數(shù)據(jù)管理流程。Veritas多云數(shù)據(jù)服務(wù)平臺可提供自動化的數(shù)據(jù)保護,無論何處都能協(xié)調(diào)數(shù)據(jù)冗災(zāi)恢復(fù),確保關(guān)鍵業(yè)務(wù)數(shù)據(jù)及應(yīng)用的7x24實時穩(wěn)定運行,同時也為企業(yè)提供數(shù)據(jù)洞察,實現(xiàn)數(shù)據(jù)合規(guī)。Veritas在可靠性、擴展性以及靈活按需部署方面擁有很好的聲譽,支持超過800種數(shù)據(jù)源,100 多種操作系統(tǒng), 1400多種存儲設(shè)備以及60類云平臺。
