亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

如何打造永不枯竭的數(shù)據(jù)湖、讓智慧城市建設水到渠成

2018-08-16 13:42:40   作者:華為企業(yè)BG智慧城市解決方案部解決方案總監(jiān)任東民   來源:CTI論壇   評論:0  點擊:


  文章來源于《ICT新視界·智慧城市特輯》,原標題為《打造永不枯竭的數(shù)據(jù)湖,成就城市智慧》,作者為華為企業(yè)BG智慧城市解決方案部解決方案總監(jiān)任東民。
  智慧城市是以數(shù)據(jù)為中心、由數(shù)據(jù)驅(qū)動的城市大數(shù)據(jù)生態(tài)系統(tǒng)。數(shù)據(jù)只有充分集中、達到一定量級才是大數(shù)據(jù)。從我國東部發(fā)達地區(qū)的實踐來看,數(shù)據(jù)匯聚是政府大數(shù)據(jù)發(fā)展的難點所在,已成為大數(shù)據(jù)主管部門的共識。
  沒有匯聚就沒有大數(shù)據(jù)
  建設城市級大數(shù)據(jù)中心,必將面對數(shù)據(jù)匯聚帶來的挑戰(zhàn)——數(shù)據(jù)源越來越廣、數(shù)據(jù)類型越來越多、數(shù)據(jù)量級越來越大。所謂大數(shù)據(jù),必須在技術上可管理,才能可利用。
  大數(shù)據(jù)中心除了承載部門應用系統(tǒng)的傳統(tǒng)“小”數(shù)據(jù)之外,還將歸集日常工作產(chǎn)生的電子文檔和多媒體等新型“大”數(shù)據(jù),并將引入城市視頻監(jiān)控和物聯(lián)網(wǎng)傳感器產(chǎn)生的流式數(shù)據(jù),乃至獲取企事業(yè)單位和互聯(lián)網(wǎng)的社會數(shù)據(jù)資源,必須解決怎么采集、怎么存儲、怎么管理的難題。如果不能做到“落得下、管得住、看得懂、拿得到”,就不能保證“一次匯聚、多次分享”。
  實踐證明,大數(shù)據(jù)中心如果只是簡單拷貝雜亂無序的海量數(shù)據(jù),無異于數(shù)據(jù)沼澤。大數(shù)據(jù)主要是非結構化數(shù)據(jù),針對結構化數(shù)據(jù)的政務信息資源目錄體系與交換體系跟不上十多年來政府信息化的發(fā)展和變化,技術和管理上的局限性日益凸顯。
  政府大數(shù)據(jù)要走自己的路
  大數(shù)據(jù)技術發(fā)源于互聯(lián)網(wǎng)企業(yè),但是,政府大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)有很大不同。政府大數(shù)據(jù)的基本特征是多源異構、分散無序。政府數(shù)據(jù)源并非同一來源和單一類型,數(shù)據(jù)存儲并非高度集中和完全同構,采用人工編目方式無法承受為海量數(shù)據(jù)進行元數(shù)據(jù)標注的巨大壓力,必須升級到大數(shù)據(jù)架構。政府大數(shù)據(jù)是社會公有屬性,外部價值大于內(nèi)部價值,外部利用是優(yōu)先方向,重點是公用數(shù)據(jù)集開發(fā)和資源化服務。忽略政府大數(shù)據(jù)的分散多樣性和價值取向,照搬互聯(lián)網(wǎng)企業(yè)經(jīng)驗,無法從根本上解決數(shù)據(jù)匯聚問題。
  通常認為,大數(shù)據(jù)是關注數(shù)據(jù)分析結果的A范式(分析型應用)。實際上,大數(shù)據(jù)并非只有A范式,還有關注數(shù)據(jù)內(nèi)容本身的D范式(公用數(shù)據(jù)集)。在數(shù)據(jù)資源尚未充分集中形成規(guī)模量級的情況下,大部分政府應該是優(yōu)先發(fā)展D范式,而不應不切實際地追求A范式的突飛猛進。
  數(shù)據(jù)湖是什么?
  2010年,James Dixon提出數(shù)據(jù)湖(Data Lake)的概念。數(shù)據(jù)湖是與數(shù)據(jù)倉庫相對的概念,初衷是破解數(shù)據(jù)倉庫的局限性:一是只能回答預先設定的問題,二是數(shù)據(jù)已經(jīng)被篩選包裝好,無法看見其原始狀態(tài)。James Dixon說:“如果數(shù)據(jù)集市是一個商店的瓶裝水,數(shù)據(jù)被過濾包裝結構化以供使用——數(shù)據(jù)湖則是在更自然狀態(tài)下的大量的水。數(shù)據(jù)湖中的數(shù)據(jù)來源于不同地方,用戶可以進入數(shù)據(jù)湖中按需提取所需要的數(shù)據(jù)”。
  數(shù)據(jù)湖的核心原則是集中存儲原始的、未經(jīng)改變的全量數(shù)據(jù),在提取數(shù)據(jù)時才進行轉(zhuǎn)換。數(shù)據(jù)湖存儲各種類型數(shù)據(jù),重點是非結構化和半結構化數(shù)據(jù),通過統(tǒng)一視圖提供開放訪問。數(shù)據(jù)湖必須具有強大的元數(shù)據(jù)管理能力,可保證所存儲數(shù)據(jù)資源的語義一致性,這是進行大數(shù)據(jù)分析的基本前提。
  數(shù)據(jù)湖與政府大數(shù)據(jù)價值鏈密切相關
  數(shù)據(jù)湖處在政府大數(shù)據(jù)價值鏈的上游,是數(shù)據(jù)即服務和分析型應用的源頭,對應“匯聚”、“標注”、“分發(fā)”三個環(huán)節(jié)。
  • 對于匯聚而言,旨在建立統(tǒng)一數(shù)據(jù)采集體系和統(tǒng)一大數(shù)據(jù)資源池,優(yōu)化大數(shù)據(jù)供給側的數(shù)據(jù)處理流程。
  • 對于標注而言,旨在建立統(tǒng)一元數(shù)據(jù)管理體系和全景數(shù)據(jù)資源清單,建立對大數(shù)據(jù)需求側的強有力支撐。
  • 對于分發(fā)而言,旨在建立大數(shù)據(jù)應用與數(shù)據(jù)湖之間的暢通管道,實現(xiàn)從數(shù)據(jù)湖中即取即用。
  華為“一云一湖一平臺”整體方案
  華為憑借智慧城市建設和自身數(shù)據(jù)資產(chǎn)管理變革經(jīng)驗,以及大數(shù)據(jù)和人工智能方面的技術儲備,提出了“一云一湖一平臺”整體解決方案。
  華為已率先發(fā)布了智慧城市數(shù)據(jù)湖解決方案,致力于打造大數(shù)據(jù)生態(tài)永不枯竭的源頭。華為以數(shù)據(jù)湖為核心的大數(shù)據(jù)整體方案具有三大優(yōu)勢。
  • 超前實踐,先行探索。華為有18萬員工,信息系統(tǒng)龐大而復雜,積累了海量數(shù)據(jù)資源,面臨著很多現(xiàn)實問題:跨領域數(shù)據(jù)獲取困難甚至無權獲取、過程數(shù)據(jù)大量丟失、無法滿足數(shù)字化運營和大數(shù)據(jù)分析應用要求等。2017年,華為實施了數(shù)據(jù)資產(chǎn)管理變革項目,啟動了產(chǎn)品領域數(shù)據(jù)湖建設任務,成功實施了IPD數(shù)據(jù)湖解決方案,以統(tǒng)一的數(shù)據(jù)底座承載主題數(shù)據(jù),實現(xiàn)了集中的數(shù)據(jù)資產(chǎn)管理,“打破數(shù)據(jù)壁壘、實現(xiàn)數(shù)據(jù)聯(lián)接、主動自助服務”。
  • 瞄準未來,架構領先。未來所有數(shù)據(jù)將平滑遷移到統(tǒng)一政務云,如果綜合考慮先進性和實用性,初期可以傳統(tǒng)小數(shù)據(jù)架構(傳統(tǒng)數(shù)據(jù)庫)和新型大數(shù)據(jù)架構(數(shù)據(jù)湖)并行存在,實行統(tǒng)一的元數(shù)據(jù)管理。而后期條件成熟時,再將傳統(tǒng)小數(shù)據(jù)架構融入新型大數(shù)據(jù)架構。
  • 自動化,高效率。基于人工智能技術實現(xiàn)元數(shù)據(jù)的自動化標注,F(xiàn)有的目錄體系只適用于結構化數(shù)據(jù),主要采用手工編目方法,存在工作量大、復雜性高、質(zhì)量低等缺點。在納入非結構化和半結構化數(shù)據(jù)之后,由于數(shù)據(jù)規(guī)模量級之大已不可能再采用手工編目方法,必須引入成熟的人工智能技術,對視頻、語音和電子文檔等采用圖像識別、語音識別和自然語言處理等技術,由機器人“閱讀”和“認知”非結構化數(shù)據(jù),自動提取主題詞、關鍵字和生成標簽,采用機器學習技術不斷提高編目質(zhì)量。
  當前,我國政府帶頭拉動大數(shù)據(jù)發(fā)展,智慧城市數(shù)據(jù)湖呼之欲出。在智慧高青、北京城市副中心、蘭州新區(qū)等城市大數(shù)據(jù)工程項目中,華為復制了自身IPD數(shù)據(jù)湖建設的成功經(jīng)驗,加快推進數(shù)據(jù)湖解決方案的落地,力求突破政府大數(shù)據(jù)匯聚難題,向智能型城市揚帆起航。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

鲜城| 利津县| 桦甸市| 荔浦县| 诏安县| 孝感市| 饶阳县| 纳雍县| 重庆市| 英山县| 元氏县| 嘉黎县| 兰西县| 岑溪市| 隆昌县| 铜梁县| 隆德县| 濮阳市| 庐江县| 湄潭县| 通化县| 大丰市| 红桥区| 邵东县| 株洲县| 东丽区| 金湖县| 宁城县| 呼图壁县| 凤台县| 临清市| 晋州市| 台中县| 南皮县| 南溪县| 安阳县| 扶绥县| 定结县| 望奎县| 海安县| 桐梓县|