- DINFO-OEC是非結(jié)構(gòu)化大數(shù)據(jù)分析挖掘平臺(tái)
- 由業(yè)務(wù)建模技術(shù)和分析挖掘技術(shù)組成
- 能處理任何來源的非結(jié)構(gòu)化信息和半結(jié)構(gòu)化信息
- 將繁雜無序的非結(jié)構(gòu)化信息,通過創(chuàng)建的業(yè)務(wù)模型規(guī)則,進(jìn)行分析,得出有序的結(jié)構(gòu)化數(shù)據(jù)
……
新一代信息技術(shù)與經(jīng)濟(jì)社會(huì)各領(lǐng)域的深度融合,引發(fā)了數(shù)據(jù)量的爆發(fā)式增長(zhǎng),使得數(shù)據(jù)資源成為國(guó)家重要的戰(zhàn)略資源和核心創(chuàng)新要素。據(jù)統(tǒng)計(jì),全球所掌握的數(shù)據(jù),每?jī)赡昃蜁?huì)翻倍。到2020年,全球的數(shù)據(jù)量將達(dá)到40ZB,其中我國(guó)所掌握的數(shù)據(jù)將占20%。大數(shù)據(jù)的廣泛深入應(yīng)用,使人類社會(huì)逐漸走向數(shù)據(jù)經(jīng)濟(jì)時(shí)代。
早在2015年,國(guó)務(wù)院發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,以加快政府?dāng)?shù)據(jù)開放共享,推動(dòng)資源整合,提升治理能力;推動(dòng)產(chǎn)業(yè)創(chuàng)新發(fā)展,培育新興業(yè)態(tài),助力經(jīng)濟(jì)轉(zhuǎn)型;強(qiáng)化安全保障,提高管理水平,促進(jìn)健康發(fā)展為主要任務(wù)。神州泰岳積極響應(yīng)《行動(dòng)綱要》,在人工智能與大數(shù)據(jù)業(yè)務(wù)上飛速發(fā)展,深入鉆研,推出了業(yè)界首款面向業(yè)務(wù)建模的DINFO-OEC非結(jié)構(gòu)化大數(shù)據(jù)分析挖掘平臺(tái)。

本篇我們將為大家分享DINFO-OEC非結(jié)構(gòu)化大數(shù)據(jù)分析挖掘平臺(tái)的主要功能特點(diǎn)概要,后面幾期文章我們會(huì)圍繞這些主要功能點(diǎn)詳細(xì)展開。
DINFO-OEC的價(jià)值
大數(shù)據(jù)中80%都是非結(jié)構(gòu)化大數(shù)據(jù),非結(jié)構(gòu)化大數(shù)據(jù)因其中的業(yè)務(wù)對(duì)象、對(duì)象之間的關(guān)系等都蘊(yùn)含在文本內(nèi)容中,而文本內(nèi)容來源繁多、表達(dá)方式靈活多樣、存在著大量的歧義性,因此無法使用傳統(tǒng)的BI工具等進(jìn)行分析,無法直接服務(wù)于業(yè)務(wù),實(shí)現(xiàn)業(yè)務(wù)價(jià)值。因此非結(jié)構(gòu)化大數(shù)據(jù)是大數(shù)據(jù)處理的難點(diǎn)和熱點(diǎn)。
DINFO-OEC是非結(jié)構(gòu)化大數(shù)據(jù)分析挖掘平臺(tái),由業(yè)務(wù)建模技術(shù)和分析挖掘技術(shù)組成,能處理任何來源的非結(jié)構(gòu)化信息和半結(jié)構(gòu)化信息。將繁雜無序的非結(jié)構(gòu)化信息,通過創(chuàng)建的業(yè)務(wù)模型規(guī)則,進(jìn)行分析,得出有序的結(jié)構(gòu)化數(shù)據(jù)。適用范圍廣,可以適用于信用卡投訴領(lǐng)域、電商評(píng)價(jià)領(lǐng)域、企業(yè)關(guān)聯(lián)關(guān)系挖掘領(lǐng)域等。能夠根據(jù)不同場(chǎng)景、領(lǐng)域?qū)?fù)雜需求進(jìn)行定制。
DINFO-OEC主要功能點(diǎn)介紹
一、應(yīng)用接口:應(yīng)用接口定義后,能夠通過接口邏輯中的算法組件鏈接進(jìn)行相應(yīng)的語義分析。主要由接口定義、接口邏輯、接口發(fā)布組成。
- 接口定義:包含接口的創(chuàng)建、修改、刪除。
- 接口邏輯:包含接口算法組件的鏈接,組件屬性的設(shè)置。
- 接口發(fā)布:包含接口列表、刪除已創(chuàng)建的接口、將接口導(dǎo)成模板等功能。

圖:接口定義


圖:接口邏輯


圖:接口發(fā)布
二、應(yīng)用建模:根據(jù)業(yè)務(wù)需求進(jìn)行模型創(chuàng)建,通過創(chuàng)建的業(yè)務(wù)模型,對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析挖掘。主要由模型規(guī)劃、模型建設(shè)、模型發(fā)布組成。
- 模型規(guī)劃:對(duì)模型進(jìn)行創(chuàng)建。
- 模型建設(shè):包含本體建設(shè)、要素建設(shè)、概念建設(shè)、資源分配、模型調(diào)試。
- 模型發(fā)布:包含模型列表、搜索模型、發(fā)布模型、刪除已創(chuàng)建的模型、將模型導(dǎo)成schema等功能!

圖:模型規(guī)劃


圖:模型建設(shè)


圖:模型發(fā)布
三、應(yīng)用任務(wù):在應(yīng)用任務(wù)中,設(shè)計(jì)好接口的分析規(guī)則、統(tǒng)計(jì)規(guī)則后,能夠根據(jù)指定的規(guī)則分析數(shù)據(jù)源中的數(shù)據(jù)。
主要包含:任務(wù)添加、任務(wù)編輯、任務(wù)刪除、任務(wù)運(yùn)行、任務(wù)中斷、任務(wù)啟動(dòng)、任務(wù)終止、日志查看、條度設(shè)置、結(jié)果查看、結(jié)果導(dǎo)出、導(dǎo)出查詢、任務(wù)詳情查看等。

圖:應(yīng)用任務(wù)
四、應(yīng)用模板:在應(yīng)用開發(fā)中,可以將已發(fā)布的接口導(dǎo)成應(yīng)用模板,導(dǎo)出成功后即可在應(yīng)用模板查看。應(yīng)用模板主要是對(duì)模板資源的展示,支持詳細(xì)信息查看,如模板中的接口列表、模板中的接口信息等。

圖:應(yīng)用模板列表


圖:模板信息
五、模型schema:在應(yīng)用建模中,可以將已發(fā)布的模型導(dǎo)出成模型schema,對(duì)模型的資源進(jìn)行積累。模型schema主要是對(duì)模型資源的展示、和資源詳情查看,如模型的本體樹結(jié)構(gòu)、要素樹結(jié)構(gòu)、概念樹結(jié)構(gòu)等。

圖:模型schema列表


圖:模型詳情
六、語言資源:對(duì)語言資源的統(tǒng)計(jì)。包含概念資源、通用資源、領(lǐng)域資源、用戶資源的占比詳情和建設(shè)詳情。

圖:語言資源
縱觀全文,我們基本可以了解到DINFO-OEC不僅能提供強(qiáng)大的非結(jié)構(gòu)化大數(shù)據(jù)分析挖掘能力,同時(shí)平臺(tái)面向業(yè)務(wù)的建模也極大提高了業(yè)務(wù)人員的工作效率——業(yè)務(wù)人員只需要重點(diǎn)關(guān)注業(yè)務(wù)場(chǎng)景邏輯梳理及其表述,不需要關(guān)注技術(shù)實(shí)現(xiàn)細(xì)節(jié),極大地縮短應(yīng)用場(chǎng)景創(chuàng)新周期。DINFO-OEC的出現(xiàn),推動(dòng)了行業(yè)在中文文本領(lǐng)域處理技術(shù)向前邁出了一大步,也促使企業(yè)在開發(fā)應(yīng)用時(shí)專注于業(yè)務(wù)的大數(shù)據(jù)創(chuàng)新,而不局限于語義技術(shù)和文本技術(shù)的研究方面。