作為第二屆數(shù)字中國建設(shè)峰會(huì)的重點(diǎn),本次大賽主要圍繞大數(shù)據(jù)、人工智能、工業(yè)互聯(lián)網(wǎng)等新一代信息技術(shù)展開,而華為作為大賽的出題方之一,提出了賽題“文化傳承——漢字書法多場景識(shí)別”。

2019(首屆)數(shù)字中國創(chuàng)新大賽啟動(dòng)新聞發(fā)布會(huì)現(xiàn)場
作為此次大賽的出題方,華為在確定賽題過程中主要考慮兩個(gè)大方向:
- 一是偏向AI技術(shù)領(lǐng)域,聚焦人工智能領(lǐng)域中語音、語義、圖像、人臉識(shí)別等技術(shù)的運(yùn)用;
- 二是偏向行業(yè)場景,例如人工智能在天氣預(yù)測、提高生產(chǎn)效率等方面的具體應(yīng)用。最終,圍繞“數(shù)字中國”主題以及實(shí)現(xiàn)社會(huì)效益的目標(biāo),經(jīng)過長時(shí)間的謹(jǐn)慎而全面的內(nèi)部討論,華為將此次賽題最終確定為:文化傳承——漢字書法多場景識(shí)別。
書法是中國文化的符號(hào),需要不斷傳承并發(fā)揚(yáng)光大。然而,生活場景下的風(fēng)景名勝里的碑刻,建筑上的題詞、對(duì)聯(lián)、牌匾,博物館里的字畫作品,甚至尋常家居里懸掛的書法字畫等,對(duì)于小年輕而言越來越難以識(shí)別。
我們的技術(shù)工程師中也有很多傳統(tǒng)文化愛好者,想到如果可以利用先進(jìn)的AI技術(shù),實(shí)時(shí)、準(zhǔn)確、自動(dòng)地識(shí)別出這些書法文字,對(duì)于記錄整理書法藝術(shù)和傳播書法背后的中國文化有著重要的社會(huì)價(jià)值。華為云EI服務(wù)產(chǎn)品部營銷總監(jiān)桑宏宇強(qiáng)調(diào)。
目前,利用人工智能技術(shù)進(jìn)行手寫中文識(shí)別已經(jīng)有了很大的突破,有很好的準(zhǔn)確率。而華為云EI的文字識(shí)別服務(wù)(OCR)已經(jīng)在各行各業(yè)中得到了很好的應(yīng)用:
- OCR已經(jīng)在幫助德邦等物流公司識(shí)別快遞單,實(shí)現(xiàn)快遞信息的高效精準(zhǔn)數(shù)字化;
- OCR在醫(yī)療機(jī)構(gòu)中能識(shí)別各種醫(yī)學(xué)化驗(yàn)單,實(shí)現(xiàn)醫(yī)學(xué)檢驗(yàn)化驗(yàn)信息的高效精準(zhǔn)數(shù)字化;
- OCR還能幫助保險(xiǎn)公司識(shí)別各種保單,實(shí)現(xiàn)保單信息高效精準(zhǔn)的數(shù)字化。
長按二維碼了解華為云EI 文字識(shí)別服務(wù)(OCR)
如何幫助德邦物流解決快遞單號(hào)問題

華為云EI服務(wù)在各行業(yè)的應(yīng)用極大提升了各行業(yè)的生產(chǎn)效率,降低了成本,為企業(yè)的智能化發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。桑宏宇提到,“華為云EI的OCR服務(wù)在企業(yè)應(yīng)用時(shí),我們發(fā)現(xiàn)很多行業(yè)有手寫體識(shí)別的需求,而整個(gè)AI行業(yè)中手寫體的識(shí)別精度都有很大的提升空間。”
“文化傳承——漢字書法多場景識(shí)別”賽題涉及到對(duì)多種技術(shù)的考察,例如包括圖像描述、圖像檢測、圖像編碼、圖像分割等圖像處理技術(shù),包括深度學(xué)習(xí)理論、算法和神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)技術(shù)和包括需求分析、方案設(shè)計(jì)、編碼、測試等計(jì)算編程技術(shù)。
同時(shí),該賽題對(duì)于參賽者的考察也是全面系統(tǒng)化的,參賽者需要了解深度學(xué)習(xí)模型,例如深度神經(jīng)網(wǎng)絡(luò)(DNN:Deep Neural Networks),能根據(jù)實(shí)際問題選擇合適的模型。熟悉 Tensorflow,Pytorch等框架,能根據(jù)實(shí)際問題選擇合適的框架,并使用框架能力進(jìn)行模型訓(xùn)練和應(yīng)用開發(fā)。
談及本次賽題的最大難點(diǎn),在于:書法背景多樣化和字體風(fēng)格多樣化帶來的AI識(shí)別挑戰(zhàn)。
以福字來舉個(gè)栗子:
從古漢字演變到如今,它的形態(tài)發(fā)生了眾多的變化。光是形態(tài)就就多達(dá)百種以上,更別說不同材質(zhì)飽經(jīng)時(shí)間風(fēng)霜帶來的顏色不均衡、小面積被腐蝕等調(diào)整了。
在以判斷AI文字識(shí)別的準(zhǔn)確率為主要衡量依據(jù)的背景下,考慮到相對(duì)較短的比賽時(shí)間、任務(wù)完成量以及任務(wù)難度,也為了鼓勵(lì)更多參賽者愿意參賽、能夠參賽,桑宏宇表示將會(huì)適當(dāng)降低賽題門檻,對(duì)賽題中書法場景和字體作出限定,避免將比賽的AI設(shè)計(jì)變成一個(gè)龐大的系統(tǒng)工程。
桑宏宇提出:
“AI(人工智能)作為驅(qū)動(dòng)‘數(shù)字中國’建設(shè)的核心技術(shù)之一,如何能夠快速普及和應(yīng)用一直是困擾大家的難點(diǎn)問題。華為云就是想讓現(xiàn)在‘高高在上’的AI變成大家都可以‘用得起、用得好、用得放心’的普惠AI。”
基于華為云EI的能力和實(shí)踐經(jīng)驗(yàn),與開發(fā)者一起推動(dòng)人工智能產(chǎn)業(yè)創(chuàng)新和發(fā)展,加速推進(jìn)普惠AI落地,不再讓AI技術(shù)成為高高在上的象牙塔,真正推進(jìn)AI技術(shù)在某領(lǐng)域的普及和應(yīng)用,是華為云的初衷。同時(shí),華為也希望通過這次大賽,利用AI技術(shù)幫助解決社會(huì)或者大家實(shí)際生活碰到的問題,為整個(gè)社會(huì)造福。
華為在作為本次大賽出題方的同時(shí),也會(huì)扮演導(dǎo)師的角色,并為參賽者提供技術(shù)和平臺(tái)支持。此次大賽,華為推薦參賽者使用華為云今年10月最新發(fā)布的普惠AI開發(fā)平臺(tái)——ModelArts平臺(tái),幫助參賽者在克服人工智能難題過程中提升效率,改善效果。
ModelArts平臺(tái)提供自動(dòng)學(xué)習(xí)、數(shù)據(jù)管理、開發(fā)管理、訓(xùn)練管理、模型管理、推理服務(wù)管理、市場等多個(gè)模塊化的服務(wù),具有上手快、訓(xùn)練快、上線快特點(diǎn)。“相信未來開發(fā)者在使用華為云ModelArts開發(fā)人工智能應(yīng)用時(shí)能夠得心應(yīng)手。”桑宏宇說。
未來,華為也將致力于將優(yōu)秀比賽成果進(jìn)行延伸開發(fā),以實(shí)際行動(dòng)促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展,為數(shù)字中國建設(shè)貢獻(xiàn)力量!