
小i機(jī)器人總裁&CTO朱頻頻
名字有i的公司都很酷,小i要對(duì)各個(gè)行業(yè)進(jìn)行升級(jí)和改造
眾所周知,小i機(jī)器人是一家專注于提供智能機(jī)器人平臺(tái)和架構(gòu)服務(wù)的公司,在人工智能相關(guān)技術(shù),如自然語(yǔ)言處理、語(yǔ)義分析和理解、知識(shí)工程和智能大數(shù)據(jù)等方面都已走在行業(yè)的前列,建立了包括知識(shí)表示、推理預(yù)測(cè)、機(jī)器學(xué)習(xí)(深度學(xué)習(xí))、語(yǔ)義理解、分析決策以及Bots開發(fā)的完整架構(gòu),并推出了應(yīng)用于多個(gè)行業(yè)和領(lǐng)域的智能虛擬/實(shí)體機(jī)器人解決方案?梢哉f,目前國(guó)內(nèi)能與小i在中文智能人機(jī)對(duì)話領(lǐng)域一較高下的公司并不多。這也不禁讓人好奇,這么一家“高大上”公司,為什么會(huì)有一個(gè)“小i”這樣可愛的名字?
“小i在成立之初是專注于做MSN聊天機(jī)器人的,所以我們當(dāng)時(shí)就在想,小x可能會(huì)比較合適為機(jī)器人命名?梢钥吹剑F(xiàn)在大家都喜歡給自己的產(chǎn)品命名為小x,例如微軟小冰等,感覺很親切。
“那為什么叫i呢?可能因?yàn)槊种袔的公司或產(chǎn)品都很牛吧,比如iPhone。此外,i還是很多不錯(cuò)的英文名詞的開頭,包括intelligence(智能)、internet(因特網(wǎng))、informatiion(信息)、infinity(無(wú)限大)等,加之我們公司的前身是做軟件的,incesoft,也是以i開頭的,所以我們就取了小i這個(gè)品牌名。”
熟悉小i的人應(yīng)該知道,從2016年開始進(jìn)入客服領(lǐng)域,小i逐漸在智能政務(wù)、智能語(yǔ)音、實(shí)體機(jī)器人、智能云服務(wù)等領(lǐng)域均有布局。而在布局如此之全面的情況下,小i卻和大多數(shù)人工智能公司以直接打進(jìn)C端市場(chǎng)為目標(biāo)不同,他們從沒想過要去直接接觸C端用戶。
“小i的目標(biāo)是向各行業(yè)輸出我們的人工智能能力,并對(duì)這些行業(yè)進(jìn)行升級(jí)和改造,充分發(fā)揮人工智能的商業(yè)價(jià)值,這就是典型的TOB模式。而所我認(rèn)為的TOC模式,就是先做用戶,再?gòu)挠脩羯砩腺嶅X,顯然,這不符合小i的定位。”
消費(fèi)級(jí)服務(wù)機(jī)器人技術(shù)還沒達(dá)到一個(gè)理想的狀態(tài),但積累很重要
從小i當(dāng)前的布局看,其業(yè)務(wù)大多集中于服務(wù)類機(jī)器人領(lǐng)域。恰逢服務(wù)機(jī)器人大會(huì),我們的話題自然的就圍繞著服務(wù)機(jī)器人展開了。
“大家通常會(huì)把機(jī)器人分為兩大類,工業(yè)機(jī)器人和服務(wù)機(jī)器人。而服務(wù)機(jī)器人又可以分為兩類,專業(yè)級(jí)服務(wù)機(jī)器人和消費(fèi)級(jí)服務(wù)機(jī)器人。專業(yè)級(jí)服務(wù)機(jī)器人因?yàn)閷I(yè)性太強(qiáng),目前能做的團(tuán)隊(duì)并不多。“
“而消費(fèi)級(jí)機(jī)器人方面,由于技術(shù)發(fā)展有限,此類機(jī)器人并不如我們想象中的那樣可以做很多事情,同用戶進(jìn)行非常開放、順暢的交流。可以說,消費(fèi)級(jí)服務(wù)機(jī)器人的發(fā)展還未能達(dá)到理想狀態(tài),只能在一定的范圍內(nèi)為用戶提供較為精準(zhǔn)的服務(wù),解決一些問題。”
但不可否認(rèn),如果我們把機(jī)器人放置在一個(gè)相對(duì)較為垂直的固定場(chǎng)景中,以當(dāng)前的人機(jī)交互技術(shù)發(fā)展實(shí)力,是能夠幫助人類承擔(dān)一定的工作的。例如,相信大家現(xiàn)在已經(jīng)可以經(jīng)常在星級(jí)酒店看到送貨服務(wù)機(jī)器人的身影了,因?yàn)榇祟悪C(jī)器人的工作內(nèi)容較為機(jī)械,且具備了一定的空間定位、人臉識(shí)別、路徑自主規(guī)劃等功能,其服務(wù)的準(zhǔn)確率和認(rèn)可度通常很高。所以,對(duì)于消費(fèi)級(jí)服務(wù)機(jī)器人來說,并不是做的特別完美才會(huì)有市場(chǎng)價(jià)值,而是只要能夠在特定場(chǎng)景中被很好的應(yīng)用就可以了。
“行業(yè)還是存在一些問題的,例如機(jī)器人會(huì)在行走的過程中因路徑規(guī)劃不精確、地上有障礙物、被人故意擋住等而卡停在原地,或者在會(huì)話時(shí)遇到‘超綱’的問題而‘宕機(jī)’,但這些都是不要緊的,而且還有很多好處。因?yàn)樵谶@過程中,機(jī)器人可以不斷的得到訓(xùn)練,不論是自主學(xué)習(xí)還是人為介入,其系統(tǒng)都可以在這個(gè)過程中得以不斷完善,產(chǎn)生新的認(rèn)知。積累,是當(dāng)前行業(yè)最需要做的事情。”
會(huì)話式AI或成未來主流人機(jī)交流方式,知識(shí)背景和深度學(xué)習(xí)都很重要
可以說,當(dāng)前判定服務(wù)機(jī)器人性能好壞有兩個(gè)判斷標(biāo)準(zhǔn),會(huì)話能力和自動(dòng)駕駛能力。而正如朱頻頻所說,在特定場(chǎng)景中,目前很多機(jī)器人已經(jīng)可以很好的自主定位和規(guī)劃行駛路徑了。那么,其會(huì)話能力就成為了各產(chǎn)品性能分級(jí)的重要標(biāo)準(zhǔn)。
“僅就人機(jī)交互方面而言,會(huì)話式AI將成為未來的主流交互方式。”朱頻頻說。
相信大家都有體驗(yàn),在PC機(jī)盛行時(shí)代,用戶需要通過操作鍵盤、鼠標(biāo)等外設(shè)才可以進(jìn)行人機(jī)交互;到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,智能手機(jī)普及的時(shí)候,用戶就可以通過手勢(shì)進(jìn)行人機(jī)交互了。而現(xiàn)在很多手機(jī)都具備了語(yǔ)音交互功能,但大多數(shù)還是需要用戶進(jìn)行觸摸、點(diǎn)擊等操作。等到了萬(wàn)物互聯(lián)的物聯(lián)網(wǎng)時(shí)代,只要預(yù)先設(shè)定好接口和數(shù)據(jù)傳輸模式,讓機(jī)器人理解用戶的自然語(yǔ)言,可能我們只需要?jiǎng)觿?dòng)嘴就可以指揮機(jī)器人做一些事情了。那時(shí),會(huì)話式的交流方式就會(huì)成為日常生活中人機(jī)主流的交互方式。
“可以說,會(huì)話式AI是人工智能行業(yè)中最可能先落地的核心技術(shù)之一。從目前來看,無(wú)論是傳統(tǒng)的會(huì)話AI模型,還是大家正在探索的基于深度學(xué)習(xí)的會(huì)話AI模型,都是將短期記憶和長(zhǎng)期記憶融合在一起的。但在這之前,我們得先讓機(jī)器人擁有一定的知識(shí)背景。”
舉個(gè)例子,“中國(guó)乒乓球隊(duì)誰(shuí)都贏不了”,僅從這句話的字面意思理解,它至少有兩種含義。只有在事先具備了“中國(guó)乒乓球隊(duì)很牛”的知識(shí)背景和相關(guān)認(rèn)知,我們才能夠準(zhǔn)確的理解這句話的意思。而對(duì)于機(jī)器人來說,就需要通過大量的數(shù)據(jù)和場(chǎng)景訓(xùn)練去實(shí)現(xiàn)了。“
除此之外,上下文語(yǔ)義的邏輯理解也是會(huì)話式AI必不可缺的能力之一。在這方面,深度學(xué)習(xí)技術(shù)的加持則尤為重要。簡(jiǎn)單來說,和人類一樣,單純的知識(shí)背景和相關(guān)認(rèn)知并不能直接被應(yīng)用,我們需要先對(duì)這些信息進(jìn)行篩選和梳理,將其結(jié)構(gòu)化。而對(duì)于會(huì)話式AI來說,在被輸入的信息沒有被很好的結(jié)構(gòu)化的情況下,深度學(xué)習(xí)技術(shù)就可以幫助其從大量的信息中找到一定的規(guī)律,將其結(jié)構(gòu)化。
除此之外,上下文語(yǔ)義的邏輯理解也是會(huì)話式AI必不可缺的能力之一。在這方面,深度學(xué)習(xí)技術(shù)的加持則尤為重要。簡(jiǎn)單來說,和人類一樣,單純的知識(shí)背景和相關(guān)認(rèn)知并不能直接被應(yīng)用,我們需要先對(duì)這些信息進(jìn)行篩選和梳理,將其結(jié)構(gòu)化。而對(duì)于會(huì)話式AI來說,在被輸入的信息沒有被很好的結(jié)構(gòu)化的情況下,深度學(xué)習(xí)技術(shù)就可以幫助其從大量的信息中找到一定的規(guī)律,將其結(jié)構(gòu)化。
很多事情只有先做才知道該怎么去做,小i的優(yōu)勢(shì)就在于敢于嘗試和積累
去年10月,Gartner在其2017年十大戰(zhàn)略技術(shù)趨勢(shì)預(yù)測(cè)中,提到“Conversational+”在未來的物聯(lián)網(wǎng)時(shí)代將連接萬(wàn)物。而作為行業(yè)中具備一定實(shí)力的公司,小i的優(yōu)勢(shì)來的很“理所應(yīng)當(dāng)”。
“在技術(shù)層面,小i在全球范圍內(nèi)都是處于領(lǐng)先地位的?梢钥吹剑瑫(huì)話式AI中比較核心的技術(shù),如人工智能自然語(yǔ)言技術(shù)、會(huì)話、語(yǔ)音識(shí)別、圖像識(shí)別等,小i都是有多年積累的。值得強(qiáng)調(diào)的是,我們做過很多嘗試,因?yàn)榧夹g(shù)能不能最終實(shí)現(xiàn)應(yīng)用、系統(tǒng)會(huì)達(dá)到怎樣的狀態(tài)等,都只有在經(jīng)過一次次的測(cè)試后才能得知和優(yōu)化的。但我認(rèn)為,技術(shù)不是不可超越的。所以,小i除了積累和嘗試外,還在極力加強(qiáng)我們的技術(shù)、數(shù)據(jù)、知識(shí)等的壁壘。”
朱頻頻表示,正是在技術(shù)、數(shù)據(jù)等方面有所積累,所以即便很多行業(yè)他們此前從未涉及過,但做起來也比行業(yè)同類公司快很多。
“因?yàn)槲覀冇凶约旱南到y(tǒng)和方法論,任何領(lǐng)域都可以直接套進(jìn)去?梢赃@么說,即便我們接觸到了一個(gè)新行業(yè),但我們的技術(shù)已經(jīng)幫助我們好了50%事情,需要再做的就是根據(jù)新領(lǐng)域的特性做一些調(diào)整和擴(kuò)展。”
此外,朱頻頻還透露,由于在資本、產(chǎn)業(yè)布局等方面都具備了很大的先發(fā)優(yōu)勢(shì),小i目前正在為明年在主板上市做準(zhǔn)備。
“對(duì)于我來說,企業(yè)在不同的階段所重點(diǎn)關(guān)注的東西是不一樣的。在企業(yè)早期階段,技術(shù)可能是最重要的。等企業(yè)在技術(shù)和客戶關(guān)系方面有一定積累后,綜合考慮競(jìng)爭(zhēng)優(yōu)勢(shì)則成為了新的關(guān)鍵。小i目前就是到了綜合考慮競(jìng)爭(zhēng)優(yōu)勢(shì)的階段了。”
總結(jié)
目前,雖然服務(wù)機(jī)器人正憑借其新奇的技能引起了行業(yè)的廣泛關(guān)注,但此類產(chǎn)品在C端用戶群中的知名度并不如大家想象的那么很高,而這其中,服務(wù)機(jī)器人服務(wù)內(nèi)容單一是重要原因之一。
但我們可以期待,未來,當(dāng)服務(wù)機(jī)器人與物聯(lián)網(wǎng)結(jié)合,可被嵌入到任何物品和場(chǎng)景中,如墻體、家居等中,甚至通過全息的方式被呈現(xiàn)出來時(shí),我們的社會(huì)將迎來一個(gè)新時(shí)代,生活將充滿科技感和欣喜。