思科堪稱業(yè)界人工智能的先驅(qū),在很早之前就開始進(jìn)行相關(guān)研究,并逐步將其運(yùn)用到每一代協(xié)作產(chǎn)品中。因此思科有很多領(lǐng)先友商的 AI 技術(shù),甚至是獨(dú)有的功能如 “超聲波移動檢測” 和 “噪聲檢測” 等。
本文就將圍繞這些領(lǐng)先的技術(shù),為您介紹 AI 在思科協(xié)作終端設(shè)備上的應(yīng)用和其為人們帶來的全新協(xié)作體驗(yàn)。
1、語音撥號:邊聽邊學(xué)的超級學(xué)霸
簡而言之就是將傳統(tǒng)通過觸屏、遙控器等控制的物理操作簡化成語音控制。但區(qū)別于通過固定指令的語音識別,且是出廠時已設(shè)置好的封閉系統(tǒng)的實(shí)現(xiàn)方式,思科語音撥號通過聯(lián)接思科的協(xié)作云,實(shí)現(xiàn)真正的人機(jī)交互,即隨著辨識越來越多人的聲音包括不同地域、聲線、音量等,并在日積月累中不斷地學(xué)習(xí),系統(tǒng)會變得越來越“聰明”,語音識別的正確度、復(fù)雜度都會逐漸提高。
2、人臉識別:hold住全局的會議專家
- 發(fā)言者跟蹤:會議中誰發(fā)言攝像頭就會聚焦誰,思科不是第一個推出該功能,但是在真實(shí)會議場景中,思科的產(chǎn)品是體驗(yàn)最好的。
在真實(shí)的會議場景中,與會人員的位置、動態(tài)、高度等會出現(xiàn)各種隨機(jī)的變化,很難真實(shí)捕捉,設(shè)想當(dāng)出現(xiàn)當(dāng)兩人對話時鏡頭頻繁切換的囧況,或只聚焦一人而完全忽略另一人的狀態(tài),這樣的結(jié)果會怎么能讓客戶滿意?但思科的協(xié)作產(chǎn)品憑借出色的 AI 表現(xiàn),無論會議現(xiàn)場多么復(fù)雜都能從容地 hold 住全局。
- 實(shí)時捕捉:結(jié)合與會者所有人的信息,實(shí)時捕捉每一個發(fā)言人的面部,發(fā)言者的位置、聲量、高度都會充分捕捉。
- 最佳取景:能自動調(diào)整鏡頭的各個方向、自動對焦,而在過去人們需要一個專門的管理人員在會議過程中不斷觀察會議變動情況,通過遙控器來頻繁調(diào)整,不僅效率低且會影響與會人員的會議體驗(yàn)。
- 面部識別:這是思科的又一創(chuàng)新功能,結(jié)合語音定位、語音跟蹤,自動識別、跟蹤人臉進(jìn)行面部識別和動態(tài)捕捉,并進(jìn)行拍攝,跟后臺數(shù)據(jù)庫比對后會在會議界面顯示每位發(fā)言者的名字及職位等信息,而且是動態(tài)比對,省去了每個人的自我介紹等環(huán)節(jié)。
而在過去,這些都需要秘書人員手動操作,隨著會議規(guī)模擴(kuò)大或不斷有新成員的加入,人工操作非常低效。
- 會議人數(shù)統(tǒng)計:通過識別后將人臉和后臺數(shù)據(jù)庫進(jìn)行比對后進(jìn)行精準(zhǔn)統(tǒng)計。

3、智能降噪:心無旁騖的專注大師
首先智能感知到雜音,例如敲擊鍵盤的聲音、說話聲音等,然后進(jìn)行自動抑制,即通過麥克風(fēng)收音然后識別,收集發(fā)言者聲音的同時,不斷壓低其它雜音。
設(shè)備監(jiān)測到雜音后(如敲擊鍵盤、翻動書本等)會進(jìn)行學(xué)習(xí),不斷地記錄、學(xué)習(xí)、積累,識別率會越來越高,甚至能分辨出不同人敲擊鍵盤的聲音,進(jìn)而將會議過程中的雜音降到最低,從而能夠讓與會人員都能更加投入地進(jìn)行會議。
4、智慧平臺:強(qiáng)強(qiáng)結(jié)合的 AI 平臺
思科協(xié)作終端設(shè)備整合了業(yè)界先進(jìn)的 NVIDIA Jetson 人工智能計算平臺,從而能讓思科終端設(shè)備的性能得到更好地發(fā)揮,為你帶來更智能的終端協(xié)作體驗(yàn)。
怎么樣,了解了這些神奇的 AI 協(xié)作功能之后,相信你也會對開會這件事有了全新的認(rèn)識,或許有人會問,如果不在會議室離開了思科的這些終端設(shè)備呢?除了以上基于思科終端的會議形式外,不在會議室時,Webex meeting 的人物洞察依然能為您帶來智能化的會議體驗(yàn)!還等什么?趕快去開個會吧!