AI技術,是近年來最火熱的前沿技術之一。在企業(yè)通信領域,人工智能可以簡化企業(yè)日常交流和協(xié)作的多個要素,這不僅可以提升員工對公司業(yè)務的參與度,而且可以提高協(xié)作效率和生產(chǎn)力。
本期「億聯(lián)大咖說」,就帶你與億聯(lián)產(chǎn)品副總廖昀近距離接觸,了解他對AI技術在企業(yè)通信領域發(fā)展的前沿觀點。

億聯(lián)產(chǎn)品副總 廖昀
01小編:請問廖總,最開始是什么契機導致AI技術引入企業(yè)通信領域?
廖昀:AI人工智能本身是一種模擬、延伸和擴展人類智能的一種技術,本質(zhì)上是希望能通過這一技術,讓計算機算法代替人完成數(shù)據(jù)的分析思考,然后進行各類操作,改善和提升我們進行各項活動時的體驗。企業(yè)通信領域引入人工智能也是基于這樣的目的,是用戶需求驅(qū)動的結果。
語音、圖像等各類AI技術很好地解決了企業(yè)通信應用中的一些用戶體驗痛點,當我將這些技術應用到日常通信場景中時,我們發(fā)現(xiàn)這與我們一直倡導的“易用易部署”的產(chǎn)品設計理念不謀而合,也讓我們堅定了要運用AI技術升級企業(yè)通信方案的想法。
02小編:在企業(yè)通信領域,AI技術的發(fā)展涉及哪些技術領域?具體發(fā)展和應用如何?
廖昀:在企業(yè)通信領域,契合用戶場景需求、能產(chǎn)生較大價值的AI技術主要包括語音識別、多語言翻譯、人臉和人體檢測識別等幾個方面。在通信系統(tǒng)或終端中,通過引入AI技術,對改善人機交互體驗,提升溝通協(xié)作效率,以及簡化會議內(nèi)容的跟進處理,這些方面都存在很大的應用價值。
目前業(yè)內(nèi)發(fā)展比較成熟,已經(jīng)得到普遍應用或者正在落地的AI技術應用主要有以下幾個:
人像識別自動取景及演講者跟蹤
這項功能主要體現(xiàn)在視頻會議過程中,集成人像檢測、聲源定位、語音追蹤等多項AI技術,能根據(jù)參會人數(shù)與位置變化自動調(diào)整畫面大小,呈現(xiàn)最佳取景。此外,還能實時檢測發(fā)言者位置,呈現(xiàn)特寫,免去手動調(diào)節(jié)攝像機操作,像是有一個自動導播員,讓與會人員更專注于會議內(nèi)容。

億聯(lián)終端自動取景功能
基于人臉識別的參會人自動識別或自動簽到
在會議開始前提前錄入人像及相關信息,在視頻會議中,系統(tǒng)若識別到與人像匹配的與會者,將自動標記相關信息,避免會議中詢問或確認對方名字和身份的尷尬,也可以進行會議的自動簽到,以及結合演講者跟蹤、語音識別技術實現(xiàn)按發(fā)言人分類的發(fā)言文字記錄功能。
智能語音增強
通過人工智能語音識別技術,并利用麥克風陣列的空間選擇性,對目標說話人語音進行增強,同時抑制或消除噪聲、混響等無效語音的干擾。

億聯(lián)話機“隔音罩”功能
實時語音轉(zhuǎn)寫及多語言翻譯
將發(fā)言語音實時轉(zhuǎn)寫為字幕,進一步地可翻譯為多語言字幕,會后還可以將會議發(fā)言、音視頻直播內(nèi)容等音頻轉(zhuǎn)寫為文字,并進行分類歸納整理為會議紀要。
虛擬場景、背景替換
當前基于摳圖和背景虛化、背景替換的AI應用得到了用戶的普遍喜愛,這是一個很典型的用戶需求驅(qū)動的應用案例,既降低了會議過程中干擾,提升了溝通效率,又打破了用戶參與會議的地點場景限制。
這些AI應用在億聯(lián)網(wǎng)絡推出的企業(yè)通信解決方案中,有些已經(jīng)得到了很好的應用,有些正在完善中,即將在后續(xù)的版本中得到體現(xiàn)。未來的遠程溝通協(xié)作體驗將更加智能和高效。
03小編:未來,還會有哪些AI功能陸續(xù)應用在企業(yè)通信領域?
廖昀:企業(yè)通信領域近些年一直在AI技術應用上不斷突破,始終圍繞提升溝通效率這一根本目的展開。
下個階段,在語音識別方面,多語言翻譯將會是下一個存在巨大應用潛力的AI技術。這項技術主要應用于遠程會議中跨語言的溝通交流,實時會議中的多語言翻譯對翻譯的準確性和實時性要求很高,面臨著很大的挑戰(zhàn),目前這項技術在業(yè)內(nèi)還處于完善階段,還有不少問題要解決或性能指標的提升。
實時會議的多語言翻譯這項技術的落地應用,需要平臺端和終端共同努力,在提升平臺端翻譯準確度和實時性的同時,終端也要提升前端采集的語音質(zhì)量。技術的進步和發(fā)展常常超出我們的預期,現(xiàn)在的技術困難和障礙都將是暫時的,現(xiàn)在看似不可能的AI功能應用,只要用戶有強烈的需求在驅(qū)動,未來終將得到實現(xiàn)和普及應用。

億聯(lián)語音轉(zhuǎn)寫功能
在企業(yè)通信中,除了語音和圖像的基本AI應用,提升遠程溝通交流的效率,橫向地,也可以將這些AI技術與各類企業(yè)數(shù)據(jù)平臺打通,實現(xiàn)更智能、更高效的辦公協(xié)作體驗。比如根據(jù)語音識別到的會議話題內(nèi)容,自動調(diào)取各項業(yè)務流數(shù)據(jù),或者自動對接和處理郵件、日歷、OA、項目管理等各項業(yè)務流程,就像是有一個全能型的會議秘書可以隨時幫你提供業(yè)務數(shù)據(jù)和內(nèi)容,并自動跟進會議的待跟蹤事項,通過高效的數(shù)據(jù)分析和智能的業(yè)務判斷,讓我們的辦公和溝通協(xié)作非常地順暢。
未來,億聯(lián)網(wǎng)絡將持續(xù)加碼AI智能在企業(yè)通信領域的應用,讓我們的企業(yè)通信產(chǎn)品更加簡便易用,為我們的用戶帶來更加智能的通信體驗。我們也將始終關注AI技術的前沿應用,分享未來人類便捷生活的美好圖景。