
盡管市面上的語音識別系統(tǒng)已經非常多了,但是由于人們講話時用詞和口音的問題,幾乎沒有任何一款產品可以完全做到精準識別。雖然這項不完全成熟的技術以后的運用空間廣泛,但是競爭卻也很激烈。
Tetra聯合創(chuàng)始人Jon Goldsmith認為,語音識別市場競爭確實非常激烈,Tetra自己本身的技術也還未達到100%成熟,然而語音識別技術還是需要通過深度學習來解決用詞和口音的識別問題。
手機安裝Tetra后,在接打電話時,其語音識別和深度學習系統(tǒng)會在后臺自動運行,做實時的語音記錄和文字翻譯。用戶可以在系統(tǒng)中搜索關鍵字來查找語音和文字通話記錄。
然而根據語速、口音和用詞的不同,Tetra的識別并不完美。因此Tetra設置了24小時的人工付費翻譯服務,來滿足用戶對高精確性的需求。這項服務既可以滿足用戶的精準化需求,也可以為Tetra的深度學習系統(tǒng)提供學習數據。
Jon Goldsmith表示,目前Tetra的目標客戶是那些每天電話很繁忙的人。這些客戶希望自己和行業(yè)專家們的通話記錄永遠被保存。同時傳統(tǒng)的企業(yè)也是Tetra的服務對象,很多企業(yè)級的服務比如銷售相關的電話也可以通過Tetra完成記錄和識別。
在工程方面,Tetra提供現成的API來強化手機上的一些基礎設施。對于通話識別系統(tǒng)的收費如下圖所示:

通過這種方法,Tetra可以獲得高頻大量的學習數據,從而通過深度學習繼續(xù)優(yōu)化語音識別系統(tǒng)。相較于單純的企業(yè)級語音識別服務,這種數據獲取方法成本相對更低,獲得的數據也相對更加多元。
同時,這項技術的進展和使用哪個云端API有著緊密的聯系。比如一些NPL(自然語言處理)服務運營商對演講的處理能力較強,有些對數字的處理能力較強等。選擇不同的NPL也許對于通話語音的處理效果會出現很大的不同。
對于語音識別領域,國外的諸如谷歌、亞馬遜,國內的諸如百度、阿里和騰訊等巨頭都有涉及。這塊市場的應用場景廣泛,技術還未成熟,蘊藏的投資和創(chuàng)業(yè)空間自然很大。在企業(yè)服務領域,搜狗、科大訊飛等企業(yè)也都推出了其語音速記系統(tǒng)。
然而目前在語音識別領域還未有公司可以完全解決上文中所述的人類語言多樣化的問題,這個問題如何得到解決,深度學習究竟是不是答案,還需要時間來驗證。
這次種子輪融資是Tetra第一輪融資。