新浪“無線互聯(lián)”論壇第二期
清華大學計算機應用專業(yè)博士鄭方聊天實錄
2003/03/14
主持人:各位網(wǎng)友下午好!這次是新浪“無線互聯(lián)”論壇第二期,今天很高興邀請到清華大學計算機系語音技術中心的主任鄭方,首先請鄭方介紹一下。
鄭方:大家好,我是鄭方,我來自于清華大學計算機系,現(xiàn)在在計算機語音技術中心,我從事語音識別和語音理解方面的技術研究和開發(fā)已經(jīng)有十幾年的時間。我上學和工作基本在清華,后來在2000年的時候,香港政府有一個機會是輸入優(yōu)秀人才計劃,因此我到香港工作了一段時間,在2002年基本回到國內(nèi),創(chuàng)造了得意音通公司,這個公司的目標是和清華語音識別實驗室共同建設一個產(chǎn)學研的通道,使學校和企業(yè)之間共同受益,同時把基礎研究和開發(fā)兩個方面都做好,從而能為我們國家的中文信息處理、無線互聯(lián)等等各方面的應用提供很好的支持。
主持人:無論在國內(nèi)還是在國際,“無線互聯(lián)”是非常熱的技術和特點,國內(nèi)很多的廠家和科研機構關注無線互聯(lián)的產(chǎn)業(yè),很多網(wǎng)友想了解無線互聯(lián)產(chǎn)業(yè)發(fā)展的趨勢?請鄭博士跟我們分享一下這個見解。
鄭方:這是蠻大方面的問題,無線互聯(lián)牽涉到很多的環(huán)節(jié),用戶是我們的上帝,有增值服務提供商、內(nèi)容提供商,有設備和制造的終端商,更離不開網(wǎng)絡運營商等等。我想在產(chǎn)業(yè)鏈里面,每一個環(huán)節(jié)都有很大的發(fā)展空間,國內(nèi)在這方面做得不錯。相對來講,如果把用戶和其他服務分開的話,單就市場的硬件條件來看,設備和終端的制造方面如果有一個很好的發(fā)展話,至少提供一個基本的基礎,我們可以很好的進行一些服務,如果想讓它上一個很好的層次,就需要內(nèi)容提供商有一個很大的發(fā)展,才能使發(fā)展有一個更好的層次,比如我的內(nèi)容服務做得更好,更加滿足用戶的需求。增值服務提供商必須相對的有很好的支持,有很好的規(guī)劃。比如象新浪,我覺得很多方面就做得很好?偟膩碇v,每個方面都有它的發(fā)展空間,每一個方面都應該發(fā)展得很好,我相信都會發(fā)展得很好。
主持人:在無線互聯(lián)產(chǎn)業(yè)中用戶、網(wǎng)絡運營商、設備終端制造商、增值業(yè)務提供商、內(nèi)容服務提供商構成一個完整的產(chǎn)業(yè)鏈,每一個定位和環(huán)節(jié)都很重要,鄭博士,如果通過技術發(fā)展促進產(chǎn)業(yè)良性循環(huán),進一步增加產(chǎn)業(yè)的發(fā)展。
鄭方:我剛才提到應用、發(fā)展分為幾個層次,我們有一個層次可以讓它應用起來,要想讓它應用更高的層次,可能要在幾個方面做一些多的文章。比如說在內(nèi)容提供商方面,我們要提供很豐富的內(nèi)容,大家感興趣的,大家關心的一些熱點問題。增值服務提供商要提供很好的服務。我們把另外四各環(huán)節(jié)當成兩個來看的話,是兩端,是人機界面,它在無線互聯(lián)里面尤為顯得重要,大家知道無線互聯(lián)的發(fā)展越來越的快,這里面大家強調(diào)了一個問題,我能隨時隨地的享受到無線互聯(lián)服務帶來的好處。怎么去享受?我手機沒有大的鍵盤,不可能帶一個大的鍵盤來做,這是不現(xiàn)實的,所以很小的設備都是沒有鍵盤,或者很小,或者是軟鍵盤,或者是觸摸屏,要使人和計算機有一個很好的交互,就是自然語言。自然語言在技術上面分為兩個方面,一個是語音理解,就是計算機識別出你說的話,然后理解出你說話的內(nèi)容,然而根據(jù)你的提問和需求提供相應的服務。
我舉一個例子說,象旅游這個方面,比如一個人到一個新的城市,想了解旅游的信息,但我不知道在哪個地方問到,我有手機,用手機打到一個特別服務的號,我就問,北京哪些地方有很好玩的地方,能夠給我提供一些建議,哪一些地方能夠很好提供很好的餐飲服務,哪些地方提供很好的文化環(huán)境服務,我可以通過自然語言的方式進行服務,就拋開鍵盤,這樣就更好的為用戶提供服務。
主持人:技術發(fā)展在日新月異的提升,技術的重要目的促進了社會的進步,北京奧組委在數(shù)字奧運提出一個任務,在2008年召開奧運的時候,希望任何人在任何時間、任何場所通過任何設備方便獲取奧運的信息,分享奧運的喜悅,這樣促進了無線互聯(lián)的迅速的發(fā)展,我們科技產(chǎn)業(yè)界在其中能起到什么影響,會發(fā)生什么作為?
鄭方:奧組委向奧申委做了一個莊嚴的承諾,其中就是數(shù)字奧運的問題,希望任何人在任何時間、任何場所、任何一個設備上能夠為用戶提供更多的奧運的信息,使大家分享到奧運的成果。這里面其實牽涉到一個問題,我想有一個跟移動互聯(lián)相關的,很大程度可以促進無線互聯(lián)技術也好、產(chǎn)業(yè)也好有很大的發(fā)展,我們提供智能信息查詢系統(tǒng)和多語言的語音識別系統(tǒng)。在奧運期間,我們需要為來自全世界各個國家和地區(qū)的,說各種語言的運動員、教練員和體育官員,各自有各種不同的需求,需要提供各種不同的信息,比如有的象賽事的信息要了解,有的可能想了解我對這個賽事的預測等等這些也屬于問題,還有運動員做完了比賽之后,我想游覽北京,北京交通情況我怎么做,或者北京購物情況怎么做,等等所有的這些問題,這些時候不象以往的事情,奧運會是很大的國際的賽事,所以不象小型的會議可以專門提供很好的用人來提供服務,這就迫切需要我們能夠提供一些自動的服務,哪怕即使是半自動的服務,這些服務能夠讓運動員、教練員、體育官員能夠在北京、在中國享受到這種服務,這里面也就是自然語言的識別、自然語言的理解,就是一個很好的方面。
我想國家奧組委,已經(jīng)把這個作為重中之重,相對來講,我們國內(nèi)的產(chǎn)業(yè)圍繞這些有很大的突破,有很大的發(fā)展,F(xiàn)在已經(jīng)委托首信作為牽頭單位和其他的國家重量級的研究機構以及產(chǎn)業(yè)界的佼佼者共同做這樣的事情。這里面牽扯到多語言的問題,希望對多種語音進行識別,而且多語言問題派生一個問題叫混合語言,這個可能比多語言要麻煩一點。因為多語言,我想說日語,可以提供日語的服務,想說漢語,可以提供漢語的服務,想說英語,可以提供英語的服務,這就是多語言。有時候往往并不是這樣,是混合語言,比如他在說中文的時候突然夾雜兩個英文,甚至夾雜日文,甚至兩三種語言擱在一起都可能出來,這個時候怎么辦?我們單純的語音識別,一個語音的或者多個語音的不能解決問題,需要很好的解決,這里牽涉到技術問題,需要對語言識別、多語言混合的問題有一個很好的解決方案。
這是在語言識別的層面上來講。另外一個方面上升到稍微高的層次就是語言理解,我識別出來可能只是把文本能夠得到,比如象IBM一個軟件能把聲音變成文字,緊接著的一個問題就是不是要把它變成文字,而是要變成服務,比如我去頤和園,應該乘車怎么走,你應該告訴他路線,而且牽扯到的方方面面很多,比如需要增值服務商的服務,肯定網(wǎng)絡運營商是不少的,而且內(nèi)容提供商要提供旅游、交通各個方面,還有天氣。比如我剛才說的問題,我想從奧運村到頤和園怎么去這個問題,牽涉到內(nèi)容提供商至少有兩個,第一個我需要電子地圖,你能夠把北京市的地圖變成電子的,可以動態(tài)的存取信息。另外一個內(nèi)容的提供商就是我們的交通部門,它雖然不是一個公司或者是一個什么,但是廣義的講,它應該是內(nèi)容提供商,它動態(tài)的提供你現(xiàn)在什么時候堵車,什么地段堵車,什么地段不堵車,一旦提到這個問題,首先經(jīng)過這樣的過程,我識別這句話,然后理解這句意思,然后知道目標是從奧運村到頤和園,所以通過電子地圖收索信息,然后哪條目標方便,哪條路不堵車,真正做好這樣的服務需要產(chǎn)業(yè)鏈,每一個環(huán)節(jié)都要起到很好的作用,才能做好這個事情。
主持人:產(chǎn)業(yè)鏈在無線互聯(lián)涉及到很多的技術含量,象比爾蓋茨說這個話:在21世紀后幾十年,無線是未來兩個很重要的發(fā)展方向,語音和語言方面有很重要的方向。鄭博士在這方面研究比較早,你認為我們面臨什么挑戰(zhàn),我們的挑戰(zhàn)跟國際方面的合作的競爭應該怎樣面對?
鄭方:這面臨很多方面的挑戰(zhàn)。因為無線互聯(lián)我剛才講到人機交互之間最自然的交互就是自然語言,自然語言牽涉到很多問題,語音識別和語言理解,我給用戶提供服務的時候就涉及到語音的合成,所以識別、理解、合成,這里面都會跟這些相關。那么除此之外,另外一個方面還有,就是在有的時候我可能要提供一些個性化服務,比如鄧先生,你可能要訪問某一個服務,我能夠原先知道你用過我的系統(tǒng),我一聽到你的聲音,就會說鄧先生,你好,歡迎你再次來我們這里提供服務。但是在這里面有一個很大的問題,就是口音方言的問題。拋開其他語言來講,中文就是很大的問題,比如上海那邊為代表的廣東話等等,我們現(xiàn)在好多語言識別的系統(tǒng),對標準普通話做到一個很好的性能,但是一旦有方言或者口音,性能就會馬上下降。但是怎么攻克這個問題呢?在國際上很難有一個標準的答案。比如美國的自然基金叫國防高級研究規(guī)劃局和美國防部經(jīng)常舉行研討會面向全世界,全世界比較有名的研究機構或者公司、企業(yè)都可能會向組織來提交他的一些提案,作為研究的重點。今天我提了一個提案就是關于方言和口音的問題,在國家提交方案的里面,最后能夠勝出作為最終的三四家,因為參加競爭的有三四十家,最后能勝選出來。這個問題是很重要的問題,而且是國際學術界的問題,他們也想下力氣解決這個問題。我認為在這個方面應該下力氣解決好這個問題。
第二個問題,就是通道的問題,我們知道在無線互聯(lián)里面,我們所涉及到的頻道可能會很多,信道會很多。比如你可能用固定電話進行信息訪問,你可以用手機,你甚至打IP電話,當然也可以上網(wǎng),你可以正在開車的時候,剛才的定位系統(tǒng),導游定位系統(tǒng),你在車里打電話,各種各樣的信道都有不同的特點。我這語音識別、語音理解怎么適應不同信道的差異呢?這就需要解決剛才類似的問題,多信道、混合信道的問題需要解決。這是一個不得不面對的問題。
第三個問題,就是相當于背景噪音,大家知道在這方面的東西遇到問題的時候,往往一有背景噪音,別人一說話,發(fā)現(xiàn)這個系統(tǒng)不轉了,這個時候你得解決好背景噪音的問題。所以這也是我們在技術上面臨的挑戰(zhàn)。第四個問題,在自然語音理解方面,我們也有很多的問題需要解決。因為自然語音的理解和通常的語音理解不一樣。通常語音理解面對的是一個文本,里面的語法比較規(guī)范,語序比較正常,所以很容易分析。而且我相信我們國家很多學術單位在這方面有很好的發(fā)展,比如北大的余守文教授和清華的黃昌教授在微軟研究院,東北大學的姚天順教授在這方面有重大的進步,但是新的問題提出了,我人說話是很流利的,我說著話回著頭說,或者把話倒過個,這都是自然語音要理解的。而且還有對話的問題,你要怎樣解決省略的問題,這都是需要面臨的很大的問題。
還有一個問題在合成方面,我們也存在一些問題。比如在合成上來講,我們現(xiàn)在應該說合成做得相當不錯,有一個文本給它以后,能夠把聲音發(fā)出來,而且你感覺到還比較好,但是一個最大的問題,可以這樣描述,對每一個音都發(fā)得很標準,但是對一句話,你說,你不敢非常有把握的它做得非常自然,對一個話來說牽涉到很多的問題,比如韻律,不同的韻律有不同的意思,比如“你好”,“你好呀”,這就變了另外一個意思,不同的韻律代表不同的意思。所以在合成當中,怎樣能夠很好的把感情色彩、思想、觀點表達出來,也需要我們研究。我們發(fā)現(xiàn)這里面有一個很重要的問題,就是當然你要對這句話理解,必須先理解,理解之后才能夠知道把韻律加進去,所以牽涉到這樣的問題。
另外還面臨的一個問題就是語言的翻譯。在奧運期間,世界上每一個國家都要來參加,語言是很多的,不可能為每一種語音做識別器,工作量是很大的。有一個很好的做法就是有一個翻譯系統(tǒng)。雖然這個系統(tǒng)內(nèi)容是中文,但是用英文來文,就把英文翻譯到中文,找到信息然后翻譯成英文然后捋回去,對數(shù)字奧運我們碰到這些問題,同時我們對產(chǎn)業(yè)問題上也會面臨這些問題,我們要一些產(chǎn)業(yè)公司、內(nèi)容提供商等強強合作,有了基本理論研究的深度,同時對我們國家來說是一個很好的契機,可以帶動基礎研究的發(fā)展。另一方面,通過很好的機會來促進一個產(chǎn)業(yè),讓我們賺到更多錢。奧運經(jīng)濟是很好的策略。在這個方面,得意音通公司有很多好的東西開發(fā)出來,比如語音識別,我們有一個專業(yè)的開發(fā)軟件、開發(fā)工具包,有API,語言理解有類似的開發(fā)工具包,使得你在用的時候很方便變成你所需要領域的一些應用。當然這還是一個初步階段,剛才談的幾個問題都解決,在2008年之前我們需要幾年的努力和奮斗,才能把這個問題解決。
主持人:2008年以后還要進行不斷的努力。
鄭方:對,這是一個長期的國家。國際上好多專家和學者都提出這樣的問題,說21世紀是一個語音的世紀,在無線互聯(lián)里更是感覺到這個問題。既然是語音的世紀,不光是官方現(xiàn)在要做的事情,我們要不斷的做。
主持人:國內(nèi)國外院外在無線互聯(lián)上的市場很大,技術相對落后,國外無線互聯(lián)的運用比較早,但是市場因為泡沫破滅,更相信國內(nèi)市場,你能講一下國內(nèi)無線互聯(lián)技術引用到什么層次?對產(chǎn)業(yè)界有什么啟發(fā)嗎?
鄭方:我們國內(nèi)從技術上水平來講,我們國內(nèi)的技術可以這樣說,在國際上占有一定的定位,有很高的水平,很多項目是國際領先的。其實在這個方面有很多的研究單位和業(yè)界有這樣的貢獻,比如清華大學和中科院自動化所、中科院深學所等等學術界,產(chǎn)業(yè)界比如得意音通公司是一個,還有中科模式、北大方科等等,這里都是知識產(chǎn)權的公司。這里面我們在很多方面,包括中文的語言理解,包括中文的語音識別,甚至包括方言口音的情節(jié),我們都做得比較好,我們發(fā)現(xiàn)有好多國外的公司直接找到我們國內(nèi)的研究單位也好或者企業(yè)界的公司也好尋求很好的合作關系,這說明對我們的認可。我們想經(jīng)過學術界和產(chǎn)業(yè)界一些同仁、一些單位共同的努力,我相信能夠抓到很好的機會得到很高的發(fā)展。
主持人:在國外已經(jīng)運用到什么層次?以及跟國內(nèi)的異同是什么?
鄭方:國外的無線互聯(lián)方面的系統(tǒng)性維護得比較好。比如日本的DOCOM,不僅僅是作為一個單一的形式,往往把內(nèi)容服務商、網(wǎng)絡提供商、增值服務提供商集中在一起為用戶提供一個平臺,以用戶為中心,用戶是主導,用戶是上帝,用戶的需求就是一切。其實這跟我最早的問題提出把用戶分為兩個陣營,我們國內(nèi)目前來說,這幾個渠道除了用戶相互之間割裂比較多,有合作,但是我們希望合作更加的密切,更加進一步,強度更加的大。如果有可能的話,有一個比較大的公司或者牽頭單位把這個做好。由于這個做起來以后是多贏的局面,不是一個公司把它做好,是多贏,每一個公司都可以獲得發(fā)展。
主持人:在兩會期間,信產(chǎn)部的定位,原來是又當父母,又當裁判,現(xiàn)在變成了起監(jiān)管的作用,促進互網(wǎng)互通,通過多年的互聯(lián)網(wǎng)的發(fā)展,對產(chǎn)業(yè)發(fā)展已經(jīng)上了一個規(guī)模,現(xiàn)在產(chǎn)業(yè)鏈上技術已經(jīng)用得比較多了。你是作為參與公司的管理,希望運營商方面給一些建議?
鄭方:我認為給增值服務提供商也好、設備服務商也好應該提供一個開放的平臺,我剛才講的多贏的局面,任何一個環(huán)節(jié)做好了,對網(wǎng)絡運營商是一個極大的促進,也會得到更
好的發(fā)展和鞏固,我認為應該采取開放的態(tài)度。至于其他的環(huán)節(jié)和合作的方式來講,我覺得這里面應該沒有一個定式可言,合作方式可以很多,我在公司做過,最近主持得意音通公司的工作,我感覺以什么為主呢?什么是你合作模式最好的判據(jù)呢?我一直思考這個問題。對于公司來講,應該是能夠很好的把社會和公司的效益作為最好的判別,對于網(wǎng)絡運營公司,第一為用戶提供最好的方法是作為一個判別,第二,你能夠把你的產(chǎn)業(yè)做得更好,賺更多的錢,效益最大化,這就是最好。因此,我覺得應該有更加靈活的模式,只要為用戶帶來好處就能夠做,只要它能夠為你賺到錢就讓它去做。
主持人:中國移動互聯(lián)網(wǎng)的短信運營得非常的好,但是只是低層次的,比如聊聊天呀,你作為技術開發(fā)商,你認為有什么好的新的技術和應用推動短信產(chǎn)業(yè)的發(fā)展,讓中文短信在未來的無線寬帶、CDMA、GPRS上更好的應用?
鄭方:我到過十幾個國家和地區(qū),給我感覺短信是中國特色的一個現(xiàn)象,短信在中國有了很大的發(fā)展,就象今年春節(jié)期間,兩天的時間達到七八十億條的短信量,讓產(chǎn)業(yè)界都感到非常的高興,這是一個很大的潛在市場。而且我們覺得有更大的發(fā)展。為什么呢?目前的短信只點對點的形式,中低端形式,我剛才說了還有很多環(huán)節(jié)參與進去,現(xiàn)在牽涉到一個環(huán)節(jié)就是用戶、運營商、用戶,甚至有的時候加幾個環(huán)節(jié)進去,我認為應該提高更高的服務,比如把內(nèi)容服務商加進來,比如高考信息,每年在高考前后,不管考生本人也好,考生家長也好,都非常關心高靠的情況,都非常關心志愿的情況,能不能通過某種形式把高考的信息、招生的信息搜集起來,這就是內(nèi)容服務商的工作。做完以后加上語言的技術,把這個信息提供給用戶,我相信這個產(chǎn)業(yè)會是很大的。中國的父母都有望子成龍的期望,因為這是最經(jīng)濟的方式,用各種卡費用都比較高,即使不是最經(jīng)濟的,父母都希望孩子有一個很好的未來和發(fā)展進行投資,對于更經(jīng)濟的,他們更愿意,所謂物美價廉。
另外,我們也呼吁其他方面技術能夠加進來,比如我用手機的時候的輸入方式的輸入設備,這是一個很大的問題,對英文不是一個問題,英文26個字幕在手機鍵盤上輸入進去,而且中國的多音字、多意字、同音很多,我選一個字中間有好多的選項,我要挑哪一個是我要的,所以我們要生產(chǎn)和開發(fā)這樣的設備,供用戶來方便的使用。比如基于拼音的輸入法,基于數(shù)字的輸入法,基于語音的輸入法,等等各種各樣的輸入法都要提供出來,至于在哪里提供,我們在產(chǎn)業(yè)界找一個更加合適的地方,比如我可以擱在增值服務提供商里面,用戶不用換手機,只要把東西發(fā)在服務器那邊就可以識別理解。當然有一種方式,我在手機終端這來做,比如大的手機廠商象諾基亞、摩托羅拉、愛立信、中國國內(nèi)一些各種廠商象多普達等等都要把方便的手段提供給用戶,這樣就做得比較好,促進發(fā)展。
主持人:你認為短信這塊的發(fā)展空間在互動性上,尤其是國內(nèi)點對點,對語音理解在互動上給很多的網(wǎng)民用起來,因為手機用戶比PC的用戶多得多,能不能提供好的解決方案,讓他們更能隨心所欲的用起來?
鄭方:我相信是可以的,我相信不是盲目的樂觀,我們在這方面提供了解決方案,我們既有核心技術提供給二次開發(fā)商或者運營商,或者服務商等等進行開發(fā),我們自己也開發(fā)一些工具,這就很好的來提供。另外我也相信其他的大學也好,企業(yè)也好有類似的東西,所以我認為這個事情有很大的發(fā)展。我們呼吁網(wǎng)絡運營商和各個科研機構、企業(yè)界有一個很好的合作,包括增值服務提供商有一個很好的合作,能夠把這個事情做好,共同來挖掘中文短信巨大的、非常有潛力的市場。我們相信在中低層次的應用,可以達到很大的量,那么我們加上高層的應用,量會更加的大。
主持人:未來無線寬帶的應用在今年馬上要起步,在兩至三年內(nèi)的空間更大。
網(wǎng)友:現(xiàn)在手機和電腦逐步合成一個整體,中國目前網(wǎng)絡情況比較差,您對目前這種現(xiàn)狀跟未來的趨勢有什么看法?是比較樂觀還是比較悲觀呢?
鄭方:我對這個問題看法比較中性,我認為這個問題不單單是用悲觀和樂觀來考慮,為什么呢?在這個里面,手機和電腦是合還是分,取決于用戶。其實對于中國十多億人口大的國家,所謂蘿卜青菜各有所愛,每個人都有各不一樣的方式,有的人偏愛以手機為主,附加PDA功能的設備,有的人傾向我以電腦為主,附加帶有手機功能的設備,有的人希望合起來,有的人希望分起來,各自的口味是不一樣的。按照我的想法,這幾種情形都會并存。比如我出外的時候,電腦不能做很小的時候,我拿著手機,你拿著電腦很大,你想把兩個功能都能做大,這對資源來講是很大浪費,因為我不需要都要,我出去只要打一個電話,通訊是我唯一使用的目標。從其他方面來看,比如電視機,在很多方面大家提到電視上網(wǎng),這是前一段時間提得很熱的,而且這個問題,我想在幾年前大家也提到這個問題,但是具體怎么樣呢?還是取決于用戶的接受程度。
主持人:包括技術發(fā)展的趨勢。
鄭方:一個好的產(chǎn)品不是功能越多就越好,而是越方便越好,而且性價比更好,更容易被用戶接受。
主持人:象多普達、微軟這幾年積極的加緊手機的行業(yè)搶占這個市場,摩托羅拉、諾基亞正在找新的技術和新的應用來發(fā)展,你對智能手機怎么來看待?
鄭方:我非?春眠@個發(fā)展,微軟給我們行業(yè)帶了一個頭,我們圍繞智能手機發(fā)展,有很多設備得到了發(fā)展,職能手機有很好的發(fā)展。跟幾年前預料相比,發(fā)展比較快的還是出乎大家的意料,大家只是想到手機和電腦有一個結合,但是我看到多普達類似的功能,微軟的計劃也出來了,微軟在這個瓶頸上有很大的帶動作用,我對這個比較樂觀。
主持人:.NET計劃也有無線發(fā)展的優(yōu)勢,它也在語音方面通過語音結合起來,現(xiàn)在正在考慮。你作為專家,對這個怎么看待?
鄭方:語音識別做得比較好的公司有幾家,比如微軟,IBM,因特爾等等,他們對這語音情有獨鐘,比如微軟.NET部門進行了很多的研發(fā)和開發(fā),大家瀏覽微軟的網(wǎng)站,制定了一個STO的規(guī)劃,這種規(guī)范制定起來,希望以后在各種平臺,利用各種平臺有一個規(guī)范,把語音識別加進去,把語音理解加進去,把語音合成也加進去,這樣的話,就可以使得我隨時隨地隨口而出,在任何設備上完成我所想要達到的目的,訪問我所需要的信息,這是一個很好的前景。
主持人:比爾蓋茨上個月剛從中國離開,有一些產(chǎn)業(yè)界喜歡微軟的,有一些反對微軟的,清華大學是國內(nèi)很核心的機構,怎么看待跟外國的企業(yè)機構合作呢?
鄭方:這很難問題,每個人的看法都有每個人看法的道理,我不想具體的去評論。因為我跟國際的交流比較多,包括學術界、企業(yè)界都有一些交流,這個交流讓我感覺到非常的受益。比如我訪問過象美國有名的MITCPU、GHU,我也訪問過微軟、IBM,我發(fā)現(xiàn)他們有很好的思路提供很好的見解,我反對盲目的把一些東西推出去,應該拿來,好的東西應該拿來,為我所用,能夠幫助我們提高自己的水平,這是最好;谶@些的考慮,我們在清華國家重點實驗室非常注意這一點,每年進行類似的國際合作和交流,學習外國的先進經(jīng)驗,借鑒外國的先進技術,來達到提高自己的認識的目的。牛頓提到要站在巨人的肩膀上,否則你對自己的發(fā)展并沒有利。
主持人:語言中文信息處理,是在中國信息產(chǎn)業(yè)極少數(shù)的,還能跟國際水平相當?shù)囊粋產(chǎn)業(yè),我們怎么樣利用中國特色的東西發(fā)揮我們民族產(chǎn)業(yè)的作用,從而在無線互聯(lián)、信息發(fā)展的經(jīng)濟或者國家方面占有自己的主導地位呢?
鄭方:中文確實有自己的特點,比如我剛才講到的多音字的問題、多意字的問題。比如有一些句子里沒有主語,有一些沒有謂語,但是我們能夠理解。中文的特點非常的奇特,而這種奇特性不是某一個外國大公司非常容易掌握的,有中國極少數(shù)的企業(yè)堅持這份產(chǎn)業(yè)陣地,我們希望把經(jīng)營的產(chǎn)業(yè)繼續(xù)的發(fā)展下去,這需要得到很多方面的支持,包括國家科技部、各個省市的科委,包括教育部、大學的領導,包括一些中文的各個協(xié)會,比如中文處理協(xié)會和計算機協(xié)會等等,需要政府的、學術界的,還需要一線的人共同的努力,這樣才能夠使得我們把事情做好,形成自己的規(guī)范,形成自己的標準,有自己的知識產(chǎn)權。我覺得必須這樣做,因為它是一個系統(tǒng)工程,不是割裂開來講的。
主持人:提到知識產(chǎn)權,在國內(nèi)也好還是在國外也好,非常重視知識產(chǎn)權,國外在國內(nèi)擁有很多知識產(chǎn)權的地方,比如高通和大唐談到TD-SCDMA屬于誰的問題,無線互聯(lián)方面以及新的技術產(chǎn)業(yè)方面知識產(chǎn)權是非常核心的問題,你怎么看待這個問題呢?
鄭方:知識產(chǎn)權應該得到很好的保護,這是一個企業(yè)界得到良性發(fā)展的前提條件。在短期來講,有的時候知識產(chǎn)權沒有得到很好的保障,有的時候出現(xiàn)盜版的情形,可能讓大家感覺到,你看我用很少錢使用某種軟件和某種服務,但是長遠來講,你這種使用服務的機會,或者用同樣的錢使用到優(yōu)良服務的機會就慢慢會喪失,因為你自己的知識產(chǎn)權沒有得到保護。因此,我非常不同意說,如果這個公司是外國公司,我就隨便盜版它,我覺得不能這樣,其實這東西是相互的,你保護任何一個公司,首先把它作為公司來看,作為一個實體來看,作為一個研究單位來看,它的知識產(chǎn)權要保護,你尊重這一點,反過來也是對自己知識產(chǎn)權起到一個很好保護的作用,所以我堅決站在保護擁護知識產(chǎn)權的行列中去。這樣對企業(yè)也好還是對用戶也好,都有一個很好的作用。
網(wǎng)友:我希望在清華大學有很好的深造機會,你能否介紹一下清華的情況呢?
鄭方:清華是以工科為主的綜合大學,對信息方面學校有了很方面的加強,現(xiàn)在信息學校有很多領導加強對信息方面的引導,所以有識之士能夠加入到信息行業(yè)里面來進行高難度的科研開發(fā),我是非常歡迎的,有信息的朋友可以通過清華的網(wǎng)站了解更新的消息。
網(wǎng)友:人工智能、語音技術在清華方面有哪些優(yōu)勢,我想從事這方面的研究,能否給我一些建議呢?
鄭方:我們在這方面有一定的優(yōu)勢,在國際上有一定的影響力,比如人工智能領域,象國家信息系統(tǒng)國家實驗室,是連續(xù)三次在重點實驗室評比當中獲得I,這是信息類唯一的。我們這里面有很多的研究,包括語音識別、語音理解、手寫體、印刷體的識別,甚至包括自動控制等等,這些方面我們都有比較深入的研究,而且我們都積累了很多的經(jīng)驗。比如語音技術中心在國內(nèi)就是第二家,第一家是深學所,余田成教授,第二家是信息語言中心,都有很多,而且在國際上得到一定的認可。這里面現(xiàn)在我們感覺到,在新的形勢下,有很多沒有解決的問題,需要更多的人更大的投入解決這個問題。我們現(xiàn)在感覺最大的問題是人的問題,希望有更多有識之士以及更多的朋友加入這來,把這個行業(yè)做得更好,把這個產(chǎn)業(yè)做起來。
主持人:胡錦濤春節(jié)前訪問過中國信息孵化園,對留學生回來創(chuàng)業(yè)表示支持,你也在國外工作過,現(xiàn)在回來創(chuàng)業(yè),很多人講清華是留美學校,有很多人在微軟等硅谷公司,你對產(chǎn)學研結合有什么敢想和體會?
鄭方:2000年江澤民視察過上地,包括胡錦濤視察過上地,我覺得國家在這方面有歡迎留學生回來創(chuàng)業(yè)的姿態(tài)是非常積極的,也是非常真心的,這種行動帶來很好的效果,比如我現(xiàn)在有很多好的同學和好多很好的朋友、師弟以及學生回國創(chuàng)業(yè)了,他們回來以后,他們回來以后給我們注入新的血液,給IT產(chǎn)業(yè)發(fā)展有很好的作用。雖然清華是留美的學校,但是已經(jīng)有很多的人回來了,對IT發(fā)展有很大的幫助這是給予肯定的。當時臺灣最早有很多人到國外留學,但是到后來,他們都回去了,回去以后帶動了臺灣的經(jīng)濟、科技,整個就發(fā)展起來了,二十年來發(fā)展的很不錯。我們看到很好正面的例子,對我們來講也有很好例子。這里面產(chǎn)學研的發(fā)展、產(chǎn)學研的結合,這是正面的,為什么呢?單單的產(chǎn),單單的研,是割裂的,是一和一的問題,如果把一和一加到一起,就可以相輔相成,互相促進,可以達到一加一大于二的效果,F(xiàn)象包括中科院也好,包括清華園也好,都有一些計劃,有而且我們也不斷的吸引國外的有以外以及國外的專家到國內(nèi)來講學,這是一些具體的舉措,我們也非常感謝國家能夠給留學生給予很多政策上的優(yōu)惠和關懷,這是我看到的希望。
主持人:馬上一個小時就要過去了,今天聊的話題比較多了,現(xiàn)在鄭博士最后總結幾句話給各位網(wǎng)友一些建議。
鄭方:無線互聯(lián)領域蘊含著很大的商機,在基礎研究和產(chǎn)業(yè)發(fā)展方面有很大的空間,而且需要很多的單位共同的參與,需要很多的優(yōu)秀人才共同參與才能做好。因此我希望大家能夠共同的參與這樣的事情,把這個事情做好。
另外,我也看到一些網(wǎng)友提到一些問題,希望和網(wǎng)友有更多的交流,我們希望網(wǎng)友能夠參與我們這樣的一些行列,比如能夠到清華來,歡迎你到清華進一步的學習和深造,如果對產(chǎn)業(yè)有所貢獻的,希望有所貢獻。今年是羊年,希望羊年,各位網(wǎng)友在無線互聯(lián)領域或者其他各自的行業(yè)都能洋洋得意,取得很好的發(fā)展。如果各位網(wǎng)友有興趣,可以跟我們聯(lián)系,我們有E-mail地址,跟大家交流意見和看法。由于談話時間比較緊迫,有一些問題沒有經(jīng)過深思熟慮的,難免存在一些錯誤的地方,也希望得到網(wǎng)友的指證。
主持人:現(xiàn)在正值春天,希望春天得意,讓我們一起來共同的發(fā)展。感謝新浪給我們提供這樣的環(huán)境,讓我們進行交流。今天的聊天到此結束,謝謝各位網(wǎng)友,也謝謝各位嘉賓。
新浪科技(tech.sina.com.cn)
相關鏈接: