首頁(yè)>>CT技術(shù)培訓(xùn)>>應(yīng)用篇-把網(wǎng)站內(nèi)容發(fā)送到第三代視頻手機(jī)>>

把網(wǎng)站內(nèi)容發(fā)送到第三代視頻手機(jī)

      一.概述

      二.一個(gè)有價(jià)值的建議――把視頻看作一個(gè)延伸層

      三.網(wǎng)關(guān)功能需求

        3.1 物理層
        3.2 媒體流層
        3.3 應(yīng)用程序?qū)?/a>

      四.網(wǎng)關(guān)結(jié)構(gòu)

      五. 特別的挑戰(zhàn)

        5.1 流化的音頻
        5.2 流化的視頻
        5.3 圖像的視圖控制
        5.4 用戶(hù)輸入

      六.典型應(yīng)用

        6.1 應(yīng)用特征
        6.2 音頻/視頻通訊
        6.3 需要文本輸入的應(yīng)用
        6.4 選擇的自由

      七.商業(yè)模式

      八.NMS能幫什么忙?

      術(shù)語(yǔ)表


一.概述                           

  基于3G團(tuán)體開(kāi)發(fā)的3G324M標(biāo)準(zhǔn)的無(wú)線(xiàn)視頻手機(jī),現(xiàn)在已經(jīng)被無(wú)線(xiàn)業(yè)務(wù)提供商用于動(dòng)態(tài)圖像呼叫。把普通網(wǎng)站的內(nèi)容發(fā)送到那些手機(jī)上的業(yè)務(wù)會(huì)很有價(jià)值。

  本文考究一個(gè)能把網(wǎng)站內(nèi)容發(fā)送給視頻手機(jī)用戶(hù)的網(wǎng)關(guān)。評(píng)估了網(wǎng)關(guān)中各種必要組成部件的成就,并解決了一些特別困難的問(wèn)題。用詳細(xì)精確的應(yīng)用例子說(shuō)明網(wǎng)關(guān)的工作原理,并評(píng)估了它在促進(jìn)新業(yè)務(wù)方面的潛力。

  NMS通信公司為正在出現(xiàn)的3G無(wú)線(xiàn)視頻技術(shù)OEM廠商和開(kāi)發(fā)商提供廣泛的業(yè)務(wù)支持和解決方案。特別關(guān)注為無(wú)線(xiàn)視頻手機(jī)用戶(hù)提供新業(yè)務(wù)的網(wǎng)關(guān),這些網(wǎng)關(guān)允許從傳統(tǒng)電話(huà)網(wǎng)和IP網(wǎng)接入到呼叫對(duì)象和視頻內(nèi)容。最初配備的3G324M無(wú)線(xiàn)視頻手機(jī)的使用情況,以及業(yè)務(wù)供應(yīng)商盡可能補(bǔ)充舊2G設(shè)備的需求,都是在短期內(nèi)指導(dǎo)網(wǎng)關(guān)設(shè)計(jì)的因素。本文所討論的網(wǎng)關(guān)就是NMS準(zhǔn)備為客戶(hù)需求而開(kāi)發(fā)的網(wǎng)關(guān)例子。
                                             TOP↑

二.一個(gè)有價(jià)值的建議――把視頻看作一個(gè)延伸層


  許多不同的無(wú)線(xiàn)設(shè)備正為把網(wǎng)站內(nèi)容發(fā)給移動(dòng)用戶(hù)這個(gè)有巨大潛力的市場(chǎng)而展開(kāi)競(jìng)爭(zhēng)。如果我們把這些無(wú)線(xiàn)設(shè)備按功能作一個(gè)條形分布圖,那么條的一端是:智能化、全功能的設(shè)備,比如膝上型電腦和PDA,如果提供有標(biāo)準(zhǔn)的因特網(wǎng)連接,它們都能以自己的方式呈現(xiàn)出網(wǎng)站的內(nèi)容。而條的另一端是啞終端,它們幾乎需要全部由內(nèi)建于網(wǎng)關(guān)的智能來(lái)呈現(xiàn)網(wǎng)站的內(nèi)容。WAP設(shè)備處在條的中間位置,它只能呈現(xiàn)一些由網(wǎng)關(guān)提供的內(nèi)容,但在設(shè)備內(nèi)能處理某種形式的HTML。

  在不久的將來(lái),象3G324M無(wú)線(xiàn)視頻手機(jī)(如圖1所示)那樣的啞終端,極具潛力占領(lǐng)最廣闊的市場(chǎng)。3G324M是由3G無(wú)線(xiàn)團(tuán)體開(kāi)發(fā)的標(biāo)準(zhǔn),它定義了和簡(jiǎn)單視頻手機(jī)的通信。在手機(jī)之間或手機(jī)與網(wǎng)關(guān)之間,全雙工的流承載著以下信息:以簡(jiǎn)單輪廓MPEG-4格式編碼的H.263視頻、AMR編碼的音頻和H.245控制信息,每個(gè)方向的所有這些信息用H.223標(biāo)準(zhǔn)復(fù)用成為單個(gè)流。對(duì)于這些流的進(jìn)一步傳送,可以由傳統(tǒng)2G設(shè)備提供的TDM電路來(lái)完成。
在很長(zhǎng)一段時(shí)間以來(lái),格言"網(wǎng)絡(luò)的智能會(huì)轉(zhuǎn)移到外圍設(shè)備上"很可能包含著真理。對(duì)于無(wú)線(xiàn)萬(wàn)維網(wǎng)應(yīng)用來(lái)說(shuō),一個(gè)緊湊、不貴又高度智能化的移動(dòng)設(shè)備,再加上一條連接到因特網(wǎng)的普通寬帶IP路由,就是最理想的方案了。然而,多年來(lái)現(xiàn)實(shí)已證明,有許多限制因素使得這種想法無(wú)法實(shí)現(xiàn)。目前的智能移動(dòng)設(shè)備笨重而又昂貴,而且使用現(xiàn)有的電池技術(shù)要存貯足夠的電力還有問(wèn)題。在使用怎樣的鍵盤(pán)和顯示終端的問(wèn)題上也有一個(gè)內(nèi)在的沖突:用大一點(diǎn)易于使用的呢,還是用小一點(diǎn)的便于攜帶呢?另外,傳統(tǒng)的蜂窩網(wǎng)絡(luò)是設(shè)計(jì)用來(lái)承載64kbps 的語(yǔ)音電路的,而不是高速因特網(wǎng)接入所要求的寬帶包。

  然而,H.263協(xié)議和硅半導(dǎo)體技術(shù)使得生產(chǎn)一個(gè)緊湊的、相當(dāng)便宜的視頻手機(jī)成為可能,并且這種手機(jī)在傳統(tǒng)的64kbps電路上工作得很好。用于下一代無(wú)線(xiàn)手機(jī)的3G324M標(biāo)準(zhǔn)可以作為一個(gè)"延伸層"(spanning layer)。"延伸層"是MIT的David Clark 使用的一個(gè)術(shù)語(yǔ),它描述的是一個(gè)既簡(jiǎn)單又可以廣泛使用的標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)允許相互競(jìng)爭(zhēng)的設(shè)備提供商和應(yīng)用開(kāi)發(fā)商大團(tuán)體能相互獨(dú)立地工作,卻又共同形成一個(gè)產(chǎn)業(yè)。3G324M標(biāo)準(zhǔn)可能允許無(wú)線(xiàn)業(yè)務(wù)提供商推出用于視頻呼叫的手機(jī),而對(duì)將來(lái)的應(yīng)用又沒(méi)有做出特別的規(guī)定,如萬(wàn)維網(wǎng)內(nèi)容的遞送。這樣,網(wǎng)關(guān)供應(yīng)商就可以推動(dòng)其它環(huán)境的應(yīng)用開(kāi)發(fā),以提供豐富的新業(yè)務(wù),比如到商業(yè)視頻會(huì)議設(shè)備的連接業(yè)務(wù)、視頻郵件業(yè)務(wù)、網(wǎng)站內(nèi)容遞送業(yè)務(wù)。3G324M無(wú)線(xiàn)視頻手機(jī)也要有比較好的配備才能處理一些極困難的網(wǎng)站內(nèi)容接收,也就是視頻和音頻流。

  如果是在經(jīng)濟(jì)高增長(zhǎng)時(shí)期,可以說(shuō)服無(wú)線(xiàn)業(yè)務(wù)提供商和他們的用戶(hù)去購(gòu)買(mǎi)已可用的3G設(shè)備。但事實(shí)上是目前兩者都為超預(yù)算所困擾。這就意味著,只要有可能業(yè)務(wù)提供商就會(huì)盡量使用2G設(shè)備。這可以作為最接近公共電話(huà)網(wǎng)的系統(tǒng)的一部分來(lái)實(shí)現(xiàn),并且仍然支持3G324M手機(jī)的使用。對(duì)大部分潛在的用戶(hù)來(lái)說(shuō),當(dāng)前他們不會(huì)選擇購(gòu)買(mǎi)一個(gè)昂貴的無(wú)線(xiàn)PDA,因?yàn)榱?xí)慣于蜂窩電話(huà)機(jī)是作為蜂窩業(yè)務(wù)的一部分免費(fèi)提供的。然而,如果無(wú)線(xiàn)運(yùn)營(yíng)商配置的是一種相當(dāng)便宜的視頻手機(jī),并讓用戶(hù)預(yù)交一定量的新業(yè)務(wù)費(fèi)用,就可以沿用這種商業(yè)模式了。網(wǎng)站內(nèi)容網(wǎng)關(guān)的配置可以隨著使用用戶(hù)的增加而加大,這樣可以免除業(yè)務(wù)提供商任何不必要的前期費(fèi)用。網(wǎng)關(guān)中為遞送網(wǎng)站內(nèi)容作準(zhǔn)備的智能設(shè)備越貴,在忙時(shí)就越要滿(mǎn)負(fù)荷使用,因?yàn)檫_(dá)到滿(mǎn)負(fù)荷使用是提供低成本效益比業(yè)務(wù)的關(guān)鍵。但是,即使是使用最頻繁的用戶(hù),他的智能手機(jī)大部分時(shí)間也處于空閑之中。因此業(yè)務(wù)提供商在剛開(kāi)展業(yè)務(wù)時(shí)會(huì)配置少數(shù)幾個(gè)智能設(shè)備,只有能達(dá)到滿(mǎn)負(fù)荷使用時(shí),才作進(jìn)一步的擴(kuò)容。



圖1 無(wú)線(xiàn)視頻手機(jī)

                                                                                     TOP↑

三.網(wǎng)關(guān)功能需求

  對(duì)于處在兩個(gè)規(guī)范網(wǎng)絡(luò)間的網(wǎng)關(guān),總的需求是很簡(jiǎn)單的:在所有層上匹配兩個(gè)網(wǎng)絡(luò)間的功能,處理兩個(gè)網(wǎng)絡(luò)間的任何轉(zhuǎn)換需求。所有在這里描述的功能要求也可以應(yīng)用到不是遵循3G324M標(biāo)準(zhǔn)的無(wú)線(xiàn)視頻手機(jī),任何的不同都可以通過(guò)網(wǎng)關(guān)的輕微調(diào)整來(lái)適應(yīng)。



圖2 3G324M-網(wǎng)站內(nèi)容遞送網(wǎng)關(guān)網(wǎng)絡(luò)拓樸

 3.1 物理層

  從無(wú)線(xiàn)側(cè)看來(lái),網(wǎng)關(guān)只是標(biāo)準(zhǔn)視頻呼叫中的一方。(如圖2所示)物理層很可能使用標(biāo)準(zhǔn)的T1或E1中繼連接到公網(wǎng)級(jí)電路交換機(jī)。假設(shè)每個(gè)視頻呼叫需要一個(gè)64kbps 的中繼通道(雖然也可使用多個(gè)通道)。無(wú)線(xiàn)側(cè)的呼叫建立會(huì)使用ISDN協(xié)議,這個(gè)協(xié)議支持多個(gè)通道的綁定。這個(gè)64kbps流的內(nèi)容是以下信息的組合:H.263視頻、AMR編碼的音頻、H.245協(xié)商消息。組成的方法是按照H.223多路復(fù)用。H.245協(xié)議用于起動(dòng)視頻和音頻流。

  在網(wǎng)關(guān)的因特網(wǎng)側(cè),標(biāo)準(zhǔn)的網(wǎng)站瀏覽通過(guò)以太網(wǎng)物理層來(lái)完成,使用HTTP/TCP/IP協(xié)議來(lái)訪問(wèn)網(wǎng)頁(yè)。內(nèi)容遞送網(wǎng)關(guān)是以面向因特網(wǎng)的瀏覽器的角色出現(xiàn)的。
為了能提供這一新業(yè)務(wù),不管是無(wú)線(xiàn)網(wǎng)還是因特網(wǎng),都不需要調(diào)整。只有網(wǎng)關(guān)自己和無(wú)線(xiàn)用戶(hù)才需要知道:這兩個(gè)網(wǎng)已經(jīng)接合起來(lái)了。

                                        TOP↑

 3.2 媒體流層

  給手機(jī)的視頻信號(hào)必須從當(dāng)前網(wǎng)頁(yè)的內(nèi)容生成。對(duì)于HTML或JPEG,可以形成一個(gè)靜態(tài)圖像,然后再轉(zhuǎn)換成簡(jiǎn)單輪廓MPEG-4視頻幀,并簡(jiǎn)單地重復(fù)這個(gè)幀就可以了。流化視頻需要從其它一些視頻格式實(shí)時(shí)轉(zhuǎn)換成簡(jiǎn)單輪廓MPEG-4。任何從無(wú)線(xiàn)視頻手機(jī)發(fā)來(lái)的視頻都會(huì)被簡(jiǎn)單丟棄。

  對(duì)于音頻,大部分的時(shí)間會(huì)產(chǎn)生AMR靜音信號(hào),然后發(fā)送到手機(jī)。當(dāng)接入的是流化音頻時(shí),可能需要先從別的音頻格式解碼,再編碼成AMR。從手機(jī)發(fā)來(lái)的音頻通常會(huì)被丟棄,但是也有例外,象:用于語(yǔ)音識(shí)別的音頻輸入、用于DTMF檢測(cè)的音頻輸入和某些H.245消息,它們用于組成典型的用戶(hù)給瀏覽器的輸入,就象電腦中的鼠標(biāo)和鍵盤(pán)。
                                        TOP↑

 3.3 應(yīng)用程序?qū)?a name="#33">

  在應(yīng)用程序?qū),從無(wú)線(xiàn)手機(jī)發(fā)起的呼叫建立狀態(tài)包括用ISDN得來(lái)的主叫標(biāo)識(shí)去:形成計(jì)費(fèi)話(huà)單、登錄到主頁(yè)、跳轉(zhuǎn)到書(shū)簽處和收發(fā)郵件業(yè)務(wù)――為用戶(hù)建立一系列的標(biāo)準(zhǔn)瀏覽器功能。有些附加的密碼輸入會(huì)用于額外的安全要求。連接一旦建立,以下各種鼠標(biāo)操作對(duì)任何應(yīng)用來(lái)說(shuō)都是需要的:點(diǎn)擊一個(gè)新的鏈接、顯示一個(gè)新的網(wǎng)頁(yè)、跳到大量排序數(shù)據(jù)的某部分。然而,由于無(wú)線(xiàn)視頻手機(jī)的限制,這些都會(huì)遇上特別難于解決的問(wèn)題。這些問(wèn)題會(huì)在本文的"特別的挑戰(zhàn)"一節(jié)進(jìn)行更詳細(xì)的討論。
                                        TOP↑

四.網(wǎng)關(guān)結(jié)構(gòu)

  圖3所示為網(wǎng)關(guān)重要組成的分解圖。網(wǎng)關(guān)機(jī)箱很可能是一個(gè)Compact PCI機(jī)箱,機(jī)箱中包含了作為網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)的所有組件。基本的視頻呼叫和瀏覽器應(yīng)用可以運(yùn)行在主處理器上,但T1或E1接口需要由附加模塊來(lái)支持。為了支持大量的端口,還需要附加的以太網(wǎng)接口和自定義的視頻處理模塊。T1/E1接口通過(guò)公共電話(huà)網(wǎng)接入無(wú)線(xiàn)交換中心,也可以直接接入到無(wú)線(xiàn)交換中心。以太網(wǎng)接口會(huì)通過(guò)標(biāo)準(zhǔn)IP路由器接入到因特網(wǎng)。

  圖3 強(qiáng)調(diào)的是3G324M網(wǎng)站內(nèi)容遞送網(wǎng)關(guān)的組成。它支持網(wǎng)絡(luò)管理功能和用戶(hù)管理功能,同時(shí)通過(guò)附加的鏈路處理計(jì)費(fèi)話(huà)單,這個(gè)附加鏈路很可能是這里沒(méi)畫(huà)出的另一個(gè)IP網(wǎng)。完成標(biāo)準(zhǔn)瀏覽器功能的模塊在圖3的最右邊,支持標(biāo)準(zhǔn)無(wú)線(xiàn)視頻呼叫的模塊在左邊。

  最粗的箭頭表示實(shí)時(shí)媒體流。稍小一點(diǎn)的箭頭表示控制消息和非實(shí)時(shí)媒體傳送。由于到手機(jī)的視頻流占用較窄的帶寬,音頻和視頻數(shù)據(jù)流可以做類(lèi)似的處理。對(duì)于一個(gè)有大量端口的大規(guī)模系統(tǒng),設(shè)計(jì)時(shí)應(yīng)該支持在以太網(wǎng)和T1/E1中繼間的實(shí)時(shí)媒體流,而不要讓它們通過(guò)主處理器或PCI總線(xiàn)。T1/E1中繼和以太網(wǎng)接口模塊可以合并,包括其中必須的視頻和音頻處理。或者在Compact PCI模塊之間用新的、高帶寬的交換結(jié)構(gòu)來(lái)處理實(shí)時(shí)數(shù)據(jù)流。


                                        TOP↑

  對(duì)于HTML網(wǎng)頁(yè),標(biāo)準(zhǔn)瀏覽器功能會(huì)建立一個(gè)類(lèi)似于PC瀏覽窗口的內(nèi)部圖象,然后由特定網(wǎng)關(guān)功能對(duì)圖像加工,形成一個(gè)適合于手機(jī)顯示的視頻流。網(wǎng)站中的其它靜態(tài)圖象,比如JPEG,不需要生成HTML網(wǎng)頁(yè)內(nèi)部圖象,而是能直接加工成視頻流。第三種形式的內(nèi)容及視頻剪輯,不會(huì)使用從靜態(tài)圖象到視頻流的加工過(guò)程,但需要從某種視頻格式(如MPEG-2)解碼,再編碼成為手機(jī)的簡(jiǎn)單輪廓MPEG-4視頻格式。

  處于圖3中間的部分組件代表一些本文下一節(jié)將會(huì)詳細(xì)討論的具有挑戰(zhàn)性的領(lǐng)域。對(duì)任何類(lèi)型的圖像都必須做一些視圖的編輯以補(bǔ)償由于轉(zhuǎn)換到簡(jiǎn)單輪廓MPEG-4所造成的分辯率損失。由于無(wú)線(xiàn)手機(jī)沒(méi)有全功能鍵盤(pán),所以用戶(hù)的文本字符串輸入需要做特別處理。為這些限制建立特別處理是提供的業(yè)務(wù)有沒(méi)有價(jià)值的關(guān)鍵,否則,可能由于業(yè)務(wù)的使用太麻煩,以至于推廣不開(kāi)來(lái)。

                                        TOP↑

五.特別的挑戰(zhàn)

  建立一個(gè)有用網(wǎng)關(guān)時(shí)最難解決的問(wèn)題是必須注重人類(lèi)工程學(xué)方面的設(shè)計(jì)。雖然方案選擇也可能是一個(gè)特別的技術(shù)挑戰(zhàn),但最隹方案的決定根本不是技術(shù)上的運(yùn)用,而問(wèn)題正好出現(xiàn)在易于表述的技術(shù)問(wèn)題上,例如:從網(wǎng)站送出的音頻可以達(dá)到CD般的質(zhì)量,但是送給手機(jī)的AMR編碼音頻只能滿(mǎn)足僅可聽(tīng)懂的話(huà)音質(zhì)量。大部分網(wǎng)頁(yè)都是設(shè)計(jì)用于個(gè)人電腦屏幕的分辯率(1024x768)。而視頻手機(jī)大部分都受限于H.263 QCIF的分辯率(176x144),一條線(xiàn)上的分辯率差距高達(dá)6倍。而且,設(shè)計(jì)時(shí)用戶(hù)和網(wǎng)站服務(wù)器交互使用的是鼠標(biāo)和全功能電腦鍵盤(pán),而無(wú)線(xiàn)手機(jī)只有一個(gè)非常受限的小鍵盤(pán)。

  一個(gè)有利的情況是:大部分網(wǎng)站的設(shè)計(jì)都慮到了大多數(shù)的用戶(hù)仍然使用撥號(hào)上網(wǎng),因此許多網(wǎng)站為有寬帶接入和無(wú)寬帶接入的用戶(hù)提供了并行的不同瀏覽途徑。撥號(hào)連接那有限的帶寬正好和無(wú)線(xiàn)視頻手機(jī)的收發(fā)帶寬具有可比性,因此,即使需要的信息表述和交互的方式相差很遠(yuǎn),無(wú)線(xiàn)用戶(hù)也可以選擇為撥號(hào)用戶(hù)設(shè)計(jì)的網(wǎng)頁(yè),以便有信息遞送時(shí)獲得和撥號(hào)用戶(hù)差不多的響應(yīng)時(shí)間。

  5.1 流化音頻


  流化音頻的應(yīng)用很少,并且在應(yīng)用中都處于不重要的地位,對(duì)信息的內(nèi)容來(lái)說(shuō),它不是實(shí)質(zhì)性的。對(duì)于一系列重要的小應(yīng)用,如:新聞和體育評(píng)論、以及季度財(cái)務(wù)報(bào)告大會(huì)的收聽(tīng),話(huà)音的傳送就很關(guān)鍵。在所有這些情況下,AMR編碼的話(huà)音質(zhì)量讓用戶(hù)聽(tīng)懂是足夠的了,但如果要用這種AMR通道來(lái)傳送CD質(zhì)量的音樂(lè),就會(huì)明顯顯得不足。即使電腦用戶(hù)下載音樂(lè)片段的速度要比實(shí)時(shí)慢得多,但他下載回來(lái)后仍可以聽(tīng)到高質(zhì)量的回放。在一個(gè)非智能的無(wú)線(xiàn)手機(jī)上無(wú)法提供這種能力。AMR編碼的音樂(lè)也有一定的價(jià)值,但它不是以?shī)蕵?lè)為目的的。把來(lái)自網(wǎng)站服務(wù)器的流化音頻轉(zhuǎn)換成手機(jī)需要的AMR編碼音頻是一個(gè)簡(jiǎn)單的技術(shù)問(wèn)題,但是需要大量的計(jì)算能力。明智的做法應(yīng)該是在一個(gè)附屬的模塊上用DSP資源來(lái)做這種運(yùn)算,而不要在網(wǎng)關(guān)的主處理器上做這種運(yùn)算。
                                        TOP↑

  5.2 流化視頻

  同樣地,流化的視頻現(xiàn)在也不常用。在使用它的大部分應(yīng)用中,視頻都是顯示在整個(gè)電腦屏幕內(nèi)的一個(gè)小窗口之中。這個(gè)小窗口的分辨率近似于手機(jī)上的完全QCIF顯示。必須用一種方法把視頻縮放到容納它的屏幕窗口一般大,但在這兩種收看環(huán)境中其它的收看感覺(jué)是大致一樣的。在某些情況下,也許可以通過(guò)和流服務(wù)器協(xié)商,讓服務(wù)器直接送本來(lái)手機(jī)需要的簡(jiǎn)單輪廓MPEG-4視頻流?墒,如果這種情況不可能,就需要配備高強(qiáng)度運(yùn)算的轉(zhuǎn)換功能,來(lái)把視頻從一種格式轉(zhuǎn)換成另一種格式。這種高強(qiáng)度運(yùn)算的轉(zhuǎn)換功能最好在一個(gè)附屬的模塊上用附加的硬件資源來(lái)完成,而不要由網(wǎng)關(guān)的主處理器來(lái)完成。
                                        TOP↑

  5.3 圖像的視圖控制

  所有網(wǎng)頁(yè)的原組件──JPEG、HTML或其它形式的組件── 一幅個(gè)人電腦屏幕上的完整圖像,要顯示在手機(jī)的小屏幕上,對(duì)大部分普通應(yīng)用來(lái)說(shuō)這個(gè)小屏幕的分辨率都是不夠的。適當(dāng)剪裁應(yīng)用程序的顯示介面,以適應(yīng)小屏幕的顯示,會(huì)得到很好的使用效果。我們的目標(biāo)是在網(wǎng)關(guān)支持視頻手機(jī)的這些獨(dú)特顯示,使得手機(jī)能訪問(wèn)普通的網(wǎng)站?梢猿晒(shí)現(xiàn)這個(gè)目標(biāo)的兩種技術(shù)是:
  ■ 通過(guò)屏幕的局部視圖進(jìn)行用戶(hù)輸入的控制;
  ■ 用"動(dòng)"來(lái)補(bǔ)嘗分辨率的低下──使用附加于視頻流中的連續(xù)幀。

  縮放和取景窗是廣泛使用的視頻控制技術(shù),這些技術(shù)也適用于這里介紹的方案。各級(jí)縮放都只有一個(gè)方向的控制(只有放大或只有縮小)不會(huì)有明顯的麻煩,只要三級(jí)的縮放就能達(dá)到個(gè)人電腦全屏的分辨率(QCIF x 8=1408 x 1152),只有用到四級(jí)以上的縮放,才需要同時(shí)為每級(jí)提供放大和縮小兩個(gè)方向的控制。在普通瀏覽操作中,需要通過(guò)鼠標(biāo)來(lái)控制光標(biāo)的移動(dòng)。在一個(gè)縮放和取景窗的系統(tǒng)中,光標(biāo)控制(上、下、左、右四個(gè)鍵)同時(shí)也作取景窗控制用。畫(huà)面縮放后光標(biāo)會(huì)保持在視窗的中央,移動(dòng)窗口就可以看到圖像的其它內(nèi)容,直到整幅圖像的邊為止。所以,一個(gè)標(biāo)準(zhǔn)的操作過(guò)程是這樣的:一個(gè)新的HTML頁(yè)面開(kāi)始會(huì)以全屏的方式顯示,中間有光標(biāo)用于放大,用戶(hù)可以把光標(biāo)移動(dòng)到自己感興趣的內(nèi)容上,然后按下放大控制鍵。這一操作過(guò)程可以根據(jù)需要一直下去,直到能清晰地看清要看的內(nèi)容。特別需要注意的是,在給出一個(gè)文本輸入框時(shí),取景窗要放置在輸入光標(biāo)位置的中間,而不是鼠標(biāo)光標(biāo)位置的中間。直接的取景窗控制也是允許的──上、下、左、右控制──類(lèi)似于普通個(gè)人電腦屏幕上窗口邊或底部的滑動(dòng)條。

  視頻中的幀流允許用戶(hù)控制的取景選擇。一旦達(dá)到想要的縮放級(jí)別,自動(dòng)掃描方式會(huì)停下來(lái),并以這個(gè)縮放級(jí)顯示整個(gè)頁(yè)面,不再需要用戶(hù)的干預(yù)。對(duì)于英文內(nèi)容的頁(yè)面,掃描會(huì)從左到右,從上到下的進(jìn)行。如果能控制在每個(gè)方向上的掃描速度會(huì)很有用,但從另一方面看,增加額外的控制又是很麻煩的。也許以一個(gè)預(yù)設(shè)的掃描速度來(lái)搜索整個(gè)頁(yè)面,而以另一個(gè)預(yù)設(shè)的較慢速度由上到下移動(dòng)用于閱讀,會(huì)乎合最普遍的要求。

                                        TOP↑

  5.4 用戶(hù)輸入

  和圖像顯示相比,用戶(hù)輸入甚至是一個(gè)更大的挑戰(zhàn)。無(wú)線(xiàn)手機(jī)的小鍵盤(pán)和全功能電腦鍵盤(pán)及鼠標(biāo)相比實(shí)在受到太多的限制。手機(jī)擊鍵可以轉(zhuǎn)換成音頻流中的音頻信號(hào),比如DTMF信號(hào)。但由于DTMF信號(hào)具有持續(xù)時(shí)間短和占用頻帶窄的特點(diǎn),造成AMR音頻編碼不能可靠地轉(zhuǎn)換這種信號(hào)。H.245協(xié)商通道可以用于傳送象擊鍵那樣的控制信息,但是由于沒(méi)有相關(guān)的標(biāo)準(zhǔn),需要在手機(jī)上做特殊的處理。使用手機(jī)最通常的輸入方式是語(yǔ)音輸入(沒(méi)有音頻信號(hào)和H.245消息),這個(gè)時(shí)候就要用語(yǔ)音識(shí)別了。

  這些年來(lái)語(yǔ)音識(shí)別的準(zhǔn)確率已有了很大提高,但是象AMR那樣有限的帶寬通道,以及一般移動(dòng)呼叫都有比較大的背景噪聲,都會(huì)造成識(shí)別率的嚴(yán)重下降。這就要求對(duì)詞匯表做一些處理,最好使用盡量少的詞,表中的詞沒(méi)有二義,發(fā)音不能相同。為了提高識(shí)別的準(zhǔn)確性,甚至要存貯用戶(hù)的特殊發(fā)音特征。最頻繁使用的鼠標(biāo)控制和視圖控制輸入最好單獨(dú)形成一個(gè)子詞匯表,大約有10個(gè)詞:上、下、左、右、停、點(diǎn)擊、放大、縮小、掃描、閱讀。剩下的主要是文本輸入,可能需要幾個(gè)子詞匯表。用于輸入數(shù)字的子詞匯表自然也大約是10個(gè)詞。發(fā)音問(wèn)題顯然也是一個(gè)很大的挑戰(zhàn),因?yàn)楹芏嘧帜傅慕M合發(fā)音相象。有一些可能的辦法,包括:用說(shuō)出數(shù)字來(lái)代表電話(huà)小鍵盤(pán)上的字母;或者說(shuō)出組成單詞的每一個(gè)字母來(lái)表示該詞(Alpha、Bravo、Charlie、….)。另外,還要包含各種標(biāo)點(diǎn)符號(hào)。用于糾錯(cuò)的編輯命令也是必須的。對(duì)用戶(hù)來(lái)說(shuō)所有這些文本輸入技術(shù)都意味著一種負(fù)擔(dān)。能夠僅由鼠標(biāo)來(lái)操控的網(wǎng)上應(yīng)用似乎是易于訪問(wèn)的,但是這樣的應(yīng)用如果需要文本輸入就太難解決了。



                                             TOP↑


page1page2