在今天看見明天
熱門: 房價 遺產稅 fed 00919 美元

聲音革命 P.66

聲音革命 P.66

黃炎松目前是富迪科技(Fortemadia)執行長,從事聲音晶片的研發與銷售;他在矽谷創辦專攻EDA(設計自動化)的益華電腦、PiE Quickturn Systems等公司,皆於那斯達克上市,之後回台灣成立思源科技,有矽谷「EDA教父」的稱號

語音輸入將是人機互動技術的一場革命。過去的人機互動以機器為主,人要走到機器跟前,而隨著3G和移動時代的到來,人機互動將是以人為本,是機器跟著人走,以語音介面解放雙手、開啟眾多智能服務是未來產業的發展趨勢。 語音是人與人之間最自然的溝通方式,透過語音,人們無須借助額外的工具便可以彼此交換各種資訊。雖然我們從眼睛所接受到的刺激,比從耳朵所接受到的要來得多,但是不可否認的,要與他人進行溝通,使用語音絕對比只用眼睛更有效率。 近幾十年來,由於資訊科技的蓬勃發展,在日常生活中電腦幾乎已經成為不可或缺的一部分。 為了讓人類也能藉由語音對電腦下指令、向電腦詢問問題,甚至讓電腦能自然地與人們交談,在各國學者們不斷地努力下,早已開啟了語音處理的研究領域,期望早日實現人機自然交談的夢想。 雖然,這個夢想還沒有全然實現,但是,人類對於聲音的需求,正在急起直追。其中,麥克風的品質,更是影響語音輸入的關鍵。語音通訊的應用一路延伸發展,從最基本的有線電話、無線電話、手機行動通訊、汽車通訊,以及近來持續發燒的網路電話(VoIP),都是這場聲音革命的主要戰場。 大家一定都有這些經驗。你在戶外接到一通電話,但是馬路旁邊呼嘯而過的汽車,讓對方根本聽不清楚你的聲音,就算你拉高嗓門,結果只有讓自己氣得半死。在一場跨國電話會議上,當你在家裡跟國外的同仁連線時,旁邊突然傳來的小孩哭鬧聲,或是其他噪音,讓大家嚇了一跳,也讓自己尷尬萬分。 但是,這些噪音是可以克服的。目前,我們正在研發改善語音處理技術的產品,這種小型陣列麥克風(Small Array Microphone, SAM)和先進的數位訊號處理器(DSP),可以讓通話完全免除回聲和噪音干擾。SAM形成的波束技術,能精確地對準說話人的聲音與方向,藉以抑制環境中的噪音與干擾。 凡是帶有麥克風的設備,特別是移動中的環境,SAM都能夠使用。因為在移動的環境中,機器跟著人跑,噪音不可控制,要實現清晰的通訊,一定要把噪音壓下來。 像去年藍芽晶片的價格快速滑落,因而帶動藍芽耳機的銷售量。像我最近看到一款產品,設計一個可配掛在身上,採用SAM技術的智慧型通話器,這項產品基本上就是藍芽耳機加上擴音器。儘管看似簡單,但既要用作耳機,又要用作擴音器,並且在如此小的空間內要消除回聲,以及高速移動環境下的噪音,這其中涉及到很多技術難題,一個效能高的DSP是關鍵。 藍芽耳機之外,我們也看到客製化手機對於這種技術的需求。 大家都知道電信市場競爭越來越激烈,電信營運商為了提高每用戶平均收入(ARPU),紛紛推出多種加值服務。但是,光有這些軟體的加值服務還不夠,必須得有硬體手機的配合,才能讓使用者願意採用,因此,客製化手機成為電信營運商做到差異化,增加營收的好方法。 最近在美國,定位服務(Location-Based Service)是手機上最新的應用,也被許多市調公司認為,這服務是未來手機上,使用者最期待的三大項目之一。過去,使用者要定位,知道自己在哪裡時,多是以現有的GPS(全球衛星定位系統),但其實手機的基地台也可以定位用,Google(谷歌)、Yahoo!(雅虎)等入口網站業者也推出相關服務,使用者只要輸入地址或是地標,就可以知道位置與方向。 我認為,定位服務要更好用,語音輸入是必然的趨勢。因此,語音辨識系統要能夠準確地辨別使用者說出的地址或是地標,一個高品質的麥克風與迴音消除技術,就成為客製化手機裡必備的功能。這塊市場,未來需求相當大。同樣地,我在現有的車用GPS市場上,也看到高品質的語音需求。 未來兩年GPS前景仍佳,加上中國大陸舉辦北京奧運,計畫推動「每輛計程車一部GPS裝置」運動,同時,出席奧運活動的來賓,配發一部GPS,這些都可望帶動亞太區GPS銷售量。 台灣製造的GPS PDA(個人數位助理器)及GPS手機產值規模,去年已站上五百億元大關,儼然成為二十一世紀的新興產業。至於GPS手機市場規模,預估將從今年的一千五百萬至二千萬支,成長到二○一○年的一億六千萬至一億八千萬支。 除此之外,許多電信營運商也看好老人市場的潛力,欲開發適合他們使用的客製化手機,這現象在老年人口龐大的日本市場,甚為明顯。 最近,日本手機公司富士通(Fujitsu)幫DoCoMo設計的一款手機,就採用我們的SAM技術。 這款大螢幕、自動語音操作的手機,在日本銷售非常好,就是因為可消除雜音、以及放緩對方說話速度等功能,讓許多年紀大、聲音微弱的長者得以輕鬆地使用。 另外,VoIP的興起,對於高品質語音的需求,也有推波助瀾之效。根據統計,二○一○年以後,全球三分之二人口都可以使用無線連結,新一代通訊技術WiMAX的普及,讓VoIP不再只是辦公室裡的專利,走到哪裡,你就可以講到哪裡。雖然,免費電話對於既有電信營運商是很大的衝擊,但是,手機內建WiMAX、3G、GPS、FM廣播這種多工模式(Multi-Modal)的趨勢,已經儼然成形。 手機市場外,汽車裡與影音設備結合的電話系統、筆記型電腦上的麥克風,以及醫療用的高畫質對講機等,這些都是可能發生語音革命的市場。最近英特爾(Intel)、三星(Samsung)與雷曼兄弟(Lehman Brothers)參與我們的現金增資,分別就是看好電腦、手機與電信市場。 語音技術的演進,大家可千萬不要輕忽。

延伸閱讀

退休金要存1431萬才夠?專家傳授1招:退休後無腦月領5萬,加上勞保勞退「本金根本不用1千萬」

2024-03-03

新制勞退分紅最新績效!勞退基金前2月收益率4.32%、勞工帳上多1.38萬...勞退帳戶餘額怎麼查?

2024-04-01

存股50張00929...股價一路漲16→20元,重新加碼的3個理由!高股息+勞保退休金,月領4萬簡單過生活

2024-04-12

勞退自提他專戶一口氣入帳38萬!勞保局最新統計,「這群人」超狠自提率近5成,自提有什麼好處?

2024-04-15

勞工退休金VS勞保老年給付,有什麼不一樣?拆解勞退新制的計算方式:簡單1招,最大化自己的退休金

2024-04-08