近日安徽發(fā)布《智能語(yǔ)音產(chǎn)業(yè)發(fā)展規(guī)劃》,把合肥科大訊飛當(dāng)做語(yǔ)音產(chǎn)業(yè)領(lǐng)頭羊,重點(diǎn)扶植應(yīng)用于智能家居及硬件。分析評(píng)論稱(chēng)目前智能語(yǔ)音識(shí)別率低,注定難以大規(guī)模商用;政策扶植下一味押寶智能硬件,對(duì)于科大訊飛而言是一條不歸路。
互聯(lián)網(wǎng)技術(shù)正在深度融入人們的工作與生活,從一開(kāi)始的電腦、手機(jī)、平板逐步被智能化以后,到現(xiàn)在幾乎所有的家電設(shè)備都面臨著一場(chǎng)大規(guī)模的智能化改造。因此,一個(gè)被業(yè)內(nèi)稱(chēng)為萬(wàn)億級(jí)的智能家居市場(chǎng)正處在爆發(fā)的前夜,眾多企業(yè)都在以獨(dú)特的切入點(diǎn)努力打開(kāi)智能家居的突破口,以便盡可能多的切下這個(gè)巨大市場(chǎng)的其中一塊蛋糕。
作為國(guó)內(nèi)唯一的語(yǔ)音技術(shù)上市公司,科大訊飛近半年來(lái)在智能家居方面頻頻布局,不但與TCL、長(zhǎng)虹、海爾、海信、康佳、創(chuàng)維等智能電視廠(chǎng)商合作推廣電視語(yǔ)音控制,而且還推出自主研發(fā)的訊飛智能音箱,通過(guò)將此前多年積累的智能語(yǔ)音技術(shù)植入進(jìn)家電設(shè)備中,讓家電控制更加智能化、更加人性化。
熟悉科大訊飛這家公司的圈里人都非常清楚,這是一家在跌宕起伏中成長(zhǎng)的公司。手握技術(shù),卻找不到方向,這是對(duì)科大訊飛十五年成長(zhǎng)軌跡的最貼切描述。十幾年前,科大訊飛推出的話(huà)王98和暢言2000兩款產(chǎn)品試水后就宣布失敗。
十幾年后,科大訊飛再次將目標(biāo)鎖定個(gè)人消費(fèi)市場(chǎng),推出智能音箱等智能家居產(chǎn)品。與傳統(tǒng)智能音箱不同的是,科大訊飛的智能音箱支持語(yǔ)音操控和語(yǔ)音識(shí)別。除智能音箱外,科大訊飛還嘗試用語(yǔ)音操控,將所有的智能家居設(shè)備連接在一起。不得不說(shuō),科大訊飛的夢(mèng)很好,只是這個(gè)夢(mèng)很難圓。
從表面來(lái)看,支持語(yǔ)音操控的智能家居有很強(qiáng)的吸引力。事實(shí)上,語(yǔ)音操控不過(guò)是一個(gè)操作方式,與手機(jī)遠(yuǎn)程操控相比并沒(méi)有本質(zhì)的區(qū)別。對(duì)于用戶(hù)而言,為智能家居增加一種操控方式,意義不大。更何況,這一時(shí)髦的語(yǔ)音操控模式需要用戶(hù)買(mǎi)單,代價(jià)有些高。
目前,訊飛的主要產(chǎn)品中體現(xiàn)了兩種重要的語(yǔ)音技術(shù),一是語(yǔ)音合成技術(shù),一是語(yǔ)音識(shí)別技術(shù);前者已經(jīng)有非常成熟的技術(shù),現(xiàn)如今想要讓機(jī)器人講一口流利的鳥(niǎo)語(yǔ),或者發(fā)出林志玲式的“加油”嗲聲已經(jīng)非常容易了,但語(yǔ)音識(shí)別技術(shù)發(fā)展則相對(duì)緩慢,而正是在這項(xiàng)技術(shù)上的突破和創(chuàng)新,才成就了訊飛中文語(yǔ)音領(lǐng)導(dǎo)者的地位,他們推出的訊飛輸入法雖然比不上搜狗輸入法流行,但其中采用的語(yǔ)音識(shí)別技術(shù)卻深受用戶(hù)好評(píng),支持普通話(huà)、英語(yǔ)、四川話(huà)、河南話(huà)、東北話(huà)、天津話(huà)、山東話(huà)…..行話(huà)、黑話(huà)等等,目前用戶(hù)達(dá)到1億,不僅成為Android手機(jī)的標(biāo)配,而且成功登陸App store,獨(dú)享支持語(yǔ)音輸入法第三方軟件的榮耀,而且是那種無(wú)需越獄即可安裝的正式編制。
或許,正是自信于自己在語(yǔ)音識(shí)別技術(shù)上的優(yōu)勢(shì),訊飛才敢押寶于智能家居,也適當(dāng)?shù)啬芙o巨頭們灌輸了一些利己思想:“語(yǔ)音才是未來(lái)智能家居的交互模式”,但如前文所述,智能語(yǔ)音作為整個(gè)智能家居中的一種配套技術(shù),沒(méi)有辦法,也沒(méi)有能力推動(dòng)整個(gè)行業(yè)大踏步前進(jìn),所以,訊飛選擇以“語(yǔ)音”切入智能家居領(lǐng)域并不是一個(gè)非常明智的選擇。
不可否認(rèn),訊飛輸入法能支持各地方言證明了語(yǔ)音識(shí)別技術(shù)還有著非常大的發(fā)展?jié)摿,但這也僅僅是“輸入法”的一個(gè)應(yīng)用。事實(shí)上,任何的機(jī)器識(shí)別技術(shù)無(wú)不是建立在海量的數(shù)據(jù)、高速的運(yùn)算基礎(chǔ)上的,語(yǔ)音識(shí)別的體驗(yàn)同樣要取決于語(yǔ)音數(shù)據(jù)存儲(chǔ)的規(guī)模、以及后臺(tái)處理的運(yùn)行能力。不巧的是,智能家居領(lǐng)域需要的數(shù)據(jù)量遠(yuǎn)非一個(gè)輸入法所能相比的,這種龐大的數(shù)據(jù)也不是工程師能在實(shí)驗(yàn)室里編碼出來(lái)的,而是要把收集工具嵌入到消費(fèi)者的日常生活中,這也就注定了語(yǔ)音識(shí)別技術(shù)不可能獨(dú)立發(fā)展,而是要背靠類(lèi)似蘋(píng)果、Google、三星這樣的平臺(tái)企業(yè),只有這些巨頭有機(jī)會(huì)無(wú)時(shí)無(wú)刻地收集用戶(hù)數(shù)據(jù),從而建立起巨大而完善的數(shù)據(jù)庫(kù)。遺憾的是,即便有數(shù)億只iPhone滲透于全球消費(fèi)者、Google的衛(wèi)星也每天在太空中照照片、瞎轉(zhuǎn)悠,但蘋(píng)果siri和Google now等語(yǔ)音助手依舊不能成為消費(fèi)者的貼心秘書(shū),一位美國(guó)朋友曾分別問(wèn)過(guò)Siri和Google now,哪里有便宜的雞蛋?蘋(píng)果的回答是街區(qū)盡頭的飯館里,而Google則把箭頭指向了跨州的一個(gè)著名養(yǎng)雞場(chǎng),但家里的保姆卻能告訴他:最近的沃爾瑪超市,雞蛋正在搞促銷(xiāo)!
沒(méi)有海量的數(shù)據(jù)存儲(chǔ),語(yǔ)音識(shí)別是不可能實(shí)現(xiàn)精準(zhǔn)判斷的,事實(shí)上,在一些流傳出的智能家居產(chǎn)品測(cè)試中,消費(fèi)者的體驗(yàn)也非常糟糕,如果貿(mào)然采用不成熟的家居系統(tǒng),可能會(huì)出現(xiàn)如下情況: 河北的丈夫回家之后,能順利地通過(guò)語(yǔ)言開(kāi)燈,而來(lái)自?xún)?nèi)蒙的妻子,操著一口東北方言,嗓子喊啞了才能把燈打開(kāi),而來(lái)自廣東的情人,則沒(méi)能把燈打開(kāi),當(dāng)然,鑒于她和男主人的主要業(yè)務(wù),可能也不需要開(kāi)燈了。
毫無(wú)疑問(wèn),智能家居黃金產(chǎn)業(yè)鏈中,電子設(shè)備的人機(jī)交互成為一個(gè)重要門(mén)檻,它很大程度上決定了智能家居產(chǎn)品是否具有方便、易用、智能的用戶(hù)體驗(yàn)。智能家居的人機(jī)交互包括了指令及內(nèi)容的輸入與輸出,內(nèi)容輸出相對(duì)比較簡(jiǎn)單,主要是顯示屏輸出及語(yǔ)音輸出。
而家電的指令輸入有按鈕、遙控、鍵盤(pán)、觸摸屏、語(yǔ)音、體感等多種方式,目前主流的控制方式依然是按鈕及遙控器,比如電視、空調(diào)、冰箱、燈光等等。隨著智能電視的爆發(fā)性增長(zhǎng),類(lèi)似鍵盤(pán)、飛鼠及體感攝像頭等新型控制設(shè)備也在逐步流行,以適應(yīng)智能電視集觀看、運(yùn)動(dòng)娛樂(lè)及購(gòu)物等多種功能。
但是從人們期待的智能生活看來(lái),目前的物理控制方式還是顯得累贅?lè)爆,人們希望晚上回家,燈光自?dòng)打開(kāi),音響里自動(dòng)播放喜歡的音樂(lè),電視可以語(yǔ)音控制打開(kāi)需要的頻道,早上起床鬧鐘響起自動(dòng)語(yǔ)音播報(bào)今天天氣狀況?傊译娫O(shè)備的控制與內(nèi)容輸出盡可能簡(jiǎn)單自然,真正解放人的雙手。
可是,愿望總是美好的,現(xiàn)實(shí)總是殘酷的。智能語(yǔ)音技術(shù)盡管近幾年來(lái)取得了突飛猛進(jìn)的發(fā)展,但是離人們期待的隨心所欲的控制家里的一切還有相當(dāng)遠(yuǎn)的距離。其中,語(yǔ)音識(shí)別率低是最大的障礙。即使是依靠口音相對(duì)統(tǒng)一的英語(yǔ)輸入為主的蘋(píng)果siri,其識(shí)別率也很難達(dá)到90%以上的程度。
對(duì)于中國(guó)這樣有著56個(gè)民族,有幾百上千種方言的人口大國(guó),各種口音、腔調(diào)混雜其中,即使是普通話(huà)各個(gè)地方也有巨大的口音差異。因此,基于漢語(yǔ)為基礎(chǔ)的語(yǔ)音識(shí)別技術(shù)將面臨比英語(yǔ)更加巨大的技術(shù)挑戰(zhàn),語(yǔ)音識(shí)別準(zhǔn)確率會(huì)因人而異而變得非常明顯。識(shí)別率的低下將會(huì)導(dǎo)致語(yǔ)音控制技術(shù)在智能家居應(yīng)用中用戶(hù)體驗(yàn)難以達(dá)到用戶(hù)預(yù)期,甚至成為一種可有可無(wú)的擺設(shè)。
智能語(yǔ)音技術(shù)除了需要提高用戶(hù)語(yǔ)音輸入的識(shí)別準(zhǔn)確率,還需要提高語(yǔ)義理解能力。即使是蘋(píng)果siri、谷歌Now這樣世界級(jí)的語(yǔ)音助手工具,其輸出能力還處在十分初級(jí)的狀態(tài),以致很難黏住用戶(hù)。調(diào)查數(shù)據(jù)顯示,Siri可以理解83%的問(wèn)題,但回答正確率只有62%。
總之,無(wú)論是國(guó)外科技巨頭,還是國(guó)內(nèi)智能語(yǔ)音領(lǐng)域的先鋒企業(yè),要想真正讓智能語(yǔ)音技術(shù)進(jìn)入千家萬(wàn)戶(hù)融入人們的生活,真正為人們所用,那么必然離不開(kāi)識(shí)別技術(shù)的提高及后端龐大的語(yǔ)音知識(shí)庫(kù),目前階段將智能語(yǔ)音技術(shù)稱(chēng)為入口還為時(shí)太早。
關(guān)于一覽 | 聯(lián)系我們 | 用戶(hù)反饋
深圳市一覽網(wǎng)絡(luò)股份有限公司 版權(quán)所有 ©2006-2025 粵ICP備08106584號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:粵B2-20070017