【
印聯(lián)傳媒資訊】10月18日,錘子新機(jī)發(fā)布會(huì)上的語(yǔ)音識(shí)別技術(shù)效果實(shí)在驚人,以至于羅永浩的一段即興發(fā)揮被準(zhǔn)確轉(zhuǎn)化成文字后,現(xiàn)場(chǎng)直接的歡呼聲不亞于爆炸場(chǎng)面。甚至當(dāng)天新浪科技發(fā)布的另一篇科大訊飛董事長(zhǎng)劉慶峰的演講,被錘粉們刷了評(píng)論區(qū)。
科大訊飛胡郁
在那場(chǎng)演講里,劉慶峰談及了人工智能技術(shù)在未來(lái)有多么廣闊的場(chǎng)景,它將會(huì)和水電一樣,成為未來(lái)的基礎(chǔ)設(shè)施。但實(shí)際上,劉慶峰當(dāng)天出席的“世界人工智能大會(huì)”,科大訊飛的輪值總裁胡郁也在,新浪科技對(duì)他進(jìn)行了專訪。
相比百度,阿里等公司,胡郁認(rèn)為科大訊飛的“互聯(lián)網(wǎng)”味道要稍微淡一些。他說(shuō)中國(guó)的產(chǎn)業(yè)和媒體對(duì)人工智能的關(guān)注還是太實(shí)用,太娛樂(lè)。真正的創(chuàng)新是從理論出發(fā),從哲學(xué)角度發(fā)展出來(lái)的,我們對(duì)科技的本質(zhì)關(guān)注太少。
胡郁有此結(jié)論,和他另一個(gè)身份:科大訊飛研究院院長(zhǎng)離不開(kāi)。而從技術(shù)的理論出發(fā),再循序漸進(jìn)地回歸到記者的問(wèn)題上,也是他于其他采訪對(duì)象截然不同的特點(diǎn)。在他的規(guī)劃里,科大訊飛的戰(zhàn)略核心是用語(yǔ)音解決即將到來(lái)的物聯(lián)網(wǎng)時(shí)代里的人機(jī)交互,如此才能用人工智能發(fā)揮出更大的價(jià)值,其中“臟活累活”也必不可少。在他看來(lái),而無(wú)論時(shí)代如何變化,中國(guó)需要更多“能爬山的公司”。
想和美國(guó)比創(chuàng)新,中國(guó)還需要多談?wù)務(wù)軐W(xué)
可以透露一下語(yǔ)音市場(chǎng)或者智能家居市場(chǎng),科大訊飛的市場(chǎng)份額嗎?
胡郁:在手機(jī)市場(chǎng),問(wèn)題不在市場(chǎng)份額。問(wèn)題是這些東西沒(méi)人用,它的比例很低。iPhone里面,Siri的使用比例不會(huì)超過(guò)10%。這才是限制了我們大小的因素。
其實(shí)在實(shí)際情況下,我們離真正的物聯(lián)網(wǎng)時(shí)代里,語(yǔ)音交互的大爆發(fā),還差得很遠(yuǎn)。因?yàn)樵谖锫?lián)網(wǎng)時(shí)代,使用頻度會(huì)增高,使用的場(chǎng)景也非常多。家里面不可能只有手機(jī)能語(yǔ)音交互,任何地方都可以用自然便捷的方式來(lái)交互,想想看,這個(gè)使用次數(shù)。
主要是它在生活中所占的時(shí)間和比例會(huì)大大增加,這樣就會(huì)帶來(lái)很大的機(jī)會(huì)。所以我認(rèn)為我們現(xiàn)在看到的只是未來(lái)的百分之一到千分之一。
我相信再過(guò)五年左右的時(shí)間,語(yǔ)音交互的次數(shù)會(huì)從現(xiàn)在的幾十億次,變成幾千億次,甚至更多。這樣語(yǔ)音市場(chǎng)會(huì)更大,而我們?nèi)送ㄟ^(guò)語(yǔ)音方式和機(jī)器進(jìn)行交流和接觸的時(shí)間,會(huì)大大增加。這也意味著它的商業(yè)價(jià)值會(huì)大大增加。
中國(guó)在人工智能領(lǐng)域的情況怎么樣?
胡郁:相比于傳統(tǒng)的高新技術(shù),中國(guó)是有優(yōu)勢(shì)的。
第一個(gè)是經(jīng)過(guò)這么多年核心技術(shù)的發(fā)展,特別是中國(guó)863計(jì)劃以后,大家會(huì)注意到,在這一次的人工智能浪潮中,國(guó)內(nèi)的企業(yè)和國(guó)外企業(yè)相比一點(diǎn)沒(méi)有落后。如果說(shuō),在5、60年代和7、80年代那兩次(人工智能發(fā)展期),中國(guó)企業(yè)還沒(méi)有辦法和外國(guó)企業(yè)在技術(shù)上相比的話,那在這次(發(fā)展浪潮里),我們完全走在了前面。
第二個(gè)方面是在于,任何機(jī)器的交互離不開(kāi)產(chǎn)業(yè)環(huán)境和商業(yè)生態(tài)。這個(gè)產(chǎn)業(yè)環(huán)境和商業(yè)生態(tài),在7、80年代之前是什么?是電子產(chǎn)品。
大家都知道,中國(guó)的電子產(chǎn)品在7、80年代才剛剛起步,完全不具備在全球市場(chǎng)競(jìng)爭(zhēng)的能力。但是在現(xiàn)在,我們的依賴的是什么產(chǎn)品?是智能手機(jī),是互聯(lián)網(wǎng)產(chǎn)品和移動(dòng)互聯(lián)網(wǎng)產(chǎn)品。而在這方面,整個(gè)中國(guó)不僅是從事語(yǔ)音技術(shù)的公司對(duì)此有依賴,相關(guān)的商業(yè)公司也是,比如網(wǎng)上購(gòu)票,還有各種的O2O。
作為一種連接型的技術(shù),把人和機(jī)器連接在一起之后,語(yǔ)音技術(shù)如果想在物聯(lián)網(wǎng)里面占領(lǐng)很多市場(chǎng),就必須和這些后臺(tái)的服務(wù)連接起來(lái)。所以說(shuō)從整個(gè)商業(yè)和技術(shù)環(huán)境上來(lái)講,中國(guó)現(xiàn)在應(yīng)該說(shuō)也是很好,因?yàn)槲覀兊幕ヂ?lián)網(wǎng)公司和美國(guó)方面來(lái)講,已經(jīng)是一個(gè)同臺(tái)競(jìng)技,甚至均分天下的態(tài)勢(shì)。
在這點(diǎn)上,我覺(jué)得這為我們?cè)趯?lái),在物聯(lián)網(wǎng)時(shí)代用語(yǔ)音交互作為人機(jī)交互的主要手段,并引發(fā)相應(yīng)的商業(yè)模式,提供了很好的基礎(chǔ)。
而第三點(diǎn),大家會(huì)注意到,無(wú)論是什么操作系統(tǒng),PC的也好,手機(jī)的也好,雖然這些操作系統(tǒng)可能是美國(guó)的公司做的,比如微軟,谷歌,但是要注意到,輸入法這個(gè)部分,都是中國(guó)公司占主導(dǎo)地位。
為什么?因?yàn)樗驼Z(yǔ)言有關(guān)。一個(gè)簡(jiǎn)單的鍵盤輸入法,就因?yàn)檎Z(yǔ)言之間的差異導(dǎo)致這么大的差異。那么大家可以想象一下,一個(gè)包括了語(yǔ)音識(shí)別、語(yǔ)音合成、自然語(yǔ)言理解的語(yǔ)音系統(tǒng),語(yǔ)言之間的壁壘會(huì)有多高。中國(guó)公司在這方面會(huì)完全具有優(yōu)勢(shì)。
所以說(shuō)從這三個(gè)方面來(lái)講,我們?cè)趯?lái)的物聯(lián)網(wǎng)時(shí)代里面,無(wú)論是從技術(shù)本身,還是從語(yǔ)言的差異化本身,還是從商業(yè)的生態(tài)和環(huán)境本身,我們現(xiàn)在都和國(guó)外公司完全處于同一個(gè)水平。所以在這一波浪潮中,我們有信心中國(guó)會(huì)成長(zhǎng)出一批國(guó)際水準(zhǔn)的公司出來(lái)。
除去這些優(yōu)勢(shì),仍然有很多聲音認(rèn)為中國(guó)在創(chuàng)新型研究方面落后于美國(guó),您怎么看待這個(gè)問(wèn)題?
胡郁:不可否認(rèn),我們對(duì)人工智能的了解,不要說(shuō)產(chǎn)業(yè)界,就是媒體,其實(shí)對(duì)人工智能更多的認(rèn)識(shí)是落在應(yīng)用特性和娛樂(lè)特性上。而美國(guó)的很多人,是真正從理論的角度,進(jìn)行非常深入的探討。
如果我們只談?wù)搼?yīng)用和娛樂(lè)層面上的東西的話,我們是得不了圖靈獎(jiǎng)的,也得不了諾貝爾獎(jiǎng),也不能創(chuàng)造信息論這些東西。美國(guó)所謂原創(chuàng)性的研究,是從理論的根基出發(fā),建立一套完整的思維方式。而有許多理論研究的東西是不會(huì)產(chǎn)業(yè)化的,沒(méi)有產(chǎn)業(yè)化價(jià)值的。它只是一種哲學(xué)化的思考,而這些東西我們沒(méi)有關(guān)心。
哲學(xué)會(huì)產(chǎn)生真正的創(chuàng)新。創(chuàng)新有很多種,有一種是在最原始的技術(shù)上創(chuàng)新。而我們講的很多其實(shí)是在應(yīng)用層面上創(chuàng)新,或者在技術(shù)層面上創(chuàng)新,但不是在科學(xué)的層面上去發(fā)現(xiàn)和創(chuàng)新。
所以在這個(gè)層面上來(lái)講,我覺(jué)得國(guó)內(nèi)應(yīng)該從兩個(gè)方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應(yīng)該更加著重于在理論方面的深入。而我們的產(chǎn)業(yè)界,不應(yīng)該僅僅去應(yīng)用它,而且應(yīng)該在技術(shù)方面去做大規(guī)模的整合和創(chuàng)新。
因?yàn)槿斯ぶ悄芫拖窈娇瞻l(fā)動(dòng)機(jī)一樣,里面有非常非常多的零件,有視覺(jué)的,有聽(tīng)覺(jué)的。你要把它們綜合在一起,而且每一個(gè)都要做到世界上最好。我覺(jué)得現(xiàn)在學(xué)術(shù)界可能因?yàn)橐彤a(chǎn)業(yè)界對(duì)接,做了很多技術(shù)層面上,和應(yīng)用相關(guān)的創(chuàng)新。而產(chǎn)業(yè)界還沒(méi)有能力,來(lái)做整體性、系統(tǒng)性創(chuàng)新的工作,比較少。所以我覺(jué)得這就是我們和美國(guó)相比有差異的所在。
我覺(jué)得我們?cè)趯W(xué)術(shù)上,理論的深度,和愿意去花長(zhǎng)時(shí)間研究本質(zhì)的工作還是太少,還應(yīng)該增強(qiáng)。
因?yàn)槿斯ぶ悄埽娦旁p騙損失減少了5個(gè)億
科大訊飛目前的主要優(yōu)勢(shì)是語(yǔ)音識(shí)別領(lǐng)域,公司未來(lái)還有沒(méi)有其他人工智能領(lǐng)域的計(jì)劃?
胡郁:智能語(yǔ)音是訊飛整個(gè)人工智能戰(zhàn)略中的一部分。而訊飛人工智能戰(zhàn)略的核心,是基于語(yǔ)音和語(yǔ)言的認(rèn)知智能。
什么是認(rèn)知智能?比如在醫(yī)療的過(guò)程中,我們需要通過(guò)病例幫助醫(yī)生分析病人可能會(huì)得什么病,吃什么藥,這就是一種認(rèn)知智能。包括在教育里面,我們通過(guò)手寫的試卷來(lái)判斷學(xué)生的得分,并給出改進(jìn)的意見(jiàn)。這些都是和語(yǔ)言,和人的概念和推理有關(guān)的。除了交互之外,它們能給我們的生活帶來(lái)更多改進(jìn)。
我再舉一個(gè)例子,和我們的安全有關(guān)。在7、8月份,電話詐騙非常猖獗,特別是臨開(kāi)學(xué)的那段時(shí)間。有很多上學(xué)的同學(xué)不是因?yàn)樵p騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發(fā)生次數(shù)下降了60%,而同期全國(guó)其他地區(qū)增長(zhǎng)了58%。為什么能做到這點(diǎn)?因?yàn)槲覀冊(cè)诎不帐∷械碾娫捓锩孀隽艘粋€(gè)監(jiān)控系統(tǒng),它可以對(duì)通話內(nèi)容進(jìn)行分析,對(duì)那些詐騙性質(zhì)行為自動(dòng)作出提醒,而這個(gè)過(guò)程是完全自動(dòng)化的。這樣就為安徽省避免了5個(gè)億以上的可能的損失。
我相信大家也注意到了,我們演講的時(shí)候會(huì)有一個(gè)同步的實(shí)時(shí)顯示文字的技術(shù)。就是說(shuō)我在上面講話的同時(shí),文字出來(lái)了,對(duì)你們(記者)來(lái)說(shuō)是最有用的。這個(gè)產(chǎn)品馬上就要開(kāi)發(fā)出來(lái)了,最理想的狀態(tài)就是我在這邊說(shuō)話,你們的屏幕上就能實(shí)時(shí)顯示出來(lái)我講的內(nèi)容。
在去年的發(fā)布會(huì)上,我們發(fā)布了這個(gè)功能以后。大家可以看到,今年阿里和搜狗都展示了同樣的技術(shù)。這也代表了一個(gè)發(fā)展方向。這個(gè)方向可能和語(yǔ)音交互是沒(méi)有關(guān)系的,但和語(yǔ)音(技術(shù))有關(guān)系。
我們談到iPhone和Android的時(shí)候,它們的語(yǔ)音識(shí)別系統(tǒng)都是封閉系統(tǒng),都是系統(tǒng)級(jí)別的。科大訊飛怎么解決這個(gè)問(wèn)題?
胡郁:首先iPhone我們是搞不定的,除非破解它。iPhone本身就是一個(gè)垂直的生態(tài)。而且這個(gè)問(wèn)題不僅僅是在中國(guó),美國(guó)也是。但是iPhone自己的語(yǔ)音技術(shù)很差,導(dǎo)致它的用戶體驗(yàn)相對(duì)于其他公司、產(chǎn)品會(huì)有劣勢(shì)。
但對(duì)Android來(lái)講,情況是不一樣的。因?yàn)楣雀枰仓繟ndroid有全球不通用的地方。比如說(shuō)審美、風(fēng)格,比如說(shuō)語(yǔ)言相關(guān)的部分:輸入法、交互。這就造成了Android系統(tǒng)在設(shè)計(jì)的時(shí)候就是一個(gè)比較開(kāi)放的系統(tǒng)。
這就造成了第三方UI其實(shí)接管了中間層的一些功能,也導(dǎo)致了這些領(lǐng)域是可以進(jìn)入的。而且現(xiàn)在很多的智能硬件,其實(shí)用的都是Android的操作系統(tǒng)。
我相信在將來(lái)的發(fā)展中,世界上會(huì)存在兩種公司。一種公司是垂直產(chǎn)品型公司,比如說(shuō)做手機(jī),就一直做手機(jī),手機(jī)技術(shù)不可能給別人用。世界上看起來(lái),最多有8到9家這樣的手機(jī)公司,加起來(lái)產(chǎn)量可能到全球的90%-到95%以上。
另外還有些公司,像谷歌這樣,就是平臺(tái)型的公司。我提供一些基礎(chǔ)性的工作,給各個(gè)廠商都能用。但是做了平臺(tái)之后就要面臨控制權(quán)大小的問(wèn)題。有可能控制權(quán)不在自己手上,而在手機(jī)廠商手上。
所以在未來(lái)的發(fā)展過(guò)程里,訊飛要做的不僅僅是手機(jī),而是我剛才說(shuō)的各個(gè)領(lǐng)域。這些領(lǐng)域里,有的是幾家大公司聯(lián)合壟斷了市場(chǎng),有的領(lǐng)域會(huì)是成千上萬(wàn)個(gè)公司來(lái)分享市場(chǎng)。比如說(shuō)玩具、機(jī)器人,就是后面的這種。而且我相信現(xiàn)在這么多機(jī)器人公司,到最后也不會(huì)合并成大的公司,因?yàn)橛脩粜枰鄻有缘膫€(gè)性化產(chǎn)品。而手機(jī)這種產(chǎn)品,雖然有差異,但還是個(gè)工具性質(zhì)的產(chǎn)品。
所以訊飛會(huì)成為一個(gè)平臺(tái)型的公司,不僅幫平臺(tái)上的公司提供核心技術(shù),甚至可以幫它們整合各種各樣的資源。我覺(jué)得我們是用這樣一個(gè)思路來(lái)發(fā)展的。
成為平臺(tái)型的公司,需要在不同的場(chǎng)景下提供基礎(chǔ)性的通用解決方案,但是不同場(chǎng)景的使用特性是不一樣的,科大訊飛準(zhǔn)備怎么解決這個(gè)問(wèn)題?
胡郁:場(chǎng)景的問(wèn)題其實(shí)和剛才的問(wèn)題,就是內(nèi)容方面是非常有關(guān)系的。我們?nèi)嗽谔幚硪患碌臅r(shí)候,你可以想象下你在訂一張票,你所要和別人交談的內(nèi)容,嘴里面發(fā)出的指令,其實(shí)相對(duì)來(lái)講不是開(kāi)放的集合,是封閉的集合。
這里最難的問(wèn)題就是怎么把它豐富起來(lái),怎么讓它多覆蓋(些場(chǎng)景)。我們現(xiàn)在的做法就是一個(gè)點(diǎn)一個(gè)點(diǎn)去做。每做完一個(gè)點(diǎn)就拿到實(shí)際里去用。越來(lái)越多的人用了之后,語(yǔ)言的覆蓋性就會(huì)越來(lái)越好,這個(gè)場(chǎng)景的問(wèn)題就解決了。
那在這個(gè)過(guò)程里怎么加速這個(gè)問(wèn)題呢?我們?cè)趺丛谧鲆恍﹫?chǎng)景的時(shí)候,其他場(chǎng)景也能變快呢?這就是我們?yōu)槭裁匆瞿切└呖即痤}機(jī)器人的原因。它能學(xué)會(huì)系統(tǒng)學(xué)習(xí)的方法,當(dāng)我們做了一兩個(gè)場(chǎng)景之后,就能轉(zhuǎn)移到其他很多場(chǎng)景上。這樣能使我們的覆蓋快速增加。我們通過(guò)這樣的方式來(lái)解決這樣的問(wèn)題。
擔(dān)心人工智能過(guò)熱沒(méi)有用,還不如肯“干活”
今年人工智能的概念快速火熱了起來(lái),您怎么看待這種現(xiàn)象?有沒(méi)有擔(dān)心過(guò)這種火熱對(duì)人工智能技術(shù)的發(fā)展帶來(lái)負(fù)面效果?
胡郁:當(dāng)然擔(dān)心,但擔(dān)心了也沒(méi)用。
任何一個(gè)新技術(shù)出來(lái)的時(shí)候都會(huì)魚龍混雜。人類有夸大預(yù)期的本性在里面,是人類的社會(huì)特性決定的。認(rèn)識(shí)到這個(gè)規(guī)律之后就不會(huì)覺(jué)得這事是什么壞事。我們能做的就是在局部上防止過(guò)熱。
所以我們應(yīng)該考慮的是如何利用這種周期性的狂熱來(lái)合理布局。從投資人角度來(lái)說(shuō),投資人很容易找到錢,但投資人可以利用這種環(huán)境去找最有價(jià)值的公司來(lái)投資。所以只能說(shuō)改變你能改變的,接受你不能改變的。
我覺(jué)得在人工智能領(lǐng)域里有兩個(gè)領(lǐng)域是有價(jià)值的。一個(gè)是人工智能核心技術(shù)研究,他們不一定有經(jīng)驗(yàn)去進(jìn)行商業(yè)化,我們可以投資他,提供經(jīng)驗(yàn)。另外是如何利用人工智能技術(shù)來(lái)解決現(xiàn)實(shí)問(wèn)題,這通常在大的公司里面,他們都有很大的產(chǎn)業(yè)基礎(chǔ),只要把新技術(shù)嫁接進(jìn)來(lái)。
大部分的公司并不會(huì)因?yàn)槿斯ぶ悄艹霈F(xiàn)而進(jìn)行重組和重構(gòu)。比如農(nóng)業(yè),人工智能只是一個(gè)改進(jìn)的工具,所以在這些領(lǐng)域里,原有的大公司依然占有優(yōu)勢(shì)。所以更有價(jià)值的是去尋找哪些懂得怎么利用人工智能的人來(lái)投資。
百度這樣的互聯(lián)網(wǎng)公司也在做人工智能研究,而且和科大訊飛的領(lǐng)域有重合,您怎么看待這種競(jìng)爭(zhēng)?科大訊飛有哪些優(yōu)勢(shì)?
胡郁:比較公司要看戰(zhàn)略,我不是特別了解百度的戰(zhàn)略,因?yàn)槊磕臧俣鹊闹攸c(diǎn)不一樣。但是過(guò)去三年里面我們一直在做運(yùn)算智能、感知智能和認(rèn)知智能,而且會(huì)定期公布進(jìn)展,有清晰的商業(yè)模式。這是我們和互聯(lián)網(wǎng)公司的不同,是專注科技創(chuàng)新的公司。科技創(chuàng)新公司更像是爬山的公司,一步一步去爬到頂峰。
但互聯(lián)網(wǎng)有很多機(jī)會(huì),所以很多公司都是沖浪型的,需要不停地抓住下一個(gè)浪潮,如果不是,就換了。
我們還是堅(jiān)持來(lái)做人工智能,堅(jiān)信交互革命那天會(huì)到來(lái)。所以一個(gè)公司要有清晰地戰(zhàn)略,而且要把戰(zhàn)略傳達(dá)給別人。我們戰(zhàn)略十分清晰:我們是一個(gè)技術(shù)創(chuàng)新性公司,解決人機(jī)交互這個(gè)問(wèn)題。
在行業(yè)里面,我們用我們的人工智能技術(shù)幫助醫(yī)院、學(xué)校、司法、金融機(jī)構(gòu)去改善他們的問(wèn)題。這里面有很多“臟活累活”,要做很多結(jié)合型的工作。互聯(lián)網(wǎng)公司追求收益,毛利要非常高。而且有很多“臟活”不一定愿意去干。但在產(chǎn)業(yè)互聯(lián)網(wǎng)階段,和傳統(tǒng)領(lǐng)域結(jié)合,是少不了這一步的。
當(dāng)然不是說(shuō)一味去做基礎(chǔ)性的工作。上面要有頂天立地的東西,但是不能因?yàn)橛羞@個(gè)就不能彎腰了,絕對(duì)不是這個(gè)概念。
所以我覺(jué)得中國(guó)需要更多爬山型的公司,無(wú)論外面怎么變化。外面無(wú)論是互聯(lián)網(wǎng)時(shí)代也好,移動(dòng)互聯(lián)網(wǎng)時(shí)代也好,物聯(lián)網(wǎng)時(shí)代也好,這都是外圍環(huán)境的變化。但是公司征服一個(gè)領(lǐng)域,具有爬山的本質(zhì)是必不可少的。
本站聲明:本網(wǎng)站除標(biāo)注來(lái)源【印聯(lián)傳媒】之外,其余文字圖片均來(lái)自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)及時(shí)聯(lián)系我們,我們將會(huì)在第一時(shí)間進(jìn)行刪除!編輯部聯(lián)系電話:0755-8268 2722。