科大訊飛正建立起智能應(yīng)用生態(tài)圈
作 者:錢麗娜 來 源:商學(xué)院發(fā)表日期:2017-07-17
在中國,要證明“我媽是我媽”可是個解不開的死結(jié)。若是子女與父母不在同一戶口簿上,簡直不知道從哪里下手??拼笥嶏w在智慧城市的解決方案中利用聲紋和人臉識別技術(shù),嘗試打通公安、民政、社保、教育等58個部門781類數(shù)據(jù),只要刷臉聽音,就能證明你和你媽之間具有血緣關(guān)系。6月2日,《商學(xué)院》雜志、中國經(jīng)營者俱樂部帶領(lǐng)企業(yè)家會員走進(jìn)科大訊飛,全方位地感受人工智能在各領(lǐng)域的應(yīng)用和突破。企業(yè)家們在驚訝之余,猛然意識到未來已來,再不跟上人工智能的腳步,即將面臨被淘汰的風(fēng)險。
《偽裝者》中曾經(jīng)有這么一句話,如果一個特工的背影和聲音被人記住,你不是讓對方消失就要讓自己消失。
每個人的聲音是如此獨特而又有趣,這促使科大訊飛創(chuàng)始人劉慶峰從1999年開始帶領(lǐng)團(tuán)隊攻克聲紋難題。
今天,當(dāng)你走入科大訊飛位于合肥的園區(qū),在展廳隨時可以聽到奧巴馬說中文、羅振宇播新聞。你真以為高德地圖中林志玲和郭德綱的聲音導(dǎo)航來自本人?錯,那是采用了科大訊飛的語音合成技術(shù)。只要采集到足夠的語音樣本,后臺根據(jù)聲紋特征,經(jīng)過機器學(xué)習(xí)后便可以模擬任何當(dāng)事人的聲音特征,并達(dá)到以假亂真的程度。
2000年以前,中文語音產(chǎn)業(yè)被微軟、IBM等一眾國際IT巨頭壟斷??拼笥嶏w自進(jìn)入這一領(lǐng)域后發(fā)展迅速,2016年,科大訊飛在國際語音合成比賽中的中文語音合成分為4.5分,英文為4.2分,印地語為3.9分。在非常關(guān)鍵的自然度指標(biāo)上,科大訊飛是4.2分,科大是唯一得分超過4.0的語音參賽系統(tǒng)。
這是什么概念呢?5分是國家播音員的水平,4.5分達(dá)到省級播音員的水平。達(dá)到這一分值時,人耳已經(jīng)無法分辨是機器發(fā)音還是真人發(fā)音。而4.2分的英文合成語音也戰(zhàn)勝了微軟、IBM、MIT等一眾世界一流的高科技公司和研究機構(gòu)。
光有語音合成技術(shù),也許人們尚無法深切感受語音智能是如何改變、影響我們生活的。在“走進(jìn)名企”活動中,科大訊飛首次系統(tǒng)地向企業(yè)家們展示了人工智能技術(shù)在各個產(chǎn)業(yè)的落地實施情況。
人工智能已經(jīng)像互聯(lián)網(wǎng)、像空氣、像水那樣潛移默化地成為我們生活中的一部分。
一切源于語言
《人類簡史》一書中提到,人類認(rèn)知革命起源于語言。而要讓機器具備人類的語言能力,這一技術(shù)分為三個要點。
一是語音合成。將任意文字信息轉(zhuǎn)化為自然流暢的語言,給機器裝上了人工嘴巴。
二是語音識別。將語言中內(nèi)容、說話人、語種等信息識別出來,給機器裝上了人工耳朵。
三是自然語言理解。對自然語言進(jìn)行語義理解,給出適合的指令集合,給機器賦予人工大腦。
試試這兩句話:
“爸爸沒法舉起他的兒子,因為他很重。”問:誰重?答:兒子。
“爸爸沒法舉起他的兒子,因為他很虛弱。”問:誰虛弱?答:爸爸。
科大訊飛市場總監(jiān)任萍萍說,單這兩句話中對“他”一詞是誰的理解就相當(dāng)于六歲孩子的認(rèn)知水平。這是公司正在攻堅的“六齡童計劃”,即讓機器達(dá)到六歲孩子的語言認(rèn)知推理能力??拼笥嶏w要實現(xiàn)的目標(biāo)是讓機器像人一樣,不僅能聽會說,還能理解思考,具備人類的思維能力。正是在認(rèn)知智能領(lǐng)域的突破,科大訊飛獲得Winograd Schema Challenge2016年比賽第一名。
2014年8月,科大訊飛在傳統(tǒng)人工智能(即感知智能)領(lǐng)域取得突破的基礎(chǔ)上,結(jié)合承擔(dān)的863類人智能重點攻關(guān)項目,正式啟動“訊飛超腦計劃”,研發(fā)基于類人神經(jīng)網(wǎng)絡(luò)的認(rèn)知智能系統(tǒng)。通過對海量知識庫的學(xué)習(xí),建立語言理解能力、知識表示能力、聯(lián)想推理能力以及自主學(xué)習(xí)能力。這里最難的是對自然語言的理解,國際上以通過各個國家的高考來判斷人工智能的先進(jìn)性。美國華盛頓大學(xué)圖靈中心的目標(biāo)是通過美國的生物學(xué)考試,日本則希望考上東京大學(xué)。目前科大訊飛的第一目標(biāo)是達(dá)到“一本”的成績,下一個目標(biāo)是達(dá)到進(jìn)入北大、清華的成績。
人工智能+大數(shù)據(jù)+產(chǎn)業(yè)=無限可能
說到智能語音的應(yīng)用,人們最熟悉的莫過于地圖語音導(dǎo)航、智能汽車駕駛中的語音秘書服務(wù),隨時隨地通過語音指揮車載智能系統(tǒng)完成各種指令,避免司機駕駛過程中分心。
2013年前后,寶馬、奔馳在中國發(fā)起中文語音輸入系統(tǒng)的供應(yīng)商PK。在車速60碼的相對安靜的車內(nèi)環(huán)境下,三家語音供應(yīng)商中文語音輸出的準(zhǔn)確率分值均在90分以上,科大訊飛則高達(dá)97分;而當(dāng)車速達(dá)到140碼,車內(nèi)噪音激增時,科大訊飛依然保持90分以上的高分,而另兩家則跌到六七十分。為此,科大訊飛一舉拿下中文語音供應(yīng)商的資質(zhì),并且還為全國一百多款車型提供語音智能服務(wù)。
在教育領(lǐng)域,科大訊飛的多語種智能口語評測系統(tǒng)開始一展身手。系統(tǒng)可以分析用戶的語音特征,對口語發(fā)音的標(biāo)準(zhǔn)程度進(jìn)行智能評分;精確指出用戶發(fā)音的錯誤和缺陷,并給出改進(jìn)指導(dǎo)。這對于學(xué)生語言學(xué)習(xí)、矯正發(fā)音起到巨大的幫助,未來國家重大考試中的口語評分也將按照這一系統(tǒng)來評測。
在醫(yī)療領(lǐng)域,有醫(yī)院開始嘗試在醫(yī)生椅子上配備智能語音采集設(shè)備,問診對話全部自動轉(zhuǎn)為文字病歷,減少了醫(yī)生邊問診邊輸入病歷的麻煩,即使醫(yī)生有地方口音,設(shè)備依然能夠準(zhǔn)確識別;在醫(yī)療影像領(lǐng)域,公司根據(jù)合作醫(yī)院提供的醫(yī)療影像數(shù)據(jù),肺部結(jié)節(jié)診斷的準(zhǔn)確率達(dá)到75%,堪比縣級醫(yī)院大夫的診斷水平。未來只要給系統(tǒng)提供更多的數(shù)據(jù),準(zhǔn)確率還將進(jìn)一步提高,并且這一技術(shù)還可應(yīng)用到其他器官的檢查。
面對學(xué)生苦不堪言的題海訓(xùn)練,科大訊飛推出了智學(xué)網(wǎng),這是人工智能針對精準(zhǔn)教學(xué)提出的解決方案。只要將學(xué)生的試卷輸入系統(tǒng),評判試卷后,系統(tǒng)能就每一個學(xué)生、每道題的得分與班級和地區(qū)的平均分進(jìn)行比較,找出知識薄弱點,從題庫中匹配相應(yīng)的訓(xùn)練題,進(jìn)行有針對性的訓(xùn)練。單這一改進(jìn)就能減少40%的無效做題時間。2015年,科大訊飛在合肥一中嘗試精準(zhǔn)教學(xué),在對比實驗中,接受“因材施教”的學(xué)生成績明顯提升,與此同時,教師的教學(xué)效率平均提升30%。如今,智學(xué)網(wǎng)已在全國31個省級行政區(qū)超過1萬所學(xué)校使用,全國超過半數(shù)“百強”名校全面應(yīng)用智學(xué)網(wǎng),受益師生超過1500萬人,成為中國數(shù)據(jù)規(guī)模最大、智能程度最高、產(chǎn)品體系最全、應(yīng)用效果最顯著的個性化教與學(xué)的系統(tǒng)。另外,科大訊飛智慧教育系列產(chǎn)品在全國31個省、市、自治區(qū)、直轄市及新加坡等海外市場廣泛應(yīng)用,服務(wù)師生超過8000萬人。人工智能正在改變傳統(tǒng)的教學(xué)模式。
此外在智能家居、互動娛樂、智慧城市、智能客服、金融等領(lǐng)域,人工智能也在改變著原有的生態(tài),創(chuàng)造全新的商機。科大訊飛通過發(fā)展核心技術(shù)、內(nèi)部創(chuàng)業(yè)以及與第三方合作伙伴共贏的方式來擴大核心技術(shù)的應(yīng)用場景,建立起智能應(yīng)用生態(tài)圈。
“人工智能比我們想象的來得更快”任萍萍說。未來已來,有遠(yuǎn)見者已經(jīng)在藍(lán)海中找到獨一無二的機會。