科大訊飛:讓世界聽見AI的聲音






源於偶然:讓機器開口說話

科大訊飛1999年成立的時候,手上只有一項技術就是語音技術,當時的目標是讓機器開口說話。

胡鬱笑談:

「當時我們並不知道,我們處於人工智能的范疇,至少自己沒有清晰的概念。我們更加不知道的是,1999年恰恰是人工智能的第二次冬天。就像華為任總以前經常講的一句話,華為要是知道通訊行業這麼難做,可能就不會做了。我們當時也是,如果知道人工智能處於那樣的環境,可能就不會創業了。這既有巧合,又是冥冥之中的注定。」

「2003-2004年以後,人工智能還不是特別熱,我們慢慢意識到我們做的恰好是人工智能最關鍵的技術。」

人類的智能相對於其他動物或者相對於機器,最重要的是認知智能,而認知智能的主要來源是人類對語言的掌握和對知識的表達,然後在這個基礎上進行邏輯推理和複雜的決策。以語音和語言為中心的認知革命,是人類智慧的最高水平,也是現在人工智能所面臨的最大挑戰。

作為訊飛超腦的總牽頭人,胡鬱作出了這樣的詮釋:

「2014年,我們在業界第一次推出‘訊飛超腦’計劃,這不僅僅是一個口號。我們同時發布了對人工智能的定義,即運算智能。機器從發明的第一天開始,就比人類強很多,比如會下圍棋的機器,就是機器運算智能的表現。還有類人機器具有感知智能和運動智能,具體表現是機器能夠看到、聽到、感覺到周圍的世界。現在的類人和動物的機器已做得不錯了。但是,人類之所以能夠屹立在地球生物鏈的頂端,是因為人類的語言能力,我們稱為認知智能。這是訊飛超腦計劃的一個目標,讓具備感知智能的機器從能聽會說、能看會認,過渡到認知智能,即能理解,會思考。」

當前,「訊飛超腦」利用大數據來進行訓練以提升相關算法,這其中的「訓練」指代的並不是那種填鴨式的數據輸入和訓練,而是來自於真實應用場景的真實交互數據,讓系統能夠依據真實數據做到自主學習和提升,胡鬱稱之為漣漪效應,就像水滴入水面產生的漣漪一樣,隨著產品覆蓋面的不斷增加,數據量級也在快速攀升,進而帶來產品體驗的快速優化迭代,這一切的背後都依賴於「訊飛超腦」這個強大的人工智能引擎。

科大訊飛在語音合成、識別、評測,翻譯等領域都擁有全球領先的核心技術。

科大訊飛:讓世界聽見AI的聲音

2005年至2018年,在全球最高水平的語音合成比賽Blizzard Challenge中,科大訊飛取得13連冠,同時科大訊飛各項關鍵指標均名列第一。在國際機器翻譯評測IWSLT2014、NIST2015等大賽中科大訊飛連奪冠軍。

在過去6年中,科大訊飛的語音識別技術準確率從60.2%提升到98%以上。語音技術上的優勢為科大訊飛向人工智能發展,同時落地行業與應用打下良好的根基。

訊飛在布局當前的大數據人工智能的同時,也在關心人工智能發展的另一方面,即與人腦相結合,基於類腦計算,試圖找到人腦智能的奧秘,發現其中的智能動力學,進而真正讓機器具備像人一樣的智能,同時不受人腦物理空間的局限,以此來做到人工智能領域真正的突破。

訊飛翻譯機,出境遊so easy

科大訊飛是真正把人工智能的應用落地了。在2010年,科大訊飛開發了世界上第二個、中國第一個語音輸入法,僅次於Google,訊飛輸入法主打語音輸入,語音識別準確率超98%,同時支持22種方言的語音輸入。

科大訊飛:讓世界聽見AI的聲音

在2016年,科大訊飛發布了第一個智能終端產品訊飛翻譯機。

2018年4月又推出了訊飛翻譯機2.0,主打中文與33種語言實時互譯、方言翻譯和拍照翻譯,並獨家具備4G、Wi-Fi和離線翻譯模式。

翻譯機86%的用戶用於出境遊。考慮到用戶可能不會使用標準普通話,訊飛翻譯機同時搭載了方言和帶方言口音非標準普通話的識別能力,目前已支持粵語、四川話、東北話、河南話四大方言。

方言種類還在持續增加中,並能根據用戶的不同使用場景與用詞習慣,準確識別並給出最符合語境的翻譯結果,真正做到了落地實用。「可以說,訊飛翻譯機2.0是至今世界上銷量最好、好評度最高的手持式智能翻譯系統。」

為了構建未來人工智能產業生態體系,在2010年訊飛發布了語音雲平台。目前平台上的開發者已經超過86萬,連接19億設備,每日提供近46億次交互服務,數以百萬計的開發者正在借助科大訊飛的核心技術開發智能產品,服務於人們生活的方方面面。

2015年,科大訊飛進一步發布了對人工智能產業具有里程碑意義的人機交互界面——AIUI,重新定義了萬物互聯時代的人機交互標準。胡鬱說道:

「2017年,科大訊飛被宣布作為首批國家新一代人工智能開放創新四大平台之一,旨在建成依托智能語音的國家新一代人工智能開放創新平台。」

賦能公檢法、教育等傳統行業

智能語音和人工智能技術對傳統行業賦能方面,科大訊飛也做了很多嘗試,例如公檢法、教育等行業。

在公檢法領域,科大訊飛通過與最高法、最高檢開展創新合作。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話的準確率極高;人工智能還充當起法庭書記員,經測試,智能語音識別參與庭審取得實際效果,庭審時長縮短30%。

在教育領域,人工智能在「改卷子」方面的能力就超乎了人們的想像。

科大訊飛:讓世界聽見AI的聲音

在江蘇省的高考智能閱卷驗證中,兩個不同的人工智能語文作文閱卷分差小於7分,一致率達92.82%,比兩位老師的閱卷評分的一致率高出5%以上。

在湖南省研究生考試的智能閱卷驗證中,兩個不同的人工智能分別對英語作文進行閱卷評分,分差小於6分的一致率竟高達99.83%,比兩位老師的閱卷評分一致率高出了4%以上。

胡鬱表示,教育部考試中心正聯合科大訊飛建設人工智能聯合實驗室,在教育領域醞釀著更多「黑科技」的誕生。

共建AI未來

科大訊飛與華為公司始終保持著緊密合作,雙方充分依托各自行業領域的長期積淀優勢,在電信平台、智能終端等領域建立了戰略合作關係,攜手推動語音及人工智能技術的深入應用。

科大訊飛:讓世界聽見AI的聲音

雙方合作在2010年建立了世界上第一個中文語音的開放雲平台。雲計算能力開放以後,眾多公司和開發者可以面向最終用戶的各種需求,開發各種各樣的產品,這就形成了生態的建設。

2018年5月,華為與科大訊飛簽署戰略合作協議,未來雙方將在公有雲服務、ICT基礎設施產品、智能終端、以及辦公IT四大領域開展深度戰略合作。

雙方還將面向未來開發創新AI語音應用,拓展全新行業市場,做大規模共享收益,共同做強人工智能產業生態。

對於消費者市場,華為手機使用的技術中,有一部分是源於科大訊飛的智能語音技術加持。華為手機還將科大訊飛的AI技術和能力內化為華為手機能力的一部分,為其帶來差異化的競爭優勢。

雙方將基於科大訊飛的語音識別、語音合成、訊飛聽見、訊飛翻譯等語音AI技術和能力,圍繞手機等智能終端產品以及終端雲服務進行合作。

對於2B市場,華為在基礎設施、內部辦公產品等使用科大訊飛的技術與產品,雙方將基於訊飛引擎和華為雲資源,共同構築華為雲EI平台。

面向未來+智能的時代,胡鬱認為將來的人工智能都要在雲上做到。由於雲計算的資源消耗比較大,將來有可能會在端計算和邊緣計算上做到更好的人工智能,也許很快成為技術上的突破口。人工智能的應用也會更多地落地,真正解決問題。

我們有理由相信,未來華為和訊飛可以更好地依托自身優勢,結合產業發展,共同推動人工智能生態體系的建設,為未來的AI生活增光添彩。

科大訊飛:讓世界聽見AI的聲音

華為全聯接大會將於10月在上海舉辦。點擊「閱讀原文」購票現場參會或註冊線上直播,與華為一起「+智能,見未來」。