科大訊飛魏思博士
魏思,肥東一中99屆高中畢業生,現為中國科學技術大學工學博士、科大訊飛研究院副院長、訊飛易聽說首席科學家。2017年獲選《麻省理工科技評論》全球青年科技創新人才,入選為“遠見者”,代表了深度學習與語音識別的創新精神。魏思知識淵博,才思敏捷,為人謙遜,表達力強且不失幽默,善于深入淺出地把深奧的理學知識講解得淺顯易懂。
訊飛超腦計劃及研究成果
科大訊飛研究院副院長,帶領團隊研發語音識別新框架,和傳統深度學習模型相比,增加了“記憶塊”的模塊,用以存儲對判斷當前語音幀有用的歷史信息和未來信息,可以使響應時間可以大大縮短。
近幾年,中國討論度最高的人工智能公司少不了科大訊飛。但大部分人是對訊飛的了解僅限于其語音技術,其實,科大訊飛還有一個更大的目標——打造“訊飛超腦”。
以“從能聽會說到能理解會思考”為目標的訊飛超腦計劃,要實現基于類人神經網絡的認知智能引擎,預期成果是實現世界上第一個中文認知智能計算引擎。
魏思正是“訊飛超腦”計劃的主要負責人之一。1999年,他進入中國科學技術大學電子工程與信息科學系學習,并于 2008年獲得中國科學技術大學工學博士學位,同年起在科大訊飛研究院工作至今。如今,身為科大訊飛研究院副院長的魏思,同樣是訊飛語音技術的核心人物。
基于訊飛超腦計劃,科大訊飛正在開啟一場以語音和語言為入口的“認知革命”。在過去6年中,訊飛的語音識別技術準確率從60.2%提升到95%以上。
準確率提升的背后,是魏思帶領團隊研發的一個語音識別“新武器”——一種名為“前饋型序列記憶網絡 ”( FSMN )的新框架。據魏思介紹,和傳統深度學習模型相比,前饋型序列記憶網絡增加了一個“記憶塊”的模塊,用以存儲對判斷當前語音幀有用的歷史信息和未來信息,從而實現語音識別中的“端到端”建模。和其他多個技術點結合后,訊飛基于FSMN的語音識別框架獲得了大幅度的性能提升。這個新模型可以使響應時間可以大大縮短,例如原來的一個星期可以縮短到一天,還可以提升訓練效果。
FSMN保證了語音識別的準確性,但這還不夠。一個大趨勢是,幾乎所有在做語音技術的人工智能公司都會追求更高的語音合成自然程度。在這一點上,魏思領導團隊則實現了基于深度學習的全新的語音合成系統,進一步提升合成語音的自然度和表現力。在有麻省理工學院、卡內基梅隆大學等國際知名科研機構參加的國際最高水平的語音合成比賽 Blizzard Challenge(暴風雪競賽)中,魏思團隊開發的系統連續 11 年奪冠,7 項指標全部全球第一,并且是所有參賽隊伍中唯一超過自然人發音水平的系統。
當然,對于正在采取“平臺+賽道”擴張方式的訊飛而言,無論是哪一個賽道,都離不開技術的積累,魏思在多年科研工作中的成果也正迎來新的機會。
比如,他曾創造性地提出多種中英文語音評測評測算法,并帶領團隊獲得國際領先成果。現在,他們已經可以將相關的評測技術應用到普通話測試及教學中,其中英文口語測試系統在國內外首次達到人工評測員水平。這項技術最主要的特點是實現了測試管理的信息化和測試手段的現代化。
而在說話人語種識別研究上,魏思則提出了基于深度神經網絡的語種識別算法,大幅提升了語種識別的效果,成為目前業界所有語種識別系統的標準配置。
類似的案例還有很多,魏思的技術征途也不再僅限于語音:他帶領團隊提出基于CNN的離線手寫識別策略,在世界上首次實現試卷掃描自動評分系統;在人工智能-認知智能方面,魏思帶領團隊獲得國際著名的常識推理比賽Winograd Schema Challenge 2016的第一名成績,該任務是國際常識推理領域的新型評測任務,被學術界普遍認為是替代圖靈測試衡量機器智能水平的重要學術挑戰……
如果說有什么在驅動魏思不斷地創新,那肯定少不了他對現有技術的“不滿足”。“雖然近幾年深度神經網絡的興起使得語音識別性能獲得了極大的提升,但是我們并不能迷信于現有的技術,總有一天新技術的提出會替代現有的技術”,魏思曾在一篇博文中這樣寫道。
回顧語音識別的發展歷史和訊飛語音識別系統的最新進展,他也發現,技術的突破總是艱難而緩慢的,重要的是堅持和不斷思考。他也堅信,“現在是一個偉大的時代”。
“那么,在這個偉大的時代,我們的征途是什么呢?我覺得有一句話非常能夠表現我自己或者是訊飛研究院這么多年的思考,那就是:在中國,可以改變世界”。魏思認為,在這10年中,中國原創能力的蓬勃發展已經顯現出來,與全世界同臺競技,“我們毫不怯場”。
展望下一個10年,魏思和他的團隊同樣有幾個小目標:將訊飛研究院打造成一個世界知名的研究機構,培養出一批世界頂級的科學家,最后,能夠解決幾個基本的科學問題。
“在下一個10年或者20年,我們終將可以觸及智能的本質,解開智慧之謎”。
-
語音識別
+關注
關注
38文章
1742瀏覽量
112711 -
科大訊飛
+關注
關注
19文章
807瀏覽量
61332 -
訊飛超腦
+關注
關注
0文章
3瀏覽量
4007
發布評論請先 登錄
相關推薦
評論