人工智能擊敗人類這個話題在今天已經沒什么新鮮感了。28年前《終結者2》上映時,天網和終結者代表的人工智能還是遙遠未來撒到現實中的水滴:電影中計算機科學家偷師終結者從40年后帶來的芯片,能做的工作就是在設計一種全新結構的處理器芯片,也就是說還是在尋求算力的突破。以現在計算機科學的眼光來看,離人工智能的距離實在有點遠。
不過也不能難為作為編劇的詹姆斯·卡梅隆。《終結者2》之前沒幾年的1986年,美國國家科學基金會創建的大學骨干網NSFNET作為未來互聯網的基礎剛剛誕生,1990年才正式商用。1991年影片上映那年,萬維網之父蒂姆·伯納斯-李剛剛在歐洲核子研究中心寫出HTTP協議的最初版本,離真的WWW全球網絡大范圍進入民用至少還要5年時間左右。
于是,至少在《終結者2》中,依然看不到任何互聯網的影子,離基于云計算和網絡的現代人工智能那就更遠了。
這30年,其實是人類世界其實發生巨大變化的30年。在互聯網變成日常生活的一部分之后,人工智能看起來也正在往這個趨勢發展。每一個手機應用和服務似乎都有點人工智能的成分,每個公司的宣發似乎都在說人工智能的布局和未來。
實際上,人工智能現在的意思,比它剛剛誕生時要更大一些。當年的人工智能更多的是指像終結者這樣的高級的、通用的、完全模擬人類意識的強人工智能,而如今的人工智能有了更多自動化、自主學習方面的微觀涵義。
但這并不是說AI變得不重要了,恰恰相反,被擴展了含義的人工智能正在深入整個IT行業,并且在不斷創造全新的場景和價值。聯想也是重要的參與者,并且正在學術和應用領域取得突破。
就在剛剛過去的9月,聯想集團旗下推進技術未來發展的聯想研究院,在人工智能領域剛剛取得三項大獎:
“自動自然語言理解”算法獲獎:讓人工智能來訓練人工智能
9月初結束的2019世界人工智能大會(WAIC)黑客馬拉松中,來自聯想研究院人工智能實驗室智能算力平臺組的參賽團隊,在自動自然語言理解(AutoNLP)賽道中首秀即獲得了決賽二等獎 (第二名)的戰績。
本次AutoNLP比賽要求參賽隊伍在不同內容主題、不同語言的混合字符、文本集里,不借助任何離線或在線算力優勢,進行代碼設計,并在規定時間內完成全自動文本分類。這其中存在著不少的挑戰,比如單樣本長度和數據集樣本量差異巨大;任務的類別數不定,且類別間可能極度不均衡,不同類樣本比率可能達到數千比一;對系統泛化能力要求極高等。
聯想研究院提交的方案是自動化機器學習應用于自然語言理解,方案采取了輕量級元學習思路下的自動化深度學習框架。方案具有通用性和自適應性,基于數據特征和任務元特征來進行自動學習,避免在測試任務上的過擬合。
簡單的說,此次獲獎的算法所在的自動化機器學習(AutoML)是人工智能發展的新階段,它可以讓缺乏資源的公司和團體可以以更低的門檻、甚至零門檻設計自然語言識別機器學習算法,從長遠戰略意義上說,自動化機器學習是邁向強人工智能的必經階段,是人工智能研究重要的戰略高地。
全國知識圖譜大賽第一名:讓AI讀懂人類世界的關鍵
同樣是在9月初,聯想研究院人工智能團隊在全國知識圖譜與計算大會上取得了“人物關系抽取比賽”的第一名,以及“短文本實體鏈指比賽”的第二名。
所謂的知識圖譜,就是讓計算機理解人類詞匯、語句中的邏輯和知識性練習。舉例來說,想讓AI給你介紹一款新電腦,AI就必須知道這款電腦的參數、性能、售價、周邊知識等等在內的所有聯系,這就是知識圖譜。完成這樣的訓練,你問任何一個和產品有關的問題,AI都能給正確的答案。
當然了,實際應用的大多數,可能都比介紹產品這樣的案例要更復雜。聯想研究院此次獲獎的人物關系抽取比賽,就是讓計算機讀懂人類的社會結構。
此次的人物關系抽取比賽任務包含35個類別,包括夫妻,長輩,晚輩,同輩,其他親戚;以及老師、學生,戀人,朋友等。人物類型非常多元,包括歷史名人、政治人物、娛樂明星、小說人物等,還包括部分外國人物。
算法可以實現的效果就是,AI讀到“賈玲師從相聲表演藝術家馮鞏”這句話,就知道他們是師徒的關系。
而短文本實體鏈指比賽,則是要求對于給定的一個中文短文本(如搜索Query、微博、用戶對話內容、文章標題等),識別出其中的實體,并與給定知識庫中的對應實體進行關聯。ERL整個過程包括實體識別和實體鏈指兩個子任務。
比如看到一條新聞“比特幣吸粉無數,但央行的心另有所屬|界面新聞 · jmedia”之后,可以輸出“比特幣、央行、界面新聞”這幾個有價值的知識實體詞匯。
簡單地說,理解人物關系和知識的結構,同樣是人工智能未來發展的重要工具和方向。
副語言語音屬性評測國際第一:讓AI讀懂人類的話里有話
在9月底閉幕的國際語音盛會Interspeech2019上,聯想研究院AI Lab語音團隊和昆山杜克大學的DKU-LENOVO聯合系統在今年的副語言語音屬性評測中(ComParE2019,The Interspeech 2019 Computational Paralinguistics ChallengE )奪得冠軍。
ComParE是Interspeech系統評測之一,從2009開始已經連續舉辦十年,在語音領域屬于重量級評測。語音是語言的聲音表現形式,不僅包含了語言語義信息,同時也傳達了說話人、語種、性別、年齡、情感、信道、嗓音、病理、生理、心理等多種豐富的副語言語音屬性信息。
ComParE的目的就是根據語音信號,識別或檢測各類副語言語音屬性,比如情感識別、哭聲檢測、嗓音病理識別、方言語種識別等,每年都會有不同任務。今年參賽單位有20多家,包括Idiap Research Institute、CMU、慕尼黑大學、***清華大學等眾多知名研究機構。
DUK-LENOVO系統參加了鯨魚叫聲檢測項目,主辦方提供部分包含鯨魚叫聲的語音作為訓練數據,大家在共同的測試集上檢測聲音信號中是否包含鯨魚叫聲。通過采用數據擴展、多特征融合以及基于Fish vector的deep embedding技術,DKU-LENOVO提交系統在測試集上達到94.8%的正確率,顯著優于官方提供的86.6%的基線和其他單位系統,穩居第一。
這三項人工智能領域的大獎只是聯想研究院和人工智能團隊取得成績的一小部分。實際上過去一年多,團隊已經獲得了超過14個全球性人工智能競賽的大獎和最佳論文,顯示了極高的算法水平和開發管理能力
而聯想研究院人工智能團隊的成果,早已開始為公司運營提升效能,改進運營水平,擴大盈利空間。舉例來說,聯想的工廠生產、售后維修保障、公司內部運營都已經部署了聯想研究院自行開發的AI技術。而且下一步,聯想作為中國智能制造的使能者與賦能者,這些AI解決方案正在為其他行業與公司提供變革的力量。
-
聯想
+關注
關注
3文章
2603瀏覽量
62770 -
人工智能
+關注
關注
1791文章
47208瀏覽量
238298 -
機器學習
+關注
關注
66文章
8408瀏覽量
132576
發布評論請先 登錄
相關推薦
評論