1. 自從來到阿里做自然語言理解的工程師,睡眠時間還能保證嗎?
在阿里挺多年了,已經習慣了這種工作節奏,一般我們在項目關鍵節點的時候會比較忙,別的時候其實還好的,所以正常情況下每天的睡眠時間還是有保證的。
2. 每天睜開眼后,最大的壓力是什么?
現在線上每天有非常多的用戶在使用我們的nlp服務,第一在阿里的技術體系里,服務的可用性是底線,所以一部分壓力來自擔心我們服務會不會出故障,第二用戶對自然語言理解的要求是比較高的,我們每天都會收到用戶的反饋,然后我們讓機器去優化語言理解的能力。
3. 作為一個阿里人工智能實驗室的高級算法專家,您每天的工作日程,包括休息日,您會做些什么呢?
我們每天早上會開一個晨會,匯總下過去24小時收集到的用戶反饋,然后討論下解決的方案,接下來就會安排相應同學去解決這些問題。同時我們自然語言理解模型的優化也是一個持續的過程,這里面涉及到我們對深度學習網絡結構的調整還有訓練方法的優化,所以我們每天會有一定的時間去跟蹤最新的技術動態和論文,同時我們也會按照制定的研發計劃做實驗,逐步推進技術的進步。
4. 您喜歡阿里實驗室里面的工作氛圍嗎?跟您一起在實驗室工作的有多少人呢?都有哪些方向?
目前人工智能實驗室研究的方向包括了自然語言理解、知識圖譜、語音識別、聲音信號處理、計算機視覺、機器人控制、硬件研發、云端技術研發。同時我們還有市場部和產品部門的同學,來自各種背景的同學聚集在一起,有很多可以彼此分享的內容,對大家的知識和閱歷都是一個很好的擴展。
5. 有人說,自然語言理解是AI領域排名第一的難題和挑戰,您認同嗎?
確實自然語言理解是目前非常難的問題,相比語音和圖像的感知智能,語言是認知智能,人類的知識乃至我們的文明都是通過文字來記載的,所以如果機器可以實現完善的自然語言理解,那么這個和科幻片中的人工智能就很接近了。
所以我認為自然語言理解也是可以分層來看的,目前我們在天貓精靈里做的大量的任務型的理解,是第一個層次的理解能力,我們認為基于目前的技術,這部分已經可以做得比較好了,換句話說,接下來大量的任務可以通過語言來指揮機器去完成。再往深入一點,就是信息獲取和問答的能力,這涉及到對人類知識的大規模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰的問題。第三個層面,就是讓機器和人進行自然的交流,機器能有情商,可以感知到用戶的情緒,機器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。
所以總結來講,對機器自然語言理解能力的提升,還有非常漫長的路要走,甚至需要基礎科學的突破。
6. 在自然語言理解這個領域,您最欣賞和佩服的人是誰?
在這里領域我最佩服和欣賞的是深度學習四大天王之一的Prof. Yoshua Bengio。Bengio教授帶領的團隊在自然語言理解領域的深度網絡上做了很多大膽的創新,也取得了很不錯的成果,始終走在自然語言理解探索的最前沿。
7. 在天貓精靈這款產品的開發中,您在里面具體會承擔哪些方面的工作呢?
我及我的團隊主要負責天貓精靈的自然語言理解技術,在這里我主要承擔三部分的工作,第一個是模型的設計及優化,選擇合適的算法方案來實現最優的效果,第二個是設計這套自然語言理解系統,從無到有,經歷了多代的演進,我們搭建了這套我們認為是比較適合目前的語音交互的自然語言理解系統,第三個是解決問題,當遇到具體的問題時,我需要去分析這個問題在哪個模塊去解決是最合適的。同時我也會跟進團隊同學的工作,并且review code。
8. 您來實驗室之前,以及工作了這么久之后,對自然語言理解用于解決實際問題上,會不會有一些不同的新的認知和感悟?
我是人工智能實驗室創始團隊成員,之前一直在阿里集團大數據部門從事圖像識別、推薦系統等算法工作。
在人工智能實驗室一直從事自然語言理解領域的工作,在解決實際問題的時候,可以分享下最大的感悟吧,就是細節是魔鬼,整個算法系統涉及到大量的算法子模塊,我們在進行效果優化的過程中,發現一些容易被我們忽略的細節,如果進行了優化,會對整體效果帶來明顯的提升,感悟就是要嚴謹的分析問題然后要去懷疑細節。
9. 在您解決實際問題中,會綜合用到其他哪些技能呢?比如,知識圖譜?
在解決實際問題的時候,我們會去嘗試各種文本的技術,當然知識圖譜對我們的自然語言理解是非常重要的。知識圖譜可以給我們很多先驗知識,它包含了對這個世界的認知信息,是我們進行意圖判斷很重要的參考。
10. 對于對自然語言處理非常感興趣的,正在努力學習,希望未來從事這個領域相關工作的同學,從您自身出發,有沒有想要分享的一些心得感悟?
自然語言理解需要兩方面的能力,機器學習的能力,當然也包括目前炙手可熱的深度學習方法,和對語言本身特點的理解,所以我覺得這兩部分的內容的學習和實踐都很重要。
11.如果讓您給未來會從事自然語言理解實戰相關工作的同學提三個中肯的建議,您覺得是什么?
第一個,對機器學習和深度學習方法能有很扎實的掌握,更深入一點,比如凸優化等數學理論能有所掌握。
第二個,語音本身是很有魅力的,是一種人類創造出來的符號語言,所以對語言本身的理解,是我們目前發現自然語言理解技術進一步前進很需要去思考的。
第三個,其實和所有的算法工作是一樣的,就是要養成思辨的思維習慣(critical thinking)和獨立的思考能力(independent thinking)。
12. 目前NLP領域,大致會分為哪些具體的工作,一般來說,不同的工種,不同的工作年限,不同的學歷,工資待遇大致會是什么范圍?
我們這邊,大致會有三種類型的工作,一種是做算法模型的,包括深度學習模型還是傳統的模型,第二種是做自然語言理解系統的搭建的,第三種是利用自然語言理解技術去實現業務邏輯和產品功能的。目前來講這部分工程師的待遇還是相當有競爭力的。
13. 如果想加入您的團隊,您會有哪些要求呢?
對技術的熱愛,也就是對做的技術有熱情,會用心去思考所做技術的每個細節。有扎實的技術基礎,算法的基礎和代碼的基礎。
14. 如果重新選擇,還會選擇NLP嗎?
是的,還會選擇nlp,因為這部分的技術是我們走向真正的智能所需要去突破的核心技術。這是這幾年發展速度會非常快的領域。
15. 從技術上,以及個人理解上,您會將NLP的發展分為幾個階段?下一個階段NLP將會是一個怎樣的趨勢?
我其實在回答第5個問題的時候已經回答了這個問題:
我認為自然語言理解也是可以分層來看的,目前我們在天貓精靈里做的大量的任務型的理解,是第一個層次的理解能力,我們認為基于目前的技術,這部分已經可以做得比較好了,換句話說,接下來大量的任務可以通過語言來指揮機器去完成。再往深入一點,就是信息獲取和問答的能力,這涉及到對人類知識的大規模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰的問題。第三個層面,就是讓機器和人進行自然的連續交流,機器能有情商,可以感知到用戶的情緒,機器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。
目前來看,第一個階段,任務型的nlp已經可以比較好的達成了,第二個階段,知識庫的建設和知識應用于自然語言交互,會是接下來很重要的趨勢。
16. 如果用一句話總結您所做的工作,用一句非常走心的話,別太套路,您覺得是什么?
用最前沿的技術,讓人可以直接用語言與機器進行自然交流,讓內容和服務變得隨口既來,讓更多的人能享受到智能時代所帶來的便捷。
-
工程師
+關注
關注
59文章
1569瀏覽量
68509 -
阿里
+關注
關注
6文章
438瀏覽量
32828
發布評論請先 登錄
相關推薦
評論