師兄在騰訊,就讓師兄內推了一下騰訊自然語言處理的實習。在內推前,簡單把李航的統計學習方法,簡歷涉及的知識點都過了一遍,整理了一下,同時leetcode刷了大概100題。 準備過后就把簡歷給師兄了。投完簡歷當天下午就收到了騰訊的短信約晚上面試(這也太效率了= =)。下面簡單記錄一些面試的問題(很多問題都是項目涉及的知識點,每個人可能都不一樣)。
一面(技術面) 基本就是把簡歷過了一遍,問問一些項目上的細節。
1、先簡單自我介紹一下吧。
2、看你之前實習過,說說當時實習都做了些啥。
3、介紹一下transformer吧,除了self-attention還知道哪些attention。
4、看你用了反向翻譯,簡單介紹一下吧,除了這個還知道哪些數據擴充的方法嗎,每個方法有什么區別?
5、介紹一下R2L-Rerank吧。
6、講一講bert,roberta吧,BPE和word piece有什么區別?
7、介紹一下FGM。
8、介紹一下Focal loss。
9、python的迭代器和生成器。
10、算法題:打印二叉樹從右邊看能看到的節點。 一面還算順利結束后第二天就接到了二面的電話。
二面(技術面) 基本也是把項目比賽過一遍,然后問一些細節。
1、簡單介紹一下自己吧。
2、介紹一下AUC吧,和準確率有啥區別。
3、介紹一下F-score,Macro-F1和micro-F1有啥區別。
4、bert如果輸入超過512怎么辦。
5、那你介紹一下transformer-xl吧。
6、如果你自己訓練輸入長度為1024的bert,使用的顯存會是原來的幾倍。
7、你在投的論文做的是什么,介紹一下,看你是用fairseq框架寫的,具體修改了哪些模塊。
8、算法題:最長上升子序列。
9、用過單機多卡或者多機多卡訓練嗎?講一講。
10、你有什么要問我的嗎? 二面也比較順利,第二天就接到了三面的電話。
三面(技術面) 我當時看面經別人都是兩面,我居然有三面= = ,三面應該是一個leader面的。
1、之前實習是負責什么的,大概開發的流程是什么樣的。
2、你做的這些項目是偏實驗的的還是有一定的工業落地的,比如做了一個網站或者api等。
3、你們平常打比賽的時候,隊伍是怎么合作的?
4、你做的項目里的公開數據集你知道是怎么采集的嗎?它會不會有很多臟數據?這些臟數據對模型有什么影響?你是怎么處理它們的?
5、有看過模型的bad case嗎?針對bad case做了哪些提升?
6、系統地介紹一下你研究的這個方向。最近你這個方向效果最好的論文是哪篇?它是怎么做的?
7、你有什么想問的嗎?
三面沒有算法題,感覺問的是一些方法論的東西。答得也還不錯,沒過幾天就接到了HR的電話。 HR面 HR很親切,面試體驗很棒,上來先給我介紹了一下他們部門的一些發展歷史和現在的情況,然后了解了一下我的實驗室,實驗室的研究方向,之前的實習情況,大概詢問了可以入職的時間。整個面試下來感覺平時的積累很重要,之后有空了也準備把之前整理的資料慢慢寫成博客。
責任編輯:xj
原文標題:騰訊自然語言處理實習面經
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
-
騰訊
+關注
關注
7文章
1652瀏覽量
49423 -
自然語言處理
+關注
關注
1文章
618瀏覽量
13552 -
自然語言
+關注
關注
1文章
287瀏覽量
13347
原文標題:騰訊自然語言處理實習面經
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論