導讀:在過去的一年中,AI 生成書面文字的能力大大提高。通過掃描龐大的文本數據集,機器學習軟件可以生成從短篇小說到歌詞的各種令人信服的樣本。現在,一個名為 Deep TabNine 的新程序,可以將相同的技術應用于編碼世界。這個程序一經F推出便好評如潮,大有搶了程序員飯碗的架勢。這個程序是否真有這么好用?我們來一探究竟。
什么是Deep TabNine?
據外媒 The Verge 報道,Deep TabNine 是由滑鐵盧大學的計算機科學本科生 Jacob Jackson 創建的編碼自動完成器,程序員可以將它作為附件安裝在他們選擇的編輯器中,程序員寫代碼時,這個程序會給出下一行代碼建議,每次提供一小段代碼。你可以將它理解為 Gmail 的智能撰寫功能用到了代碼上。
據悉,Jacob 于 2018 年 2 月開始研究該軟件的原始版本,在 11 月發布之前它叫做 TabNine。本月早些時候,他發布了一個更新版本,該版本使用由研究實驗室 OpenAI 設計的深度學習文本生成算法模型 GPT-2 來改善能力。該模型使用 Transformer 架構,旨在解決自然語言處理中的問題,Deep TabNine 用這個架構來理解代碼中的英語。例如,模型可以使用 if / else 語句來進行否定。在訓練時,模型的目標是根據前面給定的 token 來預測下一個 token。
Deep TabNine 使用 GitHub 的近 200 萬個文件進行了訓練,它具有預先存在的知識,而不是僅僅從用戶當前的項目中學習。此外,這個模型還引用以自然語言編寫的文檔來推斷函數名稱、參數和返回類型。它還能利用傳統工具難以發現的小線索。例如,它可以理解 app.get_user() 的返回類型被假定為具有設置器方法的對象,且 app.get_users()的返回類型被假定為列表。
機器學習極大提高智能編碼能力
Jacob 表示,這種軟件雖然并不新鮮事物,但機器學習已經大大地改善了它的功能。“這對我來說是解決了一個問題?!?/p>
Deep TabNine 的更新版本讓程序員們留下了深刻印象,他們在 Twitter 上稱這個軟件“驚人”、“讓人瘋狂”和“絕對令人興奮”。
用戶 Franck Nijhof 是一位在閑暇時間從事開源家庭自動化軟件工作的 IT 經理,他對 Deep TabNine 不僅感到驚訝 ,還覺得既興奮又害怕?!拔沂褂?Deep TabNine 的第一個小時內沒有作用,因為我不停地被它驚訝到,腦子里一直不停地問它到底是怎么知道的?怎么做到的?” Nijhof 通過電子郵件告訴 The Verge。
這樣的自動完成工具之前就有過,但 Nijhof 表示 Deep TabNine 的建議更準確。“我過去曾嘗試過一些'通用'的智能編寫程序,但它們很煩人而且沒有幫助,”他說道,“TabNine 無疑是一個改變游戲規則的存在?!?/p>
特斯拉人工智能總監 Andrej Karpathy 也對這個程序贊不絕口:
深度學習自動編碼 https://t.co/WenacHVj7z 非???!很久以前我在做 char-rnn(字符級循環神經網絡)時嘗試過相關的想法,但當時它并不是很有用。隨著新工具(GPT-2)的出現和更多的關注,它將會發揮更大的作用。
- Andrej Karpathy(@karpathy),2019年7月18日
機器學習預測讓代碼建議更優,支持22種語言
Jackson 表示,該軟件之所以可以提供更好的建議,是因為它可以進行預測。大多數自動填充程序必須解析用戶已編寫的內容來提出建議,就像人使用數學公式中的步驟一樣理順代碼。相比之下,Deep TabNine 依賴于機器學習的能力來查找數據中的統計模式以進行預測。
與文本生成算法在大量書籍、文章和電影腳本數據集上進行訓練的方式相同,Deep TabNine 對來自編碼庫 GitHub 的 200 萬個文件進行了訓練。它在這些數據中找到模式,并用其在任意給定代碼行中可能出現的內容給出建議,無論是變量名還是函數。
Jackson 說,使用深度學習創建自動編碼軟件有幾個優點。首先,它可以輕松添加對新語言的支持。只需要將更多的訓練數據放入 Deep TabNine 中,它就會挖出模式。這意味著,Deep TabNine 支持大約 22 種不同的編碼語言,而大多數同類型產品只支持一種。
Deep TabNine 支持的編碼語言完整列表如下:
Python,JavaScript,Java,C ++,C,PHP,Go,C#,Ruby,Objective-C,Rust,Swift,TypeScript,Haskell,OCaml,Scala,Kotlin,Perl ,SQL,HTML,CSS,Bash
最重要的是,由于深度學習的分析能力,Deep TabNine 提出的建議整體上具有很高的質量。而且,因為軟件不會查看用戶自己寫的代碼來提出建議,所以它可以從編碼的那一刻開始就起作用,而不用等著從用戶編寫的代碼中尋找蛛絲馬跡。
TABNINE并不完美:不擅長創造性代碼
當然,這個軟件也并非完美。它在提出建議時會出錯,另外,它也不是對所有類型的編碼都有用。Hacker News 和 r / program subreddit 的用戶已經找到了它的各種優點和編程漏洞(但大多數傾向于正面評論)。
用戶1:免費版本 200 KB 的限制對于實際代碼庫來說太低了,有考慮過提高限制嗎?
Jacob Jackson 回復:可以試下付費版 30 天返款。所有版本的 TabNine 仍然適用于大于索引限制的項目。索引中將添加和刪除文件,以確保索引文件與用戶正在編輯的文件盡可能相關。
用戶2:可以用,但不是很好用。對于你最喜歡的編輯器不支持或沒有插件的語言來說,這是一個非常酷的技術,但是如果編輯器已經對語言有很好的支持(比如 VSCode for Typescript),它可能不會比連接自動完成的編輯器更好用。
用戶3:添加 IntelliJ Idea 支持,我會買它:)
用戶 4:支持 Emacs 后,我會買!
對于這個為程序員構建的編碼工具的編輯器和工作流程精確度,大家也有很多看法。
Jackson 也坦承了 Deep TabNine 的一些缺點,如它更適合某些類型的編碼。它在自動完成相對死記硬背的代碼時效果最好,這種編程已經被做過數千次,只有很小的變化。但是,它并不擅長用戶用于解決新問題的探索性代碼??紤]到軟件的智能來自數據中的模式,這并不奇怪。
那么,它對于普通程序員真的有用嗎?這取決于很多因素,比如他們使用的編程語言,他們想要實現的目標等。但 Jackson 表示,與其說是一個人類編碼助手,它更像是一種更快的輸入法(一種常見的被稱為結對編程的做法)。
“想象一下,現在所有的程序員都在使用相當于手機的鍵盤打字,而使用 Deep TabNine 有點像轉而去使用常規鍵盤,”他說道。這款軟件可以提高用戶輸入信息的速度,并且可以提高工作效率,“因為你可以花更多時間考慮內容而不是細節?!钡粫凑漳愕姆绞骄帉懘a,而你也確實需要要密切關注它的動向。
如何使用 Deep TabNine?
雖然集成深度學習模型具有多種優勢,但使用它需要大量的算力。Jackson 明確提到,在筆記本電腦上運行無法實現 TabNine 用戶習慣的低延遲。對此,他們提供了一種解決方案——TabNine Cloud(Beta)服務,該服務將使用戶能夠使用 TabNine 的服務器進行 GPU 加速自動完成。訪問 TabNine Cloud,可以在此處免費注冊:https://tabnine.com/beta_signup
但是,有許多人更愿意將代碼保存在他們的機器上。為了確保代碼的隱私性和安全性,TabNine 團隊正在研究以下用例:
他們承諾在未來推出尺寸減小的模型,個人開發者可以在筆記本電腦上運行,提供合理的延遲。
企業可以選擇模型許可,在自己的硬件上運行。他們還提供訓練自定義模型,以了解企業代碼庫特有的獨特模式和樣式。
商業化前途未定
目前,Jackson 正在考慮下一步該用這款軟件做些什么,以及是否值得商業化。他說,他本人目前在一家大型科技公司有一份全職工作,他還不想放棄,但來自各領域的人都對這款軟件表示“非常感興趣”?!拔疫€沒有真正決定我想用它做什么?!?/p>
目前,TabNine 的個人許可用費用為 49 美元,商業用途費用為 99 美元,個人必須注冊 Deep TabNine 測試版才能訪問新的深度學習功能。購買許可之后, TabNine 能夠索引更多文件,給出更多相關建議。
網站上寫道:“TabNine 每分鐘至少可以為你節省 1 秒鐘。如果你認為你的時間價值超過 1.40 美元/小時,它將幫你在不到一年的時間內收回成本。“
他說,如果他能夠使用開源軟件創建這樣的程序,那么 AI 輔助編碼的未來就是一片光明。
“這是在這個領域工作的每個人的目標,告訴計算機你想要寫什么樣的代碼,它就能幫你寫,”他說道。“我們目前距離實現這個目前還很遠,但我認為這種工具可以幫助你更方便地表達自己的想法。”
-
編碼
+關注
關注
6文章
942瀏覽量
54815 -
編輯器
+關注
關注
1文章
805瀏覽量
31163 -
機器學習
+關注
關注
66文章
8408瀏覽量
132574
原文標題:搶程序員飯碗?自動寫代碼的Deep TabNine真如此神奇?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論