近幾年,機(jī)器學(xué)習(xí)迎來了前所未有的大爆發(fā),幾乎隨處可見。今天就來介紹一下如何在線構(gòu)建共享機(jī)器學(xué)習(xí)模型。
Jupyternotebooks是用來建立機(jī)器學(xué)習(xí)模型最常見的環(huán)境之一,它是本地開發(fā)機(jī)器學(xué)習(xí)的好工具,但也有缺點(diǎn),它很難在生成代碼上共享與協(xié)作。
你不得不進(jìn)行一系列合理設(shè)置,非python用戶尤甚,包括需要設(shè)置python環(huán)境,安裝Jupyter及其依賴項(xiàng)以及可能需要的其他python軟件包。
有點(diǎn)麻煩?有的工具可以直接在瀏覽器中運(yùn)行開發(fā)notebooks中的python代碼。本文就將介紹兩個這樣的工具。
GoogleColaboratory
Google Colaboratory,通常被稱為colab,由谷歌開發(fā),允許所有人在瀏覽器中創(chuàng)建并運(yùn)行python代碼。其內(nèi)置許多標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)庫,包括pandas和scikit-learn,還可以安裝幾乎其他所有python庫,以便在每個notebook中使用。
若想訪問colab需注冊谷歌賬戶,可免費(fèi)訪問notebook環(huán)境和計(jì)算資源,包括GPU。
來快速演示一遍:
登錄谷歌帳戶后,進(jìn)入谷歌云盤(Google drive)并選擇新的Google Colaboratory。
這樣就新建了一個空白notebook。
可以通過運(yùn)行pip freeze 來查看預(yù)安裝軟件包。
如果需要安裝尚無法獲取的軟件包,可以通過運(yùn)行 pip install package來完成。
導(dǎo)入數(shù)據(jù)有許多種方法,包括直接從谷歌云盤中加載文件。
那么怎樣從本地CSV文件導(dǎo)入數(shù)據(jù)呢?
首先運(yùn)行此代碼。
from google.colab importfilesuploaded = files.upload()
然后就能看到一個按鈕,可以從本地系統(tǒng)任意位置選擇文件。
現(xiàn)在就可以自由編寫代碼來創(chuàng)建機(jī)器學(xué)習(xí)模型。
Googlecolab notebooks可以通過鏈接共享,類似于谷歌文檔共享,鏈接接收者可以運(yùn)行并編輯代碼。
Kaggle kernels
Kagglekernels需要注冊賬戶,但也是完全免費(fèi)使用。與Googlecolab notebooks非常相似,不過其特有優(yōu)點(diǎn)是可以進(jìn)行版本控制。
一旦創(chuàng)建好帳戶,就可以導(dǎo)航到網(wǎng)站的kernels區(qū)域,然后選擇新的Notebook。
與colab類似,Kaggle kernels提供了許多python常用標(biāo)準(zhǔn)庫,可以通過使用pip freeze查看。在導(dǎo)入其他庫方面也采用了與colab完全相同的方法,安裝軟件包也如此。
加載數(shù)據(jù)非常簡單。首先,選擇文件(File),然后選擇添加或上傳數(shù)據(jù)(Add orupload data)。
現(xiàn)在會看到一些選項(xiàng),可以使用Kaggle數(shù)據(jù)集(Datasets)、kernel輸出文件(Kernel Output Files)或上傳到本地CSV文件。
前面說到Kaggle有內(nèi)置版本控制,也就是說可以向自己的kernel或其他人的kernel提交更改,并在需要時(shí)追蹤并恢復(fù)到以前的版本,這樣有利于協(xié)同合作。
筆者經(jīng)常使用瀏覽器中的notebooks來展示工作,特別是那些不會使用Jupyter Notebooks或Python的非數(shù)據(jù)科學(xué)家。這兩種工具也是了解機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的好方法,而且不需要大費(fèi)周折在本地設(shè)置python和notebook環(huán)境。
-
Google
+關(guān)注
關(guān)注
5文章
1764瀏覽量
57524 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8416瀏覽量
132620
發(fā)布評論請先 登錄
相關(guān)推薦
評論