人工智能三大支柱,即算力、算法、數據,都離不開算力支撐。
最近,AI繪畫大熱,我們所說的“AI繪畫”的概念,指的是基于深度學習模型來進項自動作圖的計算機程序。
2012年,Google兩位大名鼎鼎的AI大神使用1.6萬個CPU訓練了一個當時世界上最大的深度學習網絡, 用來指導計算機畫出貓臉圖片. 當時他們使用了1000萬個貓臉圖片, 1.6萬個CPU整整訓練了3天, 最終生成到了一個非常模糊的貓臉。
是不是感覺有點不可思議,2012年大規模計算機集群已經處于很現代水平了,可是結果確如此模糊。
大家或許有個基本概念, 深度學習模型的訓練簡單說來就是利用外部大量標注好的訓練數據輸入, 根據輸入和所對應的預期輸出, 反復調整模型內部參數加以匹配的過程。
那么讓AI學會繪畫的過程, 就是構建已有畫作的訓練數據, 輸入AI模型進行參數迭代調整的過程。
一幅畫帶有多少信息呢? 首先就是長x寬個RGB像素點.再是繪畫中每一筆的位置、形狀、顏色等多個方面的參數, 這里涉及到的參數組合是非常龐大的. 而深度模型訓練的計算復雜度隨著參數輸入組合的增長
而
急劇增長。
AI訓練所需要的時間,取決于背后的GPU性能。
北鯤云怎么幫你畫畫?
以
Disco Diffusion
為例,基于CLIP-Guided Diffusion網絡,這是輸入以下文字輸出一張的圖片,其實還可以選不同的畫家風格。這個可以自己探索~
artstation,GregRutkowski,sea,dikel,ship,industrialization,cloud,time,future,afternoon
接下來就一起看看怎么
在北鯤云超算平臺上實現AI繪畫。
北鯤云超算平臺可以提供高性價比的一站式AI計算服務,根據平時的操作習慣,可以直接通過命令行提交作業。平臺同時還有大量可供調用的GPU資源,
例如32G顯存的V100、40G和80G顯存的A100。
啟動一個T4的Jupyter Notebook Desktop,連接后Notebook會自動打開。
連接后先打開終端,將Notebook(Disco_Diffusion.ipynb)復制到本地
gitclonehttps://github.com/alembics/disco-diffusion.git
由于項目要用pytorch,涉及到很多庫的安裝,最好使用Anaconda。Anaconda已經在平臺上預裝好了,可以通過以下命令進行加載
moduleaddAnaconda3sourceactivate
我們可以創建一個獨立的環境用來diffusion,python版本選3.9即可,并將該環境加到ipykernel中。
condacreate-ndiffusionpython=3.9condaactivatecondainstall-canacondaipykernelpython-mipykernelinstall--user--name=diffusion
這時候即可打開Disco_Diffusion.ipynb,并選擇diffusion作為kernel。
運行Notebook,分為四步:
環境搭建、模型設置、生成文字設置、生成圖片
。
第一個單元檢測本地的GPU。
第二個單元會提示沒有檢測到colab,模型會選擇本地的models文件夾。
第三個單元檢測一些必須的依賴包,沒裝成的直接conda安裝即可。由于這一步會下載文件,請耐心等待。
以下列出本例中安裝的package和命令:
condainstall-cpytorchpytorchtorchvisiontorchaudiocudatoolkit=10.2condainstall-cconda-forgeopencvtimmlpipsftfyeinopsomegaconfpandas
后面三個單元定義了一些方法和模型,可以直接運行。
這里要注意默認用的是512*512的模型會比較吃顯卡,前面可以調成256*256的。
然后就是模型設置,這里batch_name是文件夾名,里面的圖片也會根據這個命名。
width_height是期望的最終圖像大小,應該設置為64px的倍數,并且在默認的CLIP模型設置上至少設置為512px。如果忘記使用64px的倍數,DD會調整圖像尺寸。
steps是迭代步數,越高細節越多。
然后Animation Settings和 Extra Settings,這兩個可以先不動。
最關鍵的短語設置部分,text_prompts就是短語,0:是第一幀,如果是動畫可以設置從哪一幀開始變風格,單個圖片就設置一句就行。
image_prompts是基于哪張圖片進行生成,這個也很有意思可以自己選圖片實驗。
怎么設置好的確是門藝術,不過大概有場景描述就可以生成,有喜歡的藝術家也可以加上,還有時間,地點也可以。
官方的例子描述是:"A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”
就是說:“greg rutkowski和thomas kinkade在Trending on artstation上繪制的一幅美麗的燈塔畫,它的光芒照耀著一片喧囂的血海。”
這里引入了兩位藝術家,想查看其他藝術家可以看下方表格,兩千多位藝術家可以選擇:
https://docs.google.com/spreadsheets/d/14xTqtuV3BuKDNhLotB_d1aFlBGnDJOY0BRXJ8-86GpA/edit#gid=0
我們在此用的關鍵詞是:high,performance,computing,cloud, scientist,drug,time,future,cyberpunk
然后就是激動人心的生成了, n_batches是要生成的圖片個數,默認是50會比較久,可以先設置1個測一下速度。點擊運行后,圖片就開始生成,并會一點一點變清晰。
此時可以在終端里通過nvidia-smi查看GPU的使用率。
等計算完成后,可以到北鯤云控制臺首頁—
文件傳輸
里下載生成好的圖片。
清華大學某課題組正面臨管理難、科研效率慢等問題,在多方對比后選擇了北鯤云AI計算云平臺。
據小鯤得知,以下幾點是北鯤云打動課題組的關鍵點:
1 滿足每個賬號有云主機多卡多節點并行
2 已預裝多種環境及數據集,可直接在平臺上使用
3 支持圖形化界面操作
除此之外,北鯤云豐富的資源、一致的使用體驗及極致的數據安全保障措施都獲得了老師的好評。
基于北鯤云超算平臺開發的北鯤云AI計算平臺幫助用戶無憂上云,大大提升計算效率。歡迎有相關需求的同學來找鯤寶咨詢。
審核編輯 黃昊宇
-
人工智能
+關注
關注
1792文章
47425瀏覽量
238969
發布評論請先 登錄
相關推薦
評論