想要真的了解深度學(xué)習(xí),除了看視頻,拿數(shù)據(jù)和算力真槍實(shí)彈的練手可能比各種理論知識(shí)更重要。
編程基礎(chǔ)不好?不會(huì)配置環(huán)境?本地GPU太貴配置太低?訓(xùn)練速度達(dá)不到要求?這些可能都是阻礙你搭建第一個(gè)神經(jīng)網(wǎng)絡(luò)的原因。
谷歌開(kāi)發(fā)者博客的Codelabs項(xiàng)目上面給出了一份教程(課程鏈接在文末),不只是教你搭建神經(jīng)網(wǎng)絡(luò),還給出四個(gè)實(shí)驗(yàn)案例,手把手教你如何使用keras、TPU、Colab。
這個(gè)練手指南被成為“僅會(huì)一點(diǎn)點(diǎn)python也能看懂”,也就是說(shuō),基礎(chǔ)再薄弱都可以直接了解哦。
(連python都不會(huì)的同學(xué),文摘菌前幾天發(fā)布了一個(gè)100python計(jì)劃,可以先行學(xué)習(xí)了再來(lái)跟著這篇文章搭建神經(jīng)網(wǎng)絡(luò)。)
四次實(shí)驗(yàn)均在谷歌的Collab上運(yùn)行,由淺入深、循序漸進(jìn)。無(wú)需進(jìn)行任何設(shè)置,可以用Chromebook打開(kāi),實(shí)驗(yàn)環(huán)境都幫你搭建好了。
跟著文摘菌一起,是時(shí)候搭建一個(gè)屬于自己的神經(jīng)網(wǎng)絡(luò)了!
快速開(kāi)啟!
四次實(shí)驗(yàn)均選擇TPU支持,這會(huì)使代碼運(yùn)行速度大大加快,畢竟用了硬件加速。
先教會(huì)你如何在Tensorflow框架下快速加載數(shù)據(jù),然后介紹一些tf.data.Dataset的基礎(chǔ)知識(shí),包括eager模式以及元組數(shù)據(jù)集等。
第二部分,手把手教你實(shí)現(xiàn)遷移學(xué)習(xí),把別人訓(xùn)練好的模型拿過(guò)來(lái)直接使用,不用一步一步搭建也能使用強(qiáng)大的神經(jīng)網(wǎng)絡(luò)。除了遷移學(xué)習(xí),在這部分還會(huì)簡(jiǎn)單介紹一些必要的知識(shí)點(diǎn),包括神經(jīng)元、激活函數(shù)等。
第三部分,進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)部分,在了解卷積層、池化層、Dense層卷積網(wǎng)絡(luò)三個(gè)必要的組件之后,你將學(xué)會(huì)使用Keras Sequential模型構(gòu)建卷積圖像分類器,并使用良好的卷積層選擇來(lái)微調(diào)模型。
第四部分,進(jìn)入到更加前沿的部分,在接受了前面三個(gè)部分的洗禮之后,在這部分你會(huì)實(shí)現(xiàn)在Keras中利用TPU組建現(xiàn)代卷積網(wǎng)絡(luò)和實(shí)現(xiàn)分類。
和在Jupyter Notebook操作方式一樣,同時(shí)按住鍵盤的Shift和enter按鈕,便可以運(yùn)行代碼。
如果你是首次執(zhí)行,需要登錄Google帳戶進(jìn)行身份驗(yàn)證。注意頁(yè)面提醒就可以啦~
此notebook支持目錄功能,點(diǎn)擊網(wǎng)頁(yè)左側(cè)的黑色箭頭可以查看。
利用Colab上的TPU訓(xùn)練Keras模型需要輸入以下代碼?
tpu = tf.contrib.cluster_resolver.TPUClusterResolver(TPU_ADDRESS)strategy = tf.contrib.tpu.TPUDistributionStrategy(tpu)tpu_model = tf.contrib.tpu.keras_to_tpu_model(model, strategy=strategy)tpu_model.fit(get_training_dataset, steps_per_epoch=TRAIN_STEPS, epochs=EPOCHS, validation_data=get_validation_dataset, validation_steps=VALID_STEPS)
本質(zhì)上是在keras中調(diào)用keras_to_tpu_model,部署額外的硬件可以通過(guò)增加訓(xùn)練批次的大小增加訓(xùn)練過(guò)程。需要注意的是目前,Keras支持僅限于8個(gè)核心或一個(gè)Cloud TPU。
注:TPU可以在神經(jīng)網(wǎng)絡(luò)運(yùn)算上達(dá)到高計(jì)算吞吐量,同時(shí)能耗和物理空間都很小。因?yàn)門PU從內(nèi)存加載數(shù)據(jù)。當(dāng)每個(gè)乘法被執(zhí)行后,其結(jié)果將被傳遞到下一個(gè)乘法器,同時(shí)執(zhí)行加法。因此結(jié)果將是所有數(shù)據(jù)和參數(shù)乘積的和。在大量計(jì)算和數(shù)據(jù)傳遞的整個(gè)過(guò)程中,不需要執(zhí)行任何的內(nèi)存訪問(wèn)。
介紹完基本的操作,接下來(lái),文摘菌帶大家看看官方給出的四個(gè)實(shí)驗(yàn)。
Tensorflow入門:tfrecords和tf.data
此實(shí)驗(yàn)涉及兩個(gè)tf的基礎(chǔ)操作,一個(gè)是使用tf.data.Dataset API導(dǎo)入訓(xùn)練數(shù)據(jù),另一個(gè)是使用TFRecord格式從GCS有效導(dǎo)入訓(xùn)練數(shù)據(jù)。
此次實(shí)驗(yàn)使用花卉圖片的數(shù)據(jù)集,學(xué)習(xí)的目標(biāo)是將其分為5種類別。使用tf.data.Dataset API執(zhí)行數(shù)據(jù)加載。
Keras和Tensorflow在其所有訓(xùn)練和評(píng)估功能中接受數(shù)據(jù)集。在數(shù)據(jù)集中加載數(shù)據(jù)后,API會(huì)提供對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)有用的所有常用功能:
dataset = ... # load something (see below)dataset = dataset.shuffle(1000) # shuffle the dataset with a buffer of 1000dataset = dataset.cache() # cache the dataset in RAM or on diskdataset = dataset.repeat() # repeat the dataset indefinitelydataset = dataset.batch(128) # batch data elements together in batches of 128dataset = dataset.prefetch(-1) # prefetch next batch(es) while training
了解API并試著運(yùn)行:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/02_Dataset_playground.ipynb
關(guān)于鮮花數(shù)據(jù)集,數(shù)據(jù)集按5個(gè)文件夾組織,每個(gè)文件夾都包含一種花。文件夾名為向日葵,雛菊,蒲公英,郁金香和玫瑰。數(shù)據(jù)托管在Google云端存儲(chǔ)上的公共存儲(chǔ)區(qū)中。
gs://flowers-public/sunflowers/5139971615_434ff8ed8b_n.jpggs://flowers-public/daisy/8094774544_35465c1c64.jpggs://flowers-public/sunflowers/9309473873_9d62b9082e.jpggs://flowers-public/dandelion/19551343954_83bb52f310_m.jpggs://flowers-public/dandelion/14199664556_188b37e51e.jpggs://flowers-public/tulips/4290566894_c7f061583d_m.jpggs://flowers-public/roses/3065719996_c16ecd5551.jpggs://flowers-public/dandelion/8168031302_6e36f39d87.jpggs://flowers-public/sunflowers/9564240106_0577e919da_n.jpggs://flowers-public/daisy/14167543177_cd36b54ac6_n.jpg
tf.data.Dataset基礎(chǔ)知識(shí)
數(shù)據(jù)通常包含多個(gè)文件,此處為圖像,通過(guò)調(diào)用以下方法創(chuàng)建文件名數(shù)據(jù)集:
filenames_dataset = tf.data.Dataset.list_files('gs://flowers-public/*/*.jpg')# The parameter is a "glob" pattern that supports the * and ? wildcards.
然后,將函數(shù)“映射”到每個(gè)文件名,這些文件通常導(dǎo)入文件并解碼為內(nèi)存中的實(shí)際數(shù)據(jù):
def decode_jpeg(filename): bits = tf.read_file(filename) image = tf.image.decode_jpeg(bits) return imageimage_dataset = filenames_dataset.map(decode_jpeg)# this is now a dataset of decoded images (uint8 RGB format)
有關(guān)tf.data.Dataset的基礎(chǔ)知識(shí)、tf.data.Dataset和eager模式、元組數(shù)據(jù)集的詳細(xì)步驟,請(qǐng)戳:
https://codelabs.developers.google.com/codelabs/keras-flowers-data/#3
但逐個(gè)加載圖像很慢,在迭代此數(shù)據(jù)集時(shí),每秒只可以加載1-2個(gè)圖像。我們將用訓(xùn)練的硬件加速器,可以將速率提高很多倍。
快速加載數(shù)據(jù)
我們將在本實(shí)驗(yàn)中使用的Tensor Processing Unit(TPU)硬件加速器。Google云端存儲(chǔ)(GCS)能夠保持極高的吞吐量,但與所有云存儲(chǔ)系統(tǒng)一樣,形成連接時(shí)需要來(lái)回請(qǐng)求。因此,將數(shù)據(jù)存儲(chǔ)為數(shù)千個(gè)單獨(dú)的文件并不理想。我們將在少量文件中批量處理它們,并使用tf.data.Dataset的強(qiáng)大功能一次性讀取多個(gè)文件。
通過(guò)加載圖像文件的代碼將它們調(diào)整為通用大小,然后將它們存儲(chǔ)在16個(gè)TFRecord文件中,代碼鏈接如下:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/03_Flower_pictures_to_TFRecords.ipynb
經(jīng)驗(yàn)法則是將數(shù)據(jù)分成幾個(gè)(10s到100s)的大文件(10s到100s的MB)。如果有太多文件,例如數(shù)千個(gè)文件,那么訪問(wèn)每個(gè)文件的時(shí)間可能會(huì)開(kāi)始妨礙。如果文件太少,例如一兩個(gè)文件,那么就無(wú)法并行獲取多個(gè)文件的優(yōu)勢(shì)。
TFRecord文件格式
Tensorflow用于存儲(chǔ)數(shù)據(jù)的首選文件格式是基于protobuf的TFRecord格式。其他序列化格式也可以使用,可以通過(guò)以下方式直接從TFRecord文件加載數(shù)據(jù)集:
filenames_dataset = tf.data.Dataset.list_files(FILENAME_PATTERN)tfrecords_dataset = tf.data.TFRecordDataset(filenames,num_parallel_reads = 32)
但你擁有TFRecords的數(shù)據(jù)集時(shí),下一步解碼步驟就是從每個(gè)記錄中獲得數(shù)據(jù)。如前所述,你將使用Dataset.map,并注意num_parallel_reads=32參數(shù)。這將從32個(gè)TFRecord文件并行加載數(shù)據(jù),可以獲得最佳性能。
在Keras中利用遷移學(xué)習(xí)
本次實(shí)驗(yàn)在keras中實(shí)現(xiàn)遷移學(xué)習(xí),將強(qiáng)大的預(yù)訓(xùn)練模型應(yīng)用于我們的數(shù)據(jù)集,不用費(fèi)力重新訓(xùn)練模型。此外,本實(shí)驗(yàn)包含有關(guān)神經(jīng)網(wǎng)絡(luò)的必要理論解釋。
神經(jīng)網(wǎng)絡(luò)分類器是由幾個(gè)層的神經(jīng)元組成。對(duì)于圖像分類,這些可以是Dense層,或者更常見(jiàn)的是卷積層。它們通常通過(guò)relu激活函數(shù)激活。最后一層使用與類相同數(shù)量的神經(jīng)元,并使用softmax激活。對(duì)于分類,交叉熵是最常用的損失函數(shù),將獨(dú)熱編碼標(biāo)簽(即正確答案)與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的概率進(jìn)行比較。例如,為了最大限度地減少損失,最好選擇具有動(dòng)量的優(yōu)化器AdamOptimizer并批量訓(xùn)練圖像和標(biāo)簽。
對(duì)于構(gòu)建為層序列的模型,Keras提供了Sequential API。例如,使用三個(gè)Dense層的圖像分類器可以在Keras中編寫為:
model = tf.keras.Sequential([ tf.keras.layers.Flatten(input_shape=[192, 192, 3]), tf.keras.layers.Dense(500, activation="relu"), tf.keras.layers.Dense(50, activation="relu"), tf.keras.layers.Dense(5, activation='softmax') # classifying into 5 classes])# this configures the training of the model. Keras calls it "compiling" the model.model.compile( optimizer='adam', loss= 'categorical_crossentropy', metrics=['accuracy']) # % of correct answers# train the modelmodel.fit(dataset, ... )
Dense神經(jīng)網(wǎng)絡(luò)
這是用于分類圖像的最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。它由分層排列的“神經(jīng)元”組成。第一層處理輸入數(shù)據(jù)并將其輸出饋送到其他層。之所以被稱為“Dense”是因?yàn)槊總€(gè)神經(jīng)元都連接到前一層中的所有神經(jīng)元。
你可以將圖像的所有像素的RGB值展開(kāi)為長(zhǎng)矢量并將其用作輸入,從而將圖像輸入到此類網(wǎng)絡(luò)中。它不是圖像識(shí)別的最佳技術(shù),但我們稍后會(huì)對(duì)其進(jìn)行改進(jìn)。
神經(jīng)元
“神經(jīng)元”計(jì)算其所有輸入的并進(jìn)行加權(quán)求和,添加一個(gè)稱為“偏差”的值,并通過(guò)所謂的“激活函數(shù)”提供結(jié)果。權(quán)重和偏差最初是未知的。它們將被隨機(jī)初始化并通過(guò)在許多已知數(shù)據(jù)上訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)“學(xué)習(xí)”。
最流行的激活函數(shù)被稱為RELU(Rectified Linear Unit)如上圖所示。
Softmax激活
我們將花分為5類(玫瑰,郁金香,蒲公英,雛菊,向日葵),使用經(jīng)典RELU激活函數(shù)。然而,在最后一層,我們想要計(jì)算0到1之間的數(shù)字,表示這朵花是玫瑰,郁金香等的概率。為此,我們將使用名為“softmax”的激活函數(shù)。
在矢量上應(yīng)用softmax函數(shù)是通過(guò)取每個(gè)元素的指數(shù)然后歸一化矢量來(lái)完成的,通常使用L1范數(shù)(絕對(duì)值之和),使得這些值加起來(lái)可以解釋為概率。
對(duì)于圖像分類問(wèn)題,Dense層可能是不夠的。但我們也可以另辟蹊徑!有完整的卷積神經(jīng)網(wǎng)絡(luò)可供下載。我們可以切掉它們的最后一層softmax分類,并用下載的替換它。所有訓(xùn)練過(guò)的權(quán)重和偏差保持不變,你只需重新訓(xùn)練你添加的softmax層。這種技術(shù)被稱為遷移學(xué)習(xí),只要預(yù)先訓(xùn)練神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集與你的“足夠接近”,它就可以工作。
請(qǐng)打開(kāi)下面的notebook,同時(shí)按住Shift-ENTER運(yùn)行代碼:
https://codelabs.developers.google.com/codelabs/keras-flowers-convnets/#0
插圖:使用已經(jīng)訓(xùn)練過(guò)的復(fù)雜卷積神經(jīng)網(wǎng)絡(luò)作為黑匣子,僅對(duì)分類的最后一層進(jìn)行再訓(xùn)練。這是遷移學(xué)習(xí)。
通過(guò)遷移學(xué)習(xí),你可以從頂級(jí)研究人員已經(jīng)開(kāi)發(fā)的高級(jí)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)和大量圖像數(shù)據(jù)集的預(yù)訓(xùn)練中受益。在我們的案例中,我們將從ImageNet訓(xùn)練的網(wǎng)絡(luò)遷移學(xué)習(xí)。
在Keras中,可以從tf.keras.applications.*集合中實(shí)例化預(yù)先訓(xùn)練的模型。例如,MobileNet V2是一個(gè)非常好的卷積架構(gòu),其尺寸合理。通過(guò)選擇include_top=False,你可以獲得沒(méi)有最終softmax圖層的預(yù)訓(xùn)練模型,以便你可以添加自己的模型:
pretrained_model = tf.keras.applications.MobileNetV2(input_shape=[*IMAGE_SIZE, 3], include_top=False)pretrained_model.trainable = Falsemodel = tf.keras.Sequential([ pretrained_model, tf.keras.layers.Flatten(), tf.keras.layers.Dense(5, activation='softmax')])
另請(qǐng)注意pretrained_model.trainable = False設(shè)置。它凍結(jié)了預(yù)訓(xùn)練模型的權(quán)重和偏差,因此你只能訓(xùn)練softmax圖層。這通常針對(duì)相對(duì)較少的權(quán)重并且可以快速完成而無(wú)需非常大的數(shù)據(jù)集。但是,如果你確實(shí)擁有大量數(shù)據(jù),那么pretrained_model.trainable = True可以讓遷移學(xué)習(xí)更好地工作。然后,經(jīng)過(guò)預(yù)先訓(xùn)練的權(quán)重可提供出色的初始值,并且仍可通過(guò)訓(xùn)練進(jìn)行調(diào)整,以更好地適應(yīng)你的問(wèn)題。
最后,請(qǐng)注意在dense softmax層前插入Flatten()層。Dense層對(duì)數(shù)據(jù)的平面向量起作用,但我們不知道這是否是預(yù)訓(xùn)練模型返回的內(nèi)容,這就是我們需要扁平化的原因。在下一章中,當(dāng)我們深入研究卷積體系結(jié)構(gòu)時(shí),我們將解釋卷積層返回的數(shù)據(jù)格式。
在Keras中利用TPU組建卷積神經(jīng)網(wǎng)絡(luò)
本次實(shí)驗(yàn),完成三個(gè)目標(biāo):
使用Keras Sequential模型構(gòu)建卷積圖像分類器。
在TPU上訓(xùn)練Keras模型
使用良好的卷積層選擇來(lái)微調(diào)模型。
卷積將神經(jīng)網(wǎng)絡(luò)將一系列濾波器應(yīng)用于圖像的原始像素?cái)?shù)據(jù)以提取和學(xué)習(xí)更高級(jí)別的特征,使得該模型能夠?qū)⑦@些特征用于分類。卷積將神經(jīng)網(wǎng)絡(luò)包含三個(gè)組件:
卷積層,將特定數(shù)量的卷積濾鏡(convolution filters)應(yīng)用于圖像。對(duì)于每個(gè)子區(qū)域,圖層執(zhí)行一組數(shù)學(xué)運(yùn)算以在輸出特征映射中生成單個(gè)值。
池化層(Pooling layers),負(fù)責(zé)對(duì)由卷積層提取的圖像數(shù)據(jù)進(jìn)行下采樣以減少特征映射的維度以提高處理效率。常用的池化算法是最大池化,其提取特征地圖的子區(qū)域(例如,2×2像素的塊),保持它們的最大值并丟棄所有其他值。
Dense層,對(duì)由卷積圖層提取的特征并由共用圖層進(jìn)行下采樣執(zhí)行分類。Dense層是全連接的神經(jīng)網(wǎng)絡(luò),在Dense層中,圖層中的每個(gè)節(jié)點(diǎn)都連接到前一圖層中的每個(gè)節(jié)點(diǎn)。
用最大池化做卷積的動(dòng)畫示例如下?
用Softmax激活函數(shù)連接分類器,典型的卷積分類器如下?
在keras中搭建神經(jīng)網(wǎng)絡(luò)代碼如下:
model = tf.keras.Sequential([ # input: images of size 192x192x3 pixels (the three stands for RGB channels) tf.keras.layers.Conv2D(kernel_size=3, filters=24, padding='same', activation='relu', input_shape=[192, 192, 3]), tf.keras.layers.Conv2D(kernel_size=3, filters=24, padding='same', activation='relu'), tf.keras.layers.MaxPooling2D(pool_size=2), tf.keras.layers.Conv2D(kernel_size=3, filters=12, padding='same', activation='relu'), tf.keras.layers.MaxPooling2D(pool_size=2), tf.keras.layers.Conv2D(kernel_size=3, filters=6, padding='same', activation='relu'), tf.keras.layers.Flatten(), # classifying into 5 categories tf.keras.layers.Dense(5, activation='softmax')])model.compile( optimizer='adam', loss= 'categorical_crossentropy', metrics=['accuracy'])
在搭建的過(guò)程中,必須在權(quán)重和偏差之間找到適當(dāng)?shù)钠胶恻c(diǎn),如果權(quán)重太大,神經(jīng)網(wǎng)絡(luò)可能無(wú)法代表復(fù)雜性,如果參數(shù)太多,可能導(dǎo)致過(guò)擬合。所以在在Keras中,用model.summary()函數(shù)顯示模型的結(jié)構(gòu)和參數(shù):
具體代碼地址:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/07_Keras_Flowers_TPU_playground.ipynb
在Keras中利用TPU組建現(xiàn)代卷積網(wǎng)絡(luò)和實(shí)現(xiàn)分類
之前三個(gè)實(shí)驗(yàn)已經(jīng)分別介紹了TPU、遷移學(xué)習(xí)和卷積網(wǎng)絡(luò),是不是已經(jīng)覺(jué)得很厲害了?別著急,最后的大招來(lái)了,本次實(shí)驗(yàn)我們將實(shí)現(xiàn)在Keras中利用TPU組建現(xiàn)代卷積網(wǎng)絡(luò)和實(shí)現(xiàn)分類。
現(xiàn)代卷積架構(gòu)(Modern convolutions networks)
簡(jiǎn)而言之,從"Inception" 和 "Inception v2"開(kāi)始的現(xiàn)代卷積網(wǎng)絡(luò)通常使用“模塊”,其中在同一輸入上同時(shí)嘗試不同的卷積層,它們的輸出被連接并且網(wǎng)絡(luò)通過(guò)訓(xùn)練決定哪個(gè)層是最有用的。
在Keras中,要?jiǎng)?chuàng)建數(shù)據(jù)流可以分支進(jìn)出的模型,必須使用“functional”模型。這是一個(gè)例子:
l = tf.keras.layers # syntax shortcuty = l.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu', input_shape=[192, 192, 3])(x) # x=input image# module start: branch outy1 = l.Conv2D(filters=32, kernel_size=1, padding='same', activation='relu')(y)y3 = l.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu')(y)y = l.concatenate([y1, y3]) # output now has 64 channels# module end: concatenation# many more layers ...# Create the model by specifying the input and output tensors.# Keras layers track their connections automatically so that's all that's needed.z = l.Dense(5, activation='softmax')(y)model = tf.keras.Model(x, z)
其他小技巧
小型3x3濾波器
在此圖中,你可以看到兩個(gè)連續(xù)3x3濾波器的結(jié)果。嘗試追溯哪些數(shù)據(jù)點(diǎn)對(duì)結(jié)果有貢獻(xiàn):這兩個(gè)連續(xù)的3x3濾波器計(jì)算5x5區(qū)域的某種組合。它與5x5濾波器計(jì)算的組合并不完全相同,但值得嘗試,因?yàn)閮蓚€(gè)連續(xù)的3x3濾波器比單個(gè)5x5濾波器效率更高。
1x1卷積?
在數(shù)學(xué)術(shù)語(yǔ)中,“1x1”卷積是常數(shù)的乘法,而不是非常有用的概念。但是,在卷積神經(jīng)網(wǎng)絡(luò)中,請(qǐng)記住濾波器應(yīng)用于數(shù)據(jù)立方體,而不僅僅是2D圖像。因此,“1x1”濾波器計(jì)算1x1數(shù)據(jù)列的加權(quán)和(參見(jiàn)圖示),當(dāng)你在數(shù)據(jù)中滑動(dòng)時(shí),你將獲得輸入通道的線性組合。這實(shí)際上很有用。如果你將通道視為單個(gè)過(guò)濾操作的結(jié)果,例如“貓耳朵”的過(guò)濾器,另一個(gè)用于“貓胡須”,第三個(gè)用于“貓眼睛”,則“1x1”卷積層將計(jì)算多個(gè)這些特征的可能線性組合,在尋找“貓”時(shí)可能很有用。
Squeezenet
將這些想法融合在一起的簡(jiǎn)單方法已在“Squeezenet”論文中展示,即一種僅使用1x1和3x3卷積層的卷積模塊設(shè)計(jì)。
https://arxiv.org/abs/1602.07360
基于“fire model”的squeezenet架構(gòu)。它們交替使用1x1層,在垂直維度上“擠壓”輸入數(shù)據(jù),然后是兩個(gè)并行的1x1和3x3卷積層,再次“擴(kuò)展”數(shù)據(jù)深度。
構(gòu)建一個(gè)受squeezenet啟發(fā)的卷積神經(jīng)網(wǎng)絡(luò)時(shí),我們就不能直接像上面一樣直接堆疊已有模塊,需要將模型代碼更改為Keras的“功能樣式”,來(lái)定義自己的模塊。
想要嘗試Squeezenet架構(gòu)練習(xí)的戳以下鏈接:
https://codelabs.developers.google.com/codelabs/keras-flowers-squeezenet/#6
最后,手把手教程運(yùn)行代碼如下:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/07_Keras_Flowers_TPU_playground.ipynb
最后,文摘菌再次給出四個(gè)實(shí)驗(yàn)的鏈接,供參考喲~
https://codelabs.developers.google.com/codelabs/keras-flowers-data/#2
https://codelabs.developers.google.com/codelabs/keras-flowers-transfer-learning/#2
https://codelabs.developers.google.com/codelabs/keras-flowers-convnets/#0
https://codelabs.developers.google.com/codelabs/keras-flowers-squeezenet/#0
此項(xiàng)目支持答疑,打開(kāi)下列網(wǎng)址提交你的問(wèn)題
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/07_Keras_Flowers_TPU_squeezenet.ipynb
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100720 -
分類器
+關(guān)注
關(guān)注
0文章
152瀏覽量
13180 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5500瀏覽量
121117
原文標(biāo)題:Colab超火的Keras/TPU深度學(xué)習(xí)免費(fèi)實(shí)戰(zhàn),有點(diǎn)Python基礎(chǔ)就能看懂的快速課程
文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論