深度學習(Deep Learning)是機器學習中一種基于對數據進行表征學習的方法。近年來,深度學習已經在科技界、工業界日益廣泛地應用。隨著全球各領域多樣化數據的極速積累和計算資源的成熟化商業服務,深度學習已經成為人工智能領域最有效的方法。
目前,深度學習技術在語音識別、圖像分類、商品推薦等各應用領域不斷刷新著智能處理水平紀錄。但是與此同時,深度學習模型難以解釋,參數調優困難,參數規模大訓練周期長等問題也困擾著研究和開發人員。
當下介紹深度學習的書籍很多,但是《深度學習實戰》一書視角不同,它重在實踐,內容全面。《深度學習實戰》英文版由O'REILLY出版社出版,中文版由機械工業出版社出版,作者Douwe Osinga曾供職于Google公司,是深度學習研究及實踐方面的一位資深專家。
、
點擊封面查看書籍詳情
在書中,所有的例子都是用Python編寫的,并且大部分代碼的實現都依賴于優秀的Keras框架,每章的代碼存放在一個notebook中,可以從網站下載學習。在實例章節,每章針對一種技術應用場景,從數據獲取技巧開始,接著是幾個完成本章目標的技巧和一個數據可視化的技巧。
文本處理領域
詞嵌入是自然語言處理的基本方法,我們首先在第3章將使用預先訓練好的詞嵌入模型計算單詞相似性,然后展示一些有趣的Word2vec數學特性,探索如何對高維空間進行可視化,接下來利用Word2vec等詞嵌入的語義特性進行特定領域中的排名。
推薦系統在商業領域應用廣泛,它基于先前收集到的用戶評級數據進行訓練。我們在第4章會使用新訓練的嵌入來預測電影的評論分數,基于維基百科傳出鏈接(outgoing link)構建一個簡單的電影推薦系統。
循環神經網絡是一類善于處理時間或序列的重要神經網絡,在文本處理中應用廣泛,我們在第5章使用RNN根據文本風格生成類似莎士比亞風格的文本,并對RNN的工作進行可視化。
智能客服會應用問答系統,其中關鍵一環是文本問題匹配,在第6章我們使用來自Stack Exchange網站的數據來構建整個問題的詞嵌入,然后使用Pandas從這些嵌入來匹配查找類似的文檔或問題。
在社交網絡中人們會為給定的一小段文本來推薦適用的表情符號,在第7章我們使用Twitter API實現推文收集,用貝葉斯分類器來闡述基線性能,還介紹卷積模型以及組合模型及模型調優方法。
之后,在第8章我們將介紹序列神經網絡來學習文本片段之間的轉換,從古騰堡項目(Project Gutenberg)的19世紀小說中提取對話,并利用seq2seq工具包來訓練聊天機器人。
圖像處理領域
深度學習技術在圖像識別和計算機視覺領域產生了比較深遠的影響。在圖像分類任務中,數十層(有時超過一百層)的神經網絡已被證明十分有效,訓練這樣的網絡需要極佳的處理能力和海量的訓練圖像。
在第9章我們將介紹如何加載預訓練網絡(該網絡是Keras提供的五個預訓練網絡之一),研究圖像輸入網絡之前所需要預處理過程,展示如何運行網絡的推理模式。針對其他任務的新數據進行部分的重新訓練也涵蓋了遷移學習(transfer learning)概念。
在網絡搜索中,可能有人會采取以圖搜圖模式。在第10章我們構建通過實例圖片來搜索圖的搜索引擎,我們研究如何查詢維基數據(Wikidata),并從維基百科中獲取適合的基礎圖片集開始著手。然后,我們將使用預訓練網絡為每個圖片賦值,我們將研究主成分分析(principal components analysis,PCA)作為可視化展現圖與圖之間關系的一種方法。
在現實世界中,我們往往需要從一幅圖像中檢測提取多個目標對象的信息,這是圖像處理中經典任務,也是一個十分活躍的研究領域,在Keras上的Python notebook中重現其中最先進的算法較為棘手。
在第11章我們使用Faster RCNN進行訓練完成目標檢測任務,Faster RCNN在用于訓練圖像分類器的同一個特征圖上并行訓練區域建議模型,而不是單獨處理區域建議問題。
使用計算機來“魔術”渲染圖像很有趣,在第12章我們將探討一些用于可視化展現卷積網絡進行圖像分類時所見內容的技術。
然后,我們將介紹尺度(octaves)、深度夢想(deep dreaming)技術、格拉姆矩陣(gram matrices)等,之后,我們進一步將這種技術應用于現有圖像,并采用文森特·梵高的名畫《星空》的繪畫風格渲染照片,使用兩種樣式的圖像渲染同一張圖片,從而獲得一個兩種風格之間的渲染結果。
基于實例生成圖像是一個熱門的研究領域,在該領域中每月都會涌現出新想法和新突破。
在第13章,我們將研究一個略有局限性的領域:手繪草圖,從Google的Quick Draw數據集開始著手,建立一個能夠學習“貓屬性”的自編碼器模型。我們還研究條件變分自編碼器(conditional variational autoencoders),它在訓練時會考慮圖像標簽,因此能夠以隨機樣式再現特定類的圖像。
在線搜索“免費圖標”可以得到很多搜索結果。但是,這些結果并不是真正免費的(即沒有任何使用限制的免費使用),大部分結果只是讓用戶感覺好像不需要花錢。此外,你還不能免費地重用這些圖標,并且通常情況下網站會強烈建議你購買它們。
因此,在第14章,我們使用條件變分自編碼器、生成式對抗網絡(generative adversarial network,GAN)、RNN三種深度網絡生成圖標,從如何下載、提取,并將圖標處理成可使用的標準格式。
音樂處理
語音識別和語音合成技術使得亞馬遜Alexa和GoogleHome成為可能,然而,語音處理任務實際上是在亞馬遜、Google或蘋果的數據中心運行的,因此我們還不認為這些是真正的深度學習試驗。盡管Mozilla的深度語音(Deep Speech)已取得了令人矚目的進步,建立最先進的語音識別系統還是十分困難的。
第15章關注的重點是音樂,我們從訓練音樂分類器模型開始,該模型可以告訴我們正在聽的是什么音樂。然后,我們使用模型結果建立本地MP3索引,使用Spotfy API建立公開播放列表語料庫,并用該庫建立音樂推薦系統。
最后,該書在第16章介紹了在實際生產系統中使用模型的內容,讓模型在真實的服務器或移動設備上運行。
近年,全球人工智能研究機構、研究院相繼成立,深度學習成為人工智能的核心必備工具。對于深度學習研究人員,特別是應用開發工程師而言,如何擺脫深度學習模型的“黑盒”困境、如何讓深度學習模型設計更加簡潔高效、如何將深度學習快速地應用到具體的業務領域,該書進行了詳細的介紹及代碼示例,在每個實例場景,作者還提供具有重要價值的實踐經驗提點。讀者如果想要進一步了解相關內容,可以參閱該書相關部分。
-
代碼
+關注
關注
30文章
4821瀏覽量
68890 -
深度學習
+關注
關注
73文章
5512瀏覽量
121404 -
數據可視化
+關注
關注
0文章
470瀏覽量
10345
原文標題:從代碼設計到應用開發,入坑深度學習看這本書就夠了
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論