傳統(tǒng)上,強化學習在人工智能領域占據(jù)著一個合適的地位。但強化學習在過去幾年已開始在很多人工智能計劃中發(fā)揮更大的作用。其最佳的應用點在于計算艾真體(agent)在環(huán)境上情境化的決策場景中要采取的最佳行動。
強化學習非常適合自主決策,因為單靠監(jiān)督學習或無監(jiān)督學習技術無法完成任務。
傳統(tǒng)上,強化學習在人工智能領域占據(jù)著一個合適的地位。但強化學習在過去幾年已開始在很多人工智能計劃中發(fā)揮更大的作用。其最佳的應用點在于計算艾真體(agent)在環(huán)境上情境化的決策場景中要采取的最佳行動。
強化學習使用試錯法將算法獎勵函數(shù)最大化,它非常適用于IT運營管理、能源、醫(yī)療保健、商業(yè)、金融、交通和金融領域的很多自適應控制和艾真體自動化應用。它用來訓練人工智能,它為傳統(tǒng)的重點領域提供支持——機器人技術、游戲和模擬——以及邊緣分析、自然語言處理、機器翻譯、計算機視覺和數(shù)字助理等新一代人工智能解決方案。
強化學習也是物聯(lián)網(wǎng)中自主邊緣應用程序開發(fā)的基礎。很多邊緣應用程序的開發(fā)(工業(yè)、交通、醫(yī)療和消費應用)涉及對注入了人工智能的機器人技術的構建,這些技術可以在動態(tài)環(huán)境條件下以不同程度的情境自主性進行操作。
強化學習如何工作
在這樣的應用領域中,邊緣設備的人工智能大腦必須依賴強化學習,由于在這里缺少預先存在的“真實值(ground truth)”訓練數(shù)據(jù)集,他們試圖將累計獎勵函數(shù)最大化,例如根據(jù)規(guī)范中包含的一組標準組裝一個生產(chǎn)組件。這與其它類型的人工智能的學習方式形成對比,后者要么是(像監(jiān)督學習一樣)對相對于真實值數(shù)據(jù)的算法上的損失函數(shù)進行最小化,要么(像無監(jiān)督學習一樣)對數(shù)據(jù)點之間的距離函數(shù)進行最小化。
但是,這些人工智能學習方法不一定是孤島。最有趣的人工智能趨勢之一是強化學習與更高級的應用程序中的監(jiān)督學習和無監(jiān)督學習的融合。人工智能開發(fā)人員將這些方法融入到僅憑單一的學習方法不足為用的應用程序中。
例如,監(jiān)督學習本身在沒有標記的訓練數(shù)據(jù)的情況下是無用的,在自動駕駛這樣的應用中往往缺乏標記的訓練數(shù)據(jù),在這里,每個瞬時的環(huán)境情況本質(zhì)上都是未標記且獨特的。同樣,無監(jiān)督學習(使用聚類分析來檢測傳感器饋源和其它復雜的未標記數(shù)據(jù)中的模式)并非用來發(fā)現(xiàn)智能終端在真實世界的決策場景中應采取的最佳操作。
什么是深度強化學習
然后是深層強化學習,這是一種領先的技術,在這種技術中,自治的艾真體(autonomous agent)使用強化學習的試錯算法和累計獎勵函數(shù)來加速神經(jīng)網(wǎng)絡設計。這些設計為很多依靠監(jiān)督和/或無監(jiān)督學習的人工智能應用程序提供支持。
深度強化學習是人工智能開發(fā)和培訓管道自動化的核心重點領域。它涉及對強化學習驅(qū)動的艾真體的使用,以快速探索與無數(shù)體系結構、節(jié)點類型、連接、超參數(shù)設置相關的性能權衡,以及對深度學習、機器學習和其他人工智能模型設計人員可用的其它選擇。
例如,研究人員正在使用深度強化學習來快速確定哪一種深度學習卷積神經(jīng)網(wǎng)絡(CNN)架構可能用于解決特征工程、計算機視覺和圖像分類中的各種難題。人工智能工具可能會使用從深度強化學習獲得的結果來自動生成最佳CNN,使用TensorFlow、MXNet或PyTorch等深度學習開發(fā)工具來完成該任務。
在這方面,看到強化學習發(fā)展和培訓的開放框架的出現(xiàn)是鼓舞人心的。你在探索深度強化學習時可能需要探索下面這些強化學習框架,這些框架利用、擴展并與TensorFlow和其它深度學習和機器學習建模工具接合,這些工具已得到廣泛采用:
強化學習
人工智能開發(fā)人員需要的強化學習技能
展望未來,人工智能開發(fā)人員將需要沉浸在這些框架和其它框架中實施的各種強化學習算法中。你還需要加深對多艾真體強化學習架構的理解,這其中有很多架構大量利用老牌的博弈論研究機構。你還要熟悉深度強化學習,以此來發(fā)現(xiàn)計算機視覺應用中與名為“模糊”的攻擊方法相關的安全漏洞。
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238247
原文標題:什么是深度強化學習:人工智能和深度學習的下一步
文章出處:【微信號:D1Net08,微信公眾號:AI人工智能D1net】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論