色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ai真的到了嗎,這些業(yè)界的人都看不懂的問(wèn)題,你怎么看

mK5P_AItists ? 來(lái)源:未知 ? 作者:龔婷 ? 2018-03-19 10:08 ? 次閱讀

今天,OpenAI在官方博客上丟出了7個(gè)研究過(guò)程中發(fā)現(xiàn)的未解決問(wèn)題。

OpenAI希望這些問(wèn)題能夠成為新手入坑AI的一種有趣而有意義的方式,也幫助從業(yè)者提升技能。

OpenAI版AI界七大未解之謎,現(xiàn)在正式揭曉——

丨1. Slitherin

難度指數(shù):☆☆

實(shí)現(xiàn)并解決貪吃蛇的多玩家版克隆作為Gym環(huán)境。

環(huán)境:場(chǎng)地很大,里面有多條蛇,蛇通過(guò)吃隨機(jī)出現(xiàn)的水果生長(zhǎng),一條蛇在與另一條蛇、自己或墻壁相撞時(shí)即死亡,當(dāng)所有的蛇都死了,游戲結(jié)束。

智能體:使用自己選擇的自我對(duì)弈的RL算法解決環(huán)境問(wèn)題。你需要嘗試各種方法克服自我對(duì)弈的不穩(wěn)定性。

檢查學(xué)習(xí)行為:智能體是否學(xué)會(huì)了適時(shí)捕捉食物并避開(kāi)其他蛇類?是否學(xué)會(huì)了攻擊、陷害、或者聯(lián)合起來(lái)對(duì)付競(jìng)爭(zhēng)對(duì)手?

丨2. 分布式強(qiáng)化學(xué)習(xí)中的參數(shù)平均

難度指數(shù):☆☆☆

這指的是探究參數(shù)平均方案對(duì)RL算法中樣本復(fù)雜度和通信量影響。一種簡(jiǎn)單的解決方法是平均每個(gè)更新的每個(gè)worker的梯度,但也可以通過(guò)獨(dú)立地更新worker、減少平均參數(shù)節(jié)省通信帶寬。

這樣做還有一個(gè)好處:在任何給定的時(shí)間內(nèi),我們都有不同參數(shù)的智能體,可能出現(xiàn)更好的探測(cè)行為。另一種可能是使用EASGD這樣的算法,它可以在每次更新時(shí)將參數(shù)部分結(jié)合在一起。

丨3. 通過(guò)生成模型完成的不同游戲中的遷移學(xué)習(xí)

難度指數(shù):☆☆☆

這個(gè)流程如下:

訓(xùn)練11個(gè)Atari游戲的策略。從每個(gè)游戲的策略中,生成1萬(wàn)個(gè)軌跡,每個(gè)軌跡包含1000步行動(dòng)。

將一個(gè)生成模型(如論文Attention Is All You Need提出的Transformer)與10個(gè)游戲產(chǎn)生的軌跡相匹配。

然后,在第11場(chǎng)比賽中微調(diào)上述模型。

你的目標(biāo)是量化10場(chǎng)比賽預(yù)訓(xùn)練時(shí)的好處。這個(gè)模型需要什么程度的訓(xùn)練才能發(fā)揮作用?當(dāng)?shù)?1個(gè)游戲的數(shù)據(jù)量減少10x時(shí),效果的大小如何變化?如果縮小100x呢?

丨4. 線性注意Transformer

難度指數(shù):☆☆☆

Transformer模型使用的是softmax中的軟注意力(soft attention)。如果可以使用線性注意力(linear attention),我們就能將得到的模型用于強(qiáng)化學(xué)習(xí)。

具體來(lái)說(shuō),在復(fù)雜環(huán)境下使用Transformer部署RL不切實(shí)際,但運(yùn)行一個(gè)具有快速權(quán)重(fast weight)的RNN可行。

你的目標(biāo)是接受任何語(yǔ)言建模任務(wù),訓(xùn)練Transformer,然后找到一種在不增加參數(shù)總數(shù)情況下,用具有不同超參數(shù)的線性注意Transformer獲取每個(gè)字符/字的相同位元的方法。

先給你潑盆冷水:這可能是無(wú)法實(shí)現(xiàn)的。再給你一個(gè)潛在的有用提示,與使用softmax注意力相比,線性注意轉(zhuǎn)化器很可能需要更高的維度key/value向量,這能在不顯著增加參數(shù)數(shù)量的情況下完成。

丨5. 已學(xué)習(xí)數(shù)據(jù)的擴(kuò)充

難度指數(shù):☆☆☆

可以用學(xué)習(xí)過(guò)的數(shù)據(jù)VAE執(zhí)行“已學(xué)習(xí)數(shù)據(jù)的擴(kuò)充”。

我們首先可能需要在輸入數(shù)據(jù)上訓(xùn)練一個(gè)VAE,然后將每個(gè)訓(xùn)練點(diǎn)編碼到一個(gè)潛在的空間,之后在其中應(yīng)用一個(gè)簡(jiǎn)單(如高斯)擾動(dòng),最后解碼回到觀察的空間。用這種方法是否能得到更好的泛化,目前還是一個(gè)謎題。

這種數(shù)據(jù)擴(kuò)充的一個(gè)潛在優(yōu)勢(shì)是,它可能包含視角變換、場(chǎng)景光纖變化等很多非線性

轉(zhuǎn)換。

丨6. 強(qiáng)化學(xué)習(xí)中的正則化

難度指數(shù):☆☆☆☆

這指的是實(shí)驗(yàn)性研究和定性解釋不同正則化方法對(duì)RL算法的影響。

在監(jiān)督學(xué)習(xí)中,正則化對(duì)于優(yōu)化模型和防止過(guò)擬合具有極其重要的意義,其中包含一些效果很贊的方法,如dropout、批標(biāo)準(zhǔn)化和L2正則化等。

然而,在策略梯度和Q-learning等強(qiáng)化學(xué)習(xí)算法上,研究人員還沒(méi)有找到合適的正則化方法。順便說(shuō)一下,人們?cè)赗L中使用的模型要比在監(jiān)督學(xué)習(xí)中使用的模型小得多,因?yàn)榇竽P捅憩F(xiàn)更差。

丨7. Olympiad Inequality問(wèn)題的自動(dòng)解決方案

難度指數(shù):☆☆☆☆☆

Olympiad Inequality問(wèn)題很容易表達(dá),但解決這個(gè)問(wèn)題往往需要巧妙的手法。

建立一個(gè)關(guān)于Olympiad Inequality問(wèn)題的數(shù)據(jù)集,編寫(xiě)一個(gè)可以解決大部分問(wèn)題的程序。目前還不清楚機(jī)器學(xué)習(xí)在這里是否有用,但你可以用一個(gè)學(xué)習(xí)的策略減少分支因素。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30805

    瀏覽量

    268934
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47229

    瀏覽量

    238329

原文標(biāo)題:AI界的七大未解之謎:OpenAI丟出一組AI研究課題

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    快恢復(fù)二極管選型參數(shù)怎么看?常用型號(hào)有哪些?

    快恢復(fù)二極管選型參數(shù)怎么看?常用型號(hào)有哪些?
    的頭像 發(fā)表于 11-14 17:30 ?428次閱讀
    快恢復(fù)二極管選型參數(shù)<b class='flag-5'>怎么看</b>?常用型號(hào)有哪些?

    TPA3112用tina仿真后面的揚(yáng)聲器怎么看發(fā)出的聲音怎么樣?

    TPA3112用tina仿真后面的揚(yáng)聲器怎么看發(fā)出的聲音怎么樣啊
    發(fā)表于 11-04 07:29

    求電氣圖講解,剛接觸電氣圖,看不懂圖紙

    電氣圖講解,剛接觸電氣圖,看不懂圖紙,有無(wú)老師能簡(jiǎn)要講解一下各部分
    發(fā)表于 10-13 21:33

    請(qǐng)問(wèn)AD657的共模和差模輸入電容怎么看

    如題,AD657的共模和差模輸入電容怎么看??輸入阻抗是10的12次方歐姆, 輸入電容是5.2pf??
    發(fā)表于 09-06 07:07

    防雷器件有哪些?防雷器等級(jí)型號(hào)怎么看

    防雷器件有哪些?防雷器等級(jí)型號(hào)怎么看
    的頭像 發(fā)表于 07-31 15:05 ?1059次閱讀

    三星貼片電容的批次號(hào)怎么看

    三星貼片電容的批次號(hào)怎么看?在這個(gè)問(wèn)題之前我們先普及一下,怎么分辨三星貼片電容是不是正品?
    的頭像 發(fā)表于 07-31 14:10 ?448次閱讀
    三星貼片電容的批次號(hào)<b class='flag-5'>怎么看</b>?

    STM32H745BIT6單片機(jī)怎么看哪個(gè)引腳配置哪個(gè)內(nèi)核?

    STM32H745BIT6單片機(jī)怎么看哪個(gè)引腳配置哪個(gè)內(nèi)核啊,在數(shù)
    發(fā)表于 07-03 07:38

    三星貼片電容怎么看電壓呢?電壓的方式有哪些?

    對(duì)于三星貼片電容怎么看參數(shù)呢?現(xiàn)在看三星貼片電容的電壓參數(shù)的方式也是比較多的,今天給大家分享兩種,三星貼片電容電壓的方式吧。其實(shí)對(duì)于懂技術(shù)的人員直接三星貼片電容的外面參數(shù)就能夠知道
    的頭像 發(fā)表于 06-19 15:29 ?507次閱讀

    車路云協(xié)同,這次它真的來(lái)了嗎

    ,前些年搞得沸沸揚(yáng)揚(yáng),但是最終都很難落地。想必也發(fā)現(xiàn)了:短短幾天時(shí)間,多地密集傳來(lái)車路云一體化布局新進(jìn)展。難道它真的來(lái)了嗎?北京5月31日,北京市公共資源交易服務(wù)平臺(tái)
    的頭像 發(fā)表于 06-13 08:25 ?510次閱讀
    車路云協(xié)同,這次它<b class='flag-5'>真的</b>來(lái)<b class='flag-5'>了嗎</b>?

    降價(jià)潮背后:大模型落地門檻真的了嗎

    “比起價(jià)格門檻,AI大模型的應(yīng)用門檻,更難跨越。”大模型爭(zhēng)相降價(jià)下,AI應(yīng)用的門檻真的降低了嗎?答案還真不一定。因?yàn)槌藘r(jià)格門檻,AI大模型
    的頭像 發(fā)表于 06-13 08:04 ?275次閱讀
    降價(jià)潮背后:大模型落地門檻<b class='flag-5'>真的</b>降<b class='flag-5'>了嗎</b>?

    求助,求大神幫忙解答下AN65974同步Slave FIFO的讀時(shí)序

    你好,在AN65974文檔中,我看不懂同步Slave FIFO的讀時(shí)序,可以給我解讀一下么? 下圖中有我標(biāo)注的我不懂的問(wèn)題。非常感謝你!......
    發(fā)表于 05-31 06:27

    關(guān)于超聲波水表的單片機(jī)原理圖

    大佬們求解~越詳細(xì)越好,小白真的看不懂這個(gè)原理圖啊!!
    發(fā)表于 03-20 15:10

    stm32f1如何控制SI4463?

    4463的寄存器太多了額,說(shuō)明還只有英文版的,真是看不懂,不過(guò)有一個(gè)WDS軟件,便于快速配置。對(duì)于我這種菜鳥(niǎo)來(lái)說(shuō)也比較困難。希望大神指教WDS生成出來(lái)的代碼怎么搞到KEIL中去或者給個(gè)STM32的例程也可以。謝謝了
    發(fā)表于 03-11 07:05

    請(qǐng)問(wèn)XMC1404如何產(chǎn)生PWM信號(hào)?

    我只需要原理圖就行 不需要程序 只想知道接什么引腳可以讓XMC1404芯片產(chǎn)生PWM信號(hào) 以及信號(hào)從哪個(gè)引腳出來(lái)救救孩子的畢設(shè)英飛凌中文資料太少了我真的看不懂嗚嗚嗚
    發(fā)表于 02-18 08:51

    電氣圖看不懂,還搞啥電氣?

    用圖形符號(hào)并按工作順序排列,詳細(xì)表示電路、設(shè)備或成套裝置的全部組成和連接關(guān)系,而不考慮其實(shí)際位置的一種簡(jiǎn)圖。目的是便于詳細(xì)理解作用原理、分析和計(jì)算電路特性。
    的頭像 發(fā)表于 01-14 10:43 ?1113次閱讀
    電氣圖<b class='flag-5'>都</b><b class='flag-5'>看不懂</b>,還搞啥電氣?
    主站蜘蛛池模板: 亚洲国产在线精品国| 国产人妻麻豆蜜桃色精| 蜜桃成人在线| 亚洲日本va中文字幕久久| 国产精品视频大全| 四虎视频最新视频在线观看| 抽插H浊水H嫩B父皇| 人妖操女人| 白丝萝莉喷水| 日本无码人妻丰满熟妇5G影院| a视频免费在线| 欧美日韩另类在线专区| china年轻小帅脸直播飞机| 牛牛自拍国产免费视频| 69精品人妻一区二区三区蜜桃| 恋夜秀场支持安卓版全部视频国产 | z0000性欧美| 欧美精品专区第1页| caoporn 超碰免费视频| 泡妞高手在都市完整版视频免费| blacked黑人战小美女| 欧美午夜精品久久久久久浪潮| brazzers欧美最新版视频| 飘雪在线观看免费高清完整版韩国| avtt一区| 人和拘一级毛片| 高清国产在线观看| 私人玩物黑丝| 国产偷国产偷亚州清高| 亚洲精品久久一区二区三区四区| 簧片免费观看| 在线观看qvod| 男女全黄h全肉细节文| 超大号黑吊magnet| 色欲AV亚洲情无码AV蜜桃| 国产精品久久婷婷五月色| 亚洲.日韩.欧美另类| 精品久久伊人| 91系列在线观看免费| 琪琪色原网站ying| 国产成人教育视频在线观看|