色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CVPR 2018 上10篇最酷論文,渴望進步的人都在看

8g3K_AI_Thinker ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-09 09:07 ? 次閱讀

▌前言

作為計算機視覺領域的頂級會議,2018年的計算機視覺和模式識別會議(CVPR) 上周在美國鹽湖城舉行。今年的 CVPR共收到3300份來稿并接收了其中的979份。超過6500人參加了今年的會議,這間容納6500人的房間座無虛席,堪稱是一屆史詩般的盛會:

每年的 CVPR都會吸引眾多優(yōu)秀的人才和他們最新的研究成果,總可以看到學到新的東西。當然還有那些發(fā)表了最新并具有突破性成果的論文,為該領域帶來很棒的新知識。這些論文經(jīng)常在計算機視覺的許多子領域形成最新的技術。

最近,我們看到了一些開箱即用且富有創(chuàng)意的論文!隨著最近深度學習在計算機視覺領域的突破性進展,我們仍然在探索并發(fā)現(xiàn)一切未知的可能性。許多論文展示了深度神經(jīng)網(wǎng)絡在計算機視覺領域中的全新應用。它們可能不是最根本的開創(chuàng)性作品,但就它們從新穎有趣的角度呈現(xiàn)出全新的想法,為相關領域提供了創(chuàng)造性和啟發(fā)性的視角。總而言之,這些都是非常酷的作品!

在這里,我將展示我認為在本屆 CVPR上最酷的10篇論文。我們將看到最近使用深度網(wǎng)絡實現(xiàn)的一些新應用,以及如何進一步使用它們。你可以在閱讀過程中根據(jù)自己的喜好選擇性地進行閱讀。讓我們開始吧!

▌Training Deep Networks with Synthetic Data: Bridging the Reality Gap by Domain Randomization(用合成數(shù)據(jù)訓練深度網(wǎng)絡:通過領域隨機化來彌合現(xiàn)實差距)

這篇論文出自Nvidia團隊的研究,使用合成數(shù)據(jù)來訓練卷積神經(jīng)網(wǎng)絡(CNN)。 他們?yōu)樘摶靡?Unreal Engine 4) 創(chuàng)建了一個插件用于生成合成的訓練數(shù)據(jù)。這項研究的關鍵在于他們對訓練數(shù)據(jù)進行了隨機化,使其能夠包含多種變量,包括:

目標的數(shù)量和類型

干擾物的數(shù)量,類型,顏色和尺度

感興趣物體的紋理特征及圖片的背景

虛擬攝像機相對于場景的位置

相機相對于場景的角度

光點的數(shù)量和位置

他們展示了一些非常有前途的實驗結果,證明了合成數(shù)據(jù)預訓練的有效性,這是先前研究從未實現(xiàn)過的結果。如果你之前并不了解這個重要知識的話,那么這項研究將會啟發(fā)你如何生成并使用合成數(shù)據(jù)。

▌WESPE: Weakly Supervised Photo Enhancer for Digital?Cameras(WESPE:用于數(shù)碼相機的弱監(jiān)督照片增強器)

這項研究通過訓練生成對抗網(wǎng)絡(GAN) 來從美學上自動化增強圖片。該研究最酷的地方在于以一種弱監(jiān)督的方式:你不需要輸入-輸出的圖像對。訓練網(wǎng)絡時,你只需要一組“好看”的圖像(用于輸出基礎事實) 和一組想要增強的“不好看”的圖像(用于輸入圖像)。然后,通過訓練GAN產(chǎn)生輸入圖像的增強版本,通常所生成的圖像會極大地增強原圖像的顏色和對比度。

由于不需要精確的圖像對,因而你能夠快捷方便地使用這個圖像增強器。我喜歡這項研究的原因主要是因為它是一種弱監(jiān)督的方法。雖然我們離無監(jiān)督學習似乎還很遙遠,但對計算機視覺的許多子領域而言,弱監(jiān)督學習似乎是一個充滿希望且值得研究的方向。

▌Efficient Interactive Annotation of Segmentation Datasets with Polygon-RNN++(用Polygon-RNN ++對圖像分割數(shù)據(jù)集進行高效地交互式標注)

深度神經(jīng)網(wǎng)絡之所以能夠表現(xiàn)出如此強大性能的主要原因之一是大型且完全帶標注的可用的數(shù)據(jù)集。然而,對于許多計算機視覺任務而言,這樣的數(shù)據(jù)既費時又昂貴。特別對于圖像分割任務而言,我們需要對圖像中的每個像素進行類別標注,你可以想象其中的困難性有多大!

Polygon-RNN ++這項研究允許研究者只需在圖像中每個目標周圍設置粗糙的多邊形點,然后該網(wǎng)絡能夠自動生成圖像分割所需的標注信息!本文研究表明這種方法能夠在實際應用中很好地推廣,并可以用來為分段任務創(chuàng)建快速簡便的數(shù)據(jù)標注!

▌Creating Capsule Wardrobes from Fashion?Images

(從時尚配圖中創(chuàng)造自己的衣柜)

“嗯,我今天應該穿什么?”如果有人能夠每天早上為你解決這個問題,那將再好不過了。

本文研究中,作者設計了一種模型,基于給定的候選服裝和配件清單,模型通過收集一組最小的項目集,提供最全面的服裝混合搭配的方案。研究中模型使用目標函數(shù)進行訓練,這些目標函數(shù)旨在捕獲視覺兼容性,多功能性及特定用戶的偏好等關鍵要素。有了這種衣柜 (Capsule Wardrobes),你可以輕松從衣櫥中挑選最佳的服裝搭配。

▌Super SloMo: High Quality Estimation of Multiple Intermediate Frames for Video Interpolation (Super SloMo:視頻插值中多個中間幀的高質量估計)

你曾經(jīng)是否想過以超慢的動作拍攝超級酷炫的東西呢?Nvdia的這項研究 Super SloMo就能幫你實現(xiàn)!研究中他們使用 CNN估計視頻的中間幀,并能將標準的30fps視頻轉換為240fps的慢動作!該模型估計視頻中間幀之間的光流信息,并在這些信息中間插入視頻幀,使慢動作的視頻看起來也能清晰銳利。

▌Who Let The Dogs Out? Modeling Dog Behavior From Visual?Data(用視覺數(shù)據(jù)構建狗的行為模型)

這可能是有史以來最酷的研究論文!這項研究的想法是試圖模擬狗的思想和行為。研究人員將許多傳感器連接到狗的四肢以收集其運動和行為數(shù)據(jù);。此外,他們還在狗的頭部安裝一個攝像頭,以便從狗的視角獲取相應的運動信息。然后,將一組CNN特征提取器用于從視頻幀獲取圖像特征,并將其與傳感器數(shù)據(jù)一起傳遞給一組LSTM模型,以便學習并預測狗的動作和行為。這是一項非常新穎而富有創(chuàng)造性的應用研究,其整體的任務框架及獨特的執(zhí)行方式都是本文的亮點!希望這項研究能夠為我們未來收集數(shù)據(jù)和應用深度學習技術的方式帶來更多的創(chuàng)造力。

▌Learning to Segment Every?Thing(學習分割一切)

在過去的幾年里,何凱明團隊 (以前在微軟研究院,現(xiàn)就職于 Facebook AI Research) 提出了許多重大的計算機視覺研究成果。他們的研究最棒之處在于將創(chuàng)造力和簡單性相結合,諸如將 ResNets和Mask R-CNN相結合的研究,這些都不是最瘋狂或最復雜的研究思路,但是它們簡單易行,并在實踐中非常有效。

該團隊最新的研究 Learning to Segment Every Thing是 Mask R-CNN研究的擴展,它使模型準確地分割訓練期間未出現(xiàn)的類別目標!這對于獲取快速且廉價的分割數(shù)據(jù)標注是非常有用的。事實上,該研究能夠獲得一些未知目標的基準分割效果(baseline segment),這對于在自然條件中部署這樣的分割模型來說是至關重要的,因為在這樣的環(huán)境下可能存在許多未知的目標。總的來說,這絕對是我們思考如何充分利用深層神經(jīng)網(wǎng)絡模型的正確方向。

▌Soccer on Your?Tabletop(桌上足球)

本文的研究是在FIFA世界杯開幕時正式發(fā)表的,理應獲得最佳時機獎!這的確是CVPR上在計算機視覺領域的“更酷”應用之一。簡而言之,作者訓練了一個模型,在給定足球比賽視頻的情況下,該模型能夠輸出相應視頻的動態(tài)3D重建,這意味著你可以利用增強現(xiàn)實技術在任何地方查看它!

本文最大的亮點是結合使用許多不同類型的信息。使用視頻比賽數(shù)據(jù)訓練網(wǎng)絡,從而相當容易地提取3D網(wǎng)格信息。在測試時,提取運動員的邊界框,姿勢及跨越多個幀的運動軌跡以便分割運動員。接著你可以輕松地將這些3D片段投射到任何平面上。在這種情況下,你可以通過制作虛擬的足球場,以便在 AR條件下觀看的足球比賽!在我看來,這是一種使用合成數(shù)據(jù)進行訓練的方法。無論如何它都是一個有趣的應用程序!

▌LayoutNet: Reconstructing the 3D Room Layout from a Single RGBImage(LayoutNet:從單個RGB圖像重建3D房間布局)

這是一個計算機視覺的應用程序,我們可能曾經(jīng)想過:使用相機拍攝某些東西,然后用數(shù)字3D技術重建它。這也正是本文研究的目的,特別是重建 3D房間布局。研究人員使用全景圖像作為網(wǎng)絡的輸入,以獲得房間的完整視圖。網(wǎng)絡的輸出是3D重建后的房間布局,具有相當高的準確性!該模型足夠強大,可以推廣到不同形狀、包含許多不同家具的房間。這是一個有趣而好玩、又不需要投入太多研究人員就能實現(xiàn)的應用程序。

▌Learning Transferable Architectures for Scalable Image Recognition (學習可遷移的結構用于可擴展的圖像識別任務)

最后要介紹的是一項許多人都認為是深度學習未來的研究:神經(jīng)架構搜索(NAS)。NAS背后的基本思想是我們可以使用另一個網(wǎng)絡來“搜索”最佳的模型結構,而不需要手動地設計網(wǎng)絡結構。結構搜索過程是基于獎勵函數(shù)進行的,通過獎勵模型以使其在驗證數(shù)據(jù)集上有良好的表現(xiàn)。此外,作者在論文中表明,這種模型結構比起手動設計的模型能夠獲得更高的精度。這將是未來巨大的研究方向,特別是對于設計特定的應用程序而言。因為我們真正關注的是設計好的NAS算法,而不是為我們特定的應用設計特定的網(wǎng)絡。精心設計的NAS算法將足夠靈活,并能夠為任何任務找到良好的網(wǎng)絡結構。

▌結束語

希望你能從中學到一些新的、有用的東西,甚至能夠為你自己的研究與工作找到一些新的想法!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2885

    瀏覽量

    107599
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121220
  • cnn
    cnn
    +關注

    關注

    3

    文章

    352

    瀏覽量

    22237

原文標題:CVPR 2018 上10篇最酷論文,圈兒里最Cool的人都在看

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    進步電機實驗

    進步電機實驗
    發(fā)表于 12-10 15:26 ?0次下載

    ADS1255無論輸入的電壓是多少伏,ADC采集到的數(shù)據(jù),基本低16位都在波動,為什么?

    硬件使用的是AIN0/AIN1,PGA沒有放大,無論輸入的電壓是多少伏,ADC采集到的數(shù)據(jù),基本低16位都在波動,這個是不是程序哪里設置不對啊
    發(fā)表于 12-09 06:15

    在macOS Sierra安裝Pro Tools 10

    在 macOS Sierra 安裝 Pro Tools 10?
    發(fā)表于 11-25 14:48 ?0次下載

    NVIDIA Research在ECCV 2024展示多項創(chuàng)新成果

    在米蘭舉行的歐洲計算機視覺國際會議 (ECCV) ,NVIDIA Research 展示了多項突破性的創(chuàng)新成果,共發(fā)表了 14 論文
    的頭像 發(fā)表于 11-19 15:07 ?321次閱讀

    TLV3254能不能收聽到半徑8到10的人說話的聲音?

    能不能收聽到半徑8到10的人說話的聲音,信噪比實在太低了,遠處的聽不清,增益縮小了又聽不到的遠處的聲音?
    發(fā)表于 10-24 06:34

    TPS7A63xx-Q1配置可在看門狗時實現(xiàn)長復位脈沖寬度

    電子發(fā)燒友網(wǎng)站提供《TPS7A63xx-Q1配置可在看門狗時實現(xiàn)長復位脈沖寬度.pdf》資料免費下載
    發(fā)表于 10-09 14:29 ?0次下載
    TPS7A63xx-Q1配置可<b class='flag-5'>在看</b>門狗時實現(xiàn)長復位脈沖寬度

    蘋果承認使用谷歌芯片來訓練AI

    蘋果公司最近在一技術論文中披露,其先進的人工智能系統(tǒng)Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片完成預訓練的。這一消息標志著在尖端AI訓練領域
    的頭像 發(fā)表于 07-30 17:03 ?739次閱讀

    地平線科研論文入選國際計算機視覺頂會ECCV 2024

    近日,地平線兩論文入選國際計算機視覺頂會ECCV 2024,自動駕駛算法技術再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?931次閱讀
    地平線科研<b class='flag-5'>論文</b>入選國際計算機視覺頂會ECCV 2024

    芯動力科技論文入選ISCA 2024,與國際巨頭同臺交流研究成果

    布宜諾斯艾利斯舉行的ISCA 2024會議發(fā)表演講,與Intel、AMD等國際知名企業(yè)同臺交流。 本屆ISCA共收到來自全球423高質量論文投稿,經(jīng)過嚴謹?shù)脑u審流程
    的頭像 發(fā)表于 07-18 11:16 ?572次閱讀
    芯動力科技<b class='flag-5'>論文</b>入選ISCA 2024,與國際巨頭同臺交流研究成果

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲了一年前就掛在arXiv的一項研究。開源的那種。
    的頭像 發(fā)表于 07-16 18:29 ?597次閱讀
    谷歌DeepMind被曝抄襲開源成果,<b class='flag-5'>論文</b>還中了頂流會議

    OpenCV攜Orbbec 3D相機亮相CVPR 2024,加速AI視覺創(chuàng)新

    在科技發(fā)展的浪潮中,一年一度的IEEE國際計算機視覺與模式識別會議(CVPR)無疑是視覺技術領域的一大盛事。今年的CVPR 2024于6月17日至21日在美國西雅圖盛大舉行,吸引了全球超過1.2萬名參會者,這一數(shù)字打破了歷史記錄,讓此次盛會成為了“史上最火爆的
    的頭像 發(fā)表于 06-21 10:15 ?625次閱讀

    OpenCV攜奧比中光3D相機亮相CVPR 2024

    6月17日-21日,奧比中光合作伙伴OpenCV攜Orbbec 3D相機參展在美國西雅圖舉辦的CVPR 2024(即IEEE國際計算機視覺與模式識別會議),讓開發(fā)者親身體驗Orbbec 3D相機
    的頭像 發(fā)表于 06-21 09:38 ?584次閱讀

    【干貨】電子工程師都在看的電學公式大全!

    電路功率放大器
    Aigtek安泰電子
    發(fā)布于 :2024年04月23日 16:58:07

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領域頂會CVPR公布了最終的論文接收結果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2D Detection-Guided Query Anchors》入選
    的頭像 發(fā)表于 02-27 16:38 ?1153次閱讀
    Nullmax提出多相機3D目標檢測新方法QAF2D

    光纖技術的進步方向在哪里?19芯光纖是世界最快的嗎?

    光纖技術的進步方向在哪里?高速光通訊牽引力度大。
    的頭像 發(fā)表于 02-22 10:43 ?746次閱讀
    主站蜘蛛池模板: 国产亚洲精品黑人粗大精选| 美女撒尿无遮挡免费中国| 日本高清免费在线| 成人在线视频免费| 亚洲 综合 自拍 精品 在线| 久久草福利自拍视频在线观看| 92电影网午夜福利| 熟妇的味道HD中文字幕 | 国产精品欧美亚洲| 樱桃bt在线www| 日本精品久久无码影院| 国产情侣真实露脸在线| 最近中文字幕无吗免费高清| 日欧一片内射VA在线影院| 护士们的母狗| jk白丝袜美女被男人桶| 亚洲精品国偷拍自产在线| 暖暖日本手机免费完整版在线观看| 国产成人免费| 2020亚洲色噜噜狠狠网站| 乌克兰粉嫩摘花第一次| 沦为公交两奶头春药高潮迭起| 国产AV无码一二三区视频| 折磨比基尼美女挠肚子| 偷窥欧美wc经典tv| 免费女性裸身照无遮挡网站| 国产人妻麻豆蜜桃色| 9位美女厕所撒尿11分| 亚洲裸舞 hd| 乳液全集电影在线观看| 浪货嗯啊趴下NP粗口黄暴| 国产精品人妻无码久久久蜜桃臀| 97超在线视频| 亚洲人女同志video| 色综合久久中文色婷婷| 暖暖 视频 免费 高清 在线观看| 狠狠色狠狠色综合日日92| 顶级欧美不卡一区二区三区| 91麻豆精品国产一级| 亚洲免费成人| 校花娇喘呻吟校长陈若雪视频|