色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓tSNE在大型、高維數(shù)據(jù)庫上實時進行可視化的詳細資料概述

zhKF_jqr_AI ? 來源:未知 ? 作者:易水寒 ? 2018-06-10 10:06 ? 次閱讀

tSNE是目前最為流行的一種高維數(shù)據(jù)降維的算法。在大數(shù)據(jù)時代,數(shù)據(jù)不僅越來越多,而且變得越來越復雜,數(shù)據(jù)維度的轉(zhuǎn)化也在驚人地增加。對于計算機而言,處理高位數(shù)據(jù)是沒問題的,但是人類能感知到的只有三個維度,因此很有必要將高維數(shù)據(jù)進行可視化,tSNE就是講數(shù)據(jù)集從任意維度降到二維或三維的算法。谷歌的一名實習員工最近提出了一種方法,可以讓tSNE在大型、高維數(shù)據(jù)庫上實時進行可視化,而且還開源了。以下是論智為大家?guī)淼木幾g。

最近幾年,t分布隨機鄰近嵌入(tSNE)算法已經(jīng)成為最常用的高維數(shù)據(jù)分析工具,它經(jīng)常能提供有深度的見解。在TensorFlow嵌入項目和TensorBoard中用tSNE解釋深度神經(jīng)網(wǎng)絡的輸出時,其中一個強大的特征是,tSNE在使用時只需要稍微調(diào)整參數(shù),就能在不同規(guī)模下展現(xiàn)高維數(shù)據(jù)點的聚類。盡管有這個優(yōu)點,tSNE算法計算時候的復雜程度也限制了它在很多小數(shù)據(jù)集上的應用。雖然已經(jīng)有一些針對這個問題的解決方法(主要關注點在數(shù)據(jù)點之間相似度計算的可擴展性上),但目前為止當可視化大數(shù)據(jù)及使用tSNE嵌入時,它們還不能提供真正的互動體驗。

Linear tSNE Optimization for the Web一文中,我們提出了一種解決tSNE高度依賴現(xiàn)代圖形硬件問題的方法。我們的方法比其他類似技術能更快地生成嵌入,甚至可以利用GPU在客戶端的網(wǎng)頁瀏覽器上執(zhí)行。二者的結(jié)合讓大型、高維的數(shù)據(jù)庫實時可視化成為了可能。另外,我們還在TensorFlow.js中開源了這項成果,希望能帶來更多貢獻。

用我們的方法為全部MNIST數(shù)據(jù)集進行實時tSNE嵌入演化。該數(shù)據(jù)集包含60000張手寫數(shù)字的圖片

tSNE的目標是聚合相似數(shù)據(jù)點之間的小“鄰居”,同時降低整體數(shù)據(jù)的維度使之更加便于可視化。換句話說,tSNE目標函數(shù)計算的是在二維或三維空間中這些相似數(shù)據(jù)的“鄰居”是如何分布的,然后根據(jù)此將它們映射到聚類之中。

在之前的研究中,tSNE的目標最小化是作為N-body模擬問題進行的,其中點在嵌入空間中隨機分布,每個點都受到兩種不同類型的力的作用。吸引力會將點與其在高維空間中最相似的點之間的距離越拉越近,同時排斥力使得它們與嵌入中的其他鄰近點越來越遠。

吸引力只作用于一小部分點(也就是有相同近鄰的點),而排斥力在所有成對的點上都有作用。由于這個原因,tSNE需要強大的計算力和多次的目標函數(shù)迭代,這就限制了數(shù)據(jù)庫的尺寸。為了改善這一問題,Barnes-Hut算法就用來近似估算排斥力和目標函數(shù)的梯度。這就可以將計算擴展到成千上萬個數(shù)據(jù)點,但是仍然需要15分鐘以上計算MNIST嵌入。

在我們的論文中,我們提出了解決上述問題的方法,通過利用在WebGL上生成的紋理計算目標函數(shù)的梯度近似值。我們的技術利用一個三通道的圖案在每次最小化迭代時都繪制一個“排斥域(repulsive field)”,其中的三個組成元素作為RGB通道中的顏色和形狀。每個點都會得到一個排斥域,用來表示點上水平和豎直方向的排斥力,第三個元素用作歸一化。歸一化要保證轉(zhuǎn)換過程中的量值對應高維空間的相似度測量方法。除此之外,圖案的分辨率也會根據(jù)不同情況調(diào)整,以保證像素的數(shù)量是不變的。

如何讓tSNE在大型、高維數(shù)據(jù)庫上實時進行可視化的詳細資料概述

渲染三個用來計算單個點產(chǎn)生的排斥力。上圖顯示了藍色區(qū)域中的點被推到了左側(cè)和底部,而紅色區(qū)域中的點被推倒右側(cè)和頂部,而白色區(qū)域中的點不會移動

之后每個點的作用都被添加到GPU中,生成與排斥域相似的圖形(如下面的動圖所示)。這種方法比計算點和點之間的作用的方法對GPU更友好。這是因為多個點的排斥力可以在GPU中快速地同時計算。另外,我們在GPU中也計算了點之間的吸引力。

如何讓tSNE在大型、高維數(shù)據(jù)庫上實時進行可視化的詳細資料概述

tSNE嵌入的演變動畫(左上);用來計算梯度的標量場(右上);水平變換(左下);豎直變換(右下)

我們還將嵌入更新從點對點實現(xiàn)修改為在TensorFlow.js中計算的一系列標準張量操作,這是一個JavaScript庫,用于在Web瀏覽器中執(zhí)行張量計算。我們已經(jīng)開源的方法能完全在GPU上實現(xiàn)tSNE嵌入的變換,同時計算復雜性也得以改善。

有了這種只需15分鐘就能在MNIST數(shù)據(jù)集上完成計算的方法,我們現(xiàn)在可以實時在網(wǎng)頁中進行可視化。另外,這種可視化還能在更大的數(shù)據(jù)集上實現(xiàn)。但是我們這項成果的主要缺陷就是目前只能在二維嵌入上工作。然而二維可視化卻經(jīng)常比三維可視化更受歡迎,應為三維可視化需要更多交互才能理解聚類的結(jié)果。

未來的工作

我們相信,更快、更易交互的tSNE將大大提高數(shù)據(jù)分析系統(tǒng)的發(fā)展。我們很期待將這項成果用于深度神經(jīng)網(wǎng)絡。除此之外,我們的實驗表明,在使用GPU計算時的橫向思維(即用RGB圖像計算梯度)可以加速計算。在未來我們將開發(fā)更多這類的梯度計算,不僅將其應用于降維算法上,還可以用到其他瀏覽器的N-body模擬中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4743

    瀏覽量

    128994
  • 算法
    +關注

    關注

    23

    文章

    4615

    瀏覽量

    92982
  • 數(shù)據(jù)庫

    關注

    7

    文章

    3816

    瀏覽量

    64449
  • 數(shù)據(jù)集

    關注

    4

    文章

    1208

    瀏覽量

    24723

原文標題:谷歌實習生提出tSNE在大型高維數(shù)據(jù)集上實時可視化的方法(附代碼)

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    什么是大屏數(shù)據(jù)可視化?特點有哪些?

    大屏數(shù)據(jù)可視化是指通過大屏幕展示大量數(shù)據(jù)和信息,以直觀、可視化的方式幫助用戶理解和分析數(shù)據(jù)。這種展示方式通常用于展示復雜的
    的頭像 發(fā)表于 12-16 16:59 ?208次閱讀

    智慧能源可視化監(jiān)管平臺——助力可視化能源數(shù)據(jù)管理

    博達可視化大屏設計平臺智慧能源領域的價值體現(xiàn)在實時監(jiān)控、數(shù)據(jù)可視化、決策支持和效率提升等方面。借助該平臺,企業(yè)可以輕松搭建智慧能源類
    的頭像 發(fā)表于 11-29 10:00 ?341次閱讀
    智慧能源<b class='flag-5'>可視化</b>監(jiān)管平臺——助力<b class='flag-5'>可視化</b>能源<b class='flag-5'>數(shù)據(jù)</b>管理

    智慧樓宇可視化的優(yōu)點

    智慧樓宇可視化是指通過數(shù)據(jù)可視化技術來展示和分析樓宇的各種數(shù)據(jù),為樓宇管理者和用戶提供直觀、清晰的信息展示和決策支持。以下是智慧樓宇可視化
    的頭像 發(fā)表于 11-19 14:25 ?190次閱讀

    大型商場能耗監(jiān)測可視化管理系統(tǒng)方案

    與管理水平,減少能源浪費與能耗成本。 一、系統(tǒng)概述 大型商場能耗監(jiān)測可視化管理系統(tǒng)旨在通過實時監(jiān)測商場內(nèi)各類能耗數(shù)據(jù),如電、水、暖氣等,并
    的頭像 發(fā)表于 11-14 17:17 ?249次閱讀
    <b class='flag-5'>大型</b>商場能耗監(jiān)測<b class='flag-5'>可視化</b>管理系統(tǒng)方案

    可視化數(shù)據(jù)大屏的制作流程

    制作可視化數(shù)據(jù)大屏是一項涵蓋數(shù)據(jù)分析、設計和技術實現(xiàn)的復雜任務。從數(shù)據(jù)處理到展示呈現(xiàn),每個步驟都至關重要。下面將詳細介紹
    的頭像 發(fā)表于 07-24 13:57 ?294次閱讀

    可視化運用的主要技術

    介紹三可視化運用的主要技術,涵蓋渲染技術、建模技術、交互技術以及數(shù)據(jù)處理技術等方面。 首先,渲染技術是三可視化中至關重要的一環(huán)。渲染是指
    的頭像 發(fā)表于 07-19 13:56 ?300次閱讀

    可視化的魅力與應用

    可視化是一種強大的工具,它融合了藝術、科學和技術,通過在三空間中呈現(xiàn)數(shù)據(jù)、概念和想法,為人們提供了一種直觀而生動的方式來理解和探索信息。這項技術在當今世界中的應用非常廣泛,涵蓋了
    的頭像 發(fā)表于 07-17 14:19 ?267次閱讀

    如何實現(xiàn)園區(qū)大屏可視化

    孿生可視化 構(gòu)建平臺利用Web三可視化技術對現(xiàn)實場景進行仿真,實現(xiàn)園區(qū)級業(yè)務場景 的可視化呈現(xiàn),助力企業(yè)快速完成項目的實施。實現(xiàn)園區(qū)場景立
    的頭像 發(fā)表于 06-19 15:39 ?435次閱讀
    如何實現(xiàn)園區(qū)大屏<b class='flag-5'>可視化</b>?

    可視化系統(tǒng)平臺介紹及優(yōu)勢

    、醫(yī)學影像、地理信息系統(tǒng)、虛擬現(xiàn)實等領域。下面將詳細介紹三可視化系統(tǒng)平臺的優(yōu)勢以及其不同領域的應用。 三
    的頭像 發(fā)表于 06-12 16:02 ?633次閱讀
    三<b class='flag-5'>維</b><b class='flag-5'>可視化</b>系統(tǒng)平臺介紹及優(yōu)勢

    可視化數(shù)據(jù)大屏的設計原理和技巧

    可視化數(shù)據(jù)大屏設計面向交通、園區(qū)、城市、建筑、應急等領域的客戶,以孿生可視能力賦能,提供行業(yè)解決方案。雙渲染引擎,1:1還原真實世界,
    的頭像 發(fā)表于 05-30 17:09 ?560次閱讀

    大屏數(shù)據(jù)可視化是什么?運用了什么技術

    、發(fā)現(xiàn)規(guī)律和趨勢,從而支持決策制定和問題解決。 大屏數(shù)據(jù)可視化中,常用的技術包括: 數(shù)據(jù)采集與處理: 數(shù)據(jù)從各種來源(
    的頭像 發(fā)表于 05-24 15:35 ?873次閱讀

    智慧園區(qū)三可視化的重要性!

    智慧園區(qū)三可視化是系統(tǒng)的一個重要組成部分,它將數(shù)據(jù)及園區(qū)場景1:1還原,管理者更加清楚的知道園區(qū)的具體情況。可視化構(gòu)建平臺利用Web三
    的頭像 發(fā)表于 05-15 16:38 ?426次閱讀

    智慧交通三可視化數(shù)據(jù)場景融合

    的出行環(huán)境。而在智慧交通中三可視化是很重要的一個版塊,今天古河云科技小編就帶領大家來了解一下智慧交通三可視化的具體內(nèi)容。 通過信息技術的應用,實現(xiàn)了交通系統(tǒng)的智能
    的頭像 發(fā)表于 05-14 16:14 ?584次閱讀
    智慧交通三<b class='flag-5'>維</b><b class='flag-5'>可視化</b>,<b class='flag-5'>讓</b><b class='flag-5'>數(shù)據(jù)</b>場景融合

    智能可視化綜合平臺智慧城市建設中的關鍵作用

    智能可視化綜合平臺智慧城市建設中扮演著關鍵的角色,主要體現(xiàn)在以下幾個方面: 數(shù)據(jù)整合與可視化展示:智慧城市的建設涉及到大量
    的頭像 發(fā)表于 05-11 16:32 ?389次閱讀

    可視化是怎么做的?特點有哪些?

    可視化深入我們的生活當中,它能直觀并且精準的展示企業(yè)的場景情況,但是很多小伙伴并不清楚三可視化是怎么做的?特點有哪些?今天,古河云科技小編就來給大家聊一聊這一問題。 三
    的頭像 發(fā)表于 04-28 15:12 ?501次閱讀
    三<b class='flag-5'>維</b><b class='flag-5'>可視化</b>是怎么做的?特點有哪些?
    主站蜘蛛池模板: 国产精品你懂得| 亚洲精品国产高清不卡在线| 色AV色婷婷66人妻久久久| xlxx美女| 美女被男人撕衣舔胸| 亚洲色欲国产免费视频| 久久精品热只有精品| 亚洲精品一线二线三线无人区 | 国产精品1卡二卡三卡四卡乱码| 米奇在线8888在线精品视频| 波多野结衣教师系列6| 男人叼女人| 91麻豆精品国产一级| 三级黄毛片| 久久国产欧美日韩精品免费| BL低喘贯穿顶弄老师H| 亚洲AVAV天堂AV在线网爱情| 国产精品免费一区二区三区视频| 亚洲午夜久久久久久久久电影网| 欧美国产成人在线| 扒开老师大腿猛进AAA片软件| 无码天堂亚洲内射精品课堂| 久久亚洲AV无码精品午色夜麻豆 | 在线播放无码字幕亚洲| 日本人奶水中文影片| 久久精品电影院| 国产AV精品久久久免费看| 婷婷亚洲AV色香蕉蜜桃| 国产欧美一区二区精品性色tv| 中文字幕欧美日韩VA免费视频| 色噜噜狠狠色综合中文字幕| 久久频这里精品99香蕉久网址| 国产1769一七六九视频在线 | 超碰97人人做人人爱少妇| 亚洲一区国产| 无码国产欧美日韩精品| 暖暖在线观看播放视频| 精品视频免费在线观看| 中国拍三a级的明星女| 微福利92合集| 欧美特级午夜一区二区三区|