色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹當(dāng)前比較常見的幾種近鄰搜索算法

工程師鄧生 ? 來源:得物技術(shù) ? 作者:張林 ? 2022-09-29 17:11 ? 次閱讀

簡介

隨著深度學(xué)習(xí)的發(fā)展和普及,很多非結(jié)構(gòu)數(shù)據(jù)被表示為高維向量,并通過近鄰搜索來查找,實現(xiàn)了多種場景的檢索需求,如人臉識別、圖片搜索、商品的推薦搜索等。另一方面隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展及5G技術(shù)的普及,產(chǎn)生的數(shù)據(jù)呈爆發(fā)式增長,如何在海量數(shù)據(jù)中精準(zhǔn)高效的完成搜索成為一個研究熱點,各路前輩專家提出了不同的算法,今天我們就簡單聊下當(dāng)前比較常見的近鄰搜索算法。

主要算法

aa1d36f2-3edc-11ed-9e49-dac502259ad0.png

Kd-Tree

K-dimension tree,二叉樹結(jié)構(gòu),對數(shù)據(jù)點在k維空間(如二維 (x,y),三維(x,y,z),k維(x,y,z..))中劃分。

構(gòu)建過程

確定split域的值(輪詢 or 最大方差)

確定Node-data的域值(中位數(shù) or 平均值)

確定左子空間和右子空間

遞歸構(gòu)造左右子空間

查詢過程

進行二叉搜索,找到葉子結(jié)點

回溯搜索路徑,進入其他候選節(jié)點的子空間查詢距離更近的點

重復(fù)步驟2,直到搜索路徑為空

性能

理想情況下的復(fù)雜度是O(K log(N)) 最壞的情況下(當(dāng)查詢點的鄰域與分割超平面兩側(cè)的空間都產(chǎn)生交集時,回溯的次數(shù)大大增加)的復(fù)雜度為維度比較大時,直接利用K-d樹快速檢索(維數(shù)超過20)的性能急劇下降,幾乎接近線性掃描。

改進算法

Best-Bin-First:通過設(shè)置優(yōu)先級隊列(將“查詢路徑”上的結(jié)點進行排序,如按各自分割超平面與查詢點的距離排序)和運行超時限定(限定搜索過的葉子節(jié)點樹)來獲取近似的最近鄰,有效地減少回溯的次數(shù)。采用了BBF查詢機制后Kd樹便可以有效的擴展到高維數(shù)據(jù)集上。

Randomized Kd tree:通過構(gòu)建多個不同方向上的Kd tree,在各個Kd tree上并行搜索部分?jǐn)?shù)量的節(jié)點來提升搜索性能(主要解決BBF算法隨著Max-search nodes增長,收益減小的問題)

Hierarchical k-means trees

類似k-means tree,通過聚類的方法來建立一個二叉樹來使得每個點查找時間復(fù)雜度是O(log n) 。

構(gòu)建過程:

隨機選擇兩個點,執(zhí)行k為2的聚類,用垂直于這兩個聚類中心的超平面將數(shù)據(jù)集劃分

在劃分的子空間內(nèi)進行遞歸迭代繼續(xù)劃分,直到每個子空間最多只剩下K個數(shù)據(jù)節(jié)點

最終形成一個二叉樹結(jié)構(gòu)。葉子節(jié)點記錄原始數(shù)據(jù)節(jié)點,中間節(jié)點記錄分割超平面的信息

aa7cf6fa-3edc-11ed-9e49-dac502259ad0.png

ab487b36-3edc-11ed-9e49-dac502259ad0.png

搜索過程

從根節(jié)點開始比較,找到葉子節(jié)點,同時將路徑上的節(jié)點記錄到優(yōu)先級隊列中

執(zhí)行回溯,從優(yōu)先級隊列中選取節(jié)點重新執(zhí)行查找

每次查找都將路徑中未遍歷的節(jié)點記錄到優(yōu)先級隊列中

當(dāng)遍歷節(jié)點的數(shù)目達到指定閾值時終止搜索

性能

搜索性能不是特別穩(wěn)定,在某些數(shù)據(jù)集上表現(xiàn)很好,在有些數(shù)據(jù)集上則有些差

構(gòu)建樹的時間比較長,可以通過設(shè)置kmeans的迭代次數(shù)來優(yōu)化

LSH

Locality-Sensitive Hashing 高維空間的兩點若距離很近,他們哈希值有很大概率是一樣的;若兩點之間的距離較遠,他們哈希值相同的概率會很小 。

一般會根據(jù)具體的需求來選擇滿足條件的hash函數(shù),(d1,d2,p1,p2)-sensitive 滿足下面兩個條件(D為空間距離度量,Pr表示概率):

若空間中兩點p和q之間的距離D(p,q)p1

若空間中兩點p和q之間的距離D(p,q)>d2,則Pr(h(p)=h(q))

abc4ef68-3edc-11ed-9e49-dac502259ad0.png



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • adc
    adc
    +關(guān)注

    關(guān)注

    99

    文章

    6624

    瀏覽量

    548016
  • SDC
    SDC
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    15796
  • BBF
    BBF
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    7223

原文標(biāo)題:近鄰搜索算法淺析

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦
    熱點推薦

    五種運動搜索算法簡介

    (九)幀間編碼2:運動搜索算法簡介
    發(fā)表于 07-17 15:09

    Viterbi搜索算法

    自然語言處理——65 Viterbi搜索算法
    發(fā)表于 04-14 11:44

    改進的雙向啟發(fā)式搜索算法主要流程是怎樣的?

    如何對雙向啟發(fā)式搜索算法進行改進和實現(xiàn)?改進的雙向啟發(fā)式搜索算法主要流程是怎樣的?
    發(fā)表于 05-17 06:51

    改進的二進制搜索算法原理是什么?有什么優(yōu)勢?

    改進的二進制搜索算法原理是什么?改進的二進制搜索算法有什么優(yōu)勢?
    發(fā)表于 05-20 07:12

    WebCAD中的剖面區(qū)域搜索算法

    基于Web的CAD系統(tǒng)是協(xié)同設(shè)計研究的一個分支。論文討論了矢量化標(biāo)記語言用于在Web上表示矢量圖形的優(yōu)點,比較常見幾種剖面區(qū)域搜索算法,提出了一種不依賴操作系統(tǒng)的剖面
    發(fā)表于 07-30 16:24 ?8次下載

    四軸飛行器中的自動搜索算法

    四軸飛行器中的自動搜索算法,簡單易懂,帶你飛起來
    發(fā)表于 06-08 14:10 ?2次下載

    一種改進的鄰近粒子搜索算法

    一種改進的鄰近粒子搜索算法
    發(fā)表于 01-07 20:32 ?0次下載

    一種改進的自由搜索算法_任誠

    一種改進的自由搜索算法_任誠
    發(fā)表于 03-14 17:47 ?3次下載

    DS18B20-ROM編碼的搜索算法

    DS18B20-ROM編碼的搜索算法
    發(fā)表于 05-04 08:51 ?9次下載

    深層次分類中候選類別搜索算法

    針對深層次分類中分類準(zhǔn)確率低、處理速度慢等問題,提出一種待分類文本的候選類別搜索算法。首先,引入搜索、分類兩階段的處理思想,結(jié)合類別層次樹的結(jié)構(gòu)特點和類別間的相關(guān)聯(lián)系等隱含的領(lǐng)域知識,進行了類別層次
    發(fā)表于 12-05 18:07 ?0次下載
    深層次分類中候選類別<b class='flag-5'>搜索算法</b>

    激光散亂點云K最近鄰搜索算法

    針對激光散亂點云的數(shù)據(jù)量大,且具有面型的特點,為降低存儲器使用量,提高散亂點云的處理效率,提出了一種散亂點云K最近鄰(KNN)搜索算法。首先,利用多級分塊、動態(tài)鏈表的存儲方式,只存儲非空的子空間編號
    發(fā)表于 12-11 14:09 ?1次下載

    以進化算法搜索策略實現(xiàn)神經(jīng)架構(gòu)搜索的方法

    神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,分類介紹以進化算法搜索策略實現(xiàn)神經(jīng)架構(gòu)搜索的方法和過程,并比較基于進化算法
    發(fā)表于 03-22 14:37 ?15次下載
    以進化<b class='flag-5'>算法</b>為<b class='flag-5'>搜索</b>策略實現(xiàn)神經(jīng)架構(gòu)<b class='flag-5'>搜索</b>的方法

    基于麻雀搜索算法優(yōu)化SVM的故障診斷

    )優(yōu)化SⅤM的故障診斷方法。利用麻雀搜索算法(SSA)對支持向量機的懲罰參數(shù)(C)與核參數(shù)(g)進行優(yōu)化,并構(gòu)建SSA-sVM滾動軸承故障診斷模型。結(jié)果表明:對于滾動軸承的常見故障, SSA-SVM
    發(fā)表于 06-01 12:00 ?18次下載

    二分搜索算法運用的框架套路

    我們前文 我作了首詩,保你閉著眼睛也能寫對二分查找 詳細介紹了二分搜索的細節(jié)問題,探討了「搜索一個元素」,「搜索左側(cè)邊界」,「搜索右側(cè)邊界」
    的頭像 發(fā)表于 08-25 16:06 ?1990次閱讀

    圖染色局部搜索算法python

    一個簡單的局部搜索算法解決圖染色問題,python版本太少了,寫了一個
    發(fā)表于 01-03 14:31 ?1次下載
    主站蜘蛛池模板: 国产毛片女人高潮叫声 | 国产又粗又黄又爽的大片 | 国产在线亚洲精品观 | 久久久久久人精品免费费看 | 久久国产欧美 | 亚洲免费在线视频 | 亚洲日韩国产精品乱-久 | 美女脱了内裤张开腿让男人爽 | 欧美在线视频一区 | sihu国产精品永久免费 | MM131亚洲精品久久安然 | 5g天天奭视频 | 十分钟在线观看免费视频高清WWW | 含羞草影院免费区 | 国产AV亚洲精品久久久久软件 | 少妇内射视频播放舔大片 | 极品少妇伦理一区二区 | 免费成年人在线观看视频 | 欧美一级久久久久久久大 | 高hbl双性浪荡古代 高h 大尺度纯肉 np快穿 | 精品视频一区二区三三区四区 | 娇妻中日久久持久久 | 麻豆国产精品久久人妻 | 一本色道久久综合亚洲AV蜜桃 | 欧美zozofoot| 亚洲妈妈精品一区二区三区 | 全彩黄漫火影忍者纲手无遮挡 | 女人被弄到高潮叫床免 | 免费伦理片网站 | 男女免费观看在线爽爽爽视频 | 日本精品卡一卡2卡3卡四卡三卡 | 国产69精品久久久久麻豆 | 久久麻豆亚洲AV成人无码国产 | 国产精品人妻午夜福利 | 无码AV熟妇素人内射V在线 | 亚洲国产成人精品无码区5566 | 浪货嗯啊趴下NP粗口黄暴 | 偷拍自怕亚洲在线第7页 | 外国xxxx | 99热视频这里只有久久精品 | 久久激情网|

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品