計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　很多搜索引擎可以用一張圖片，搜索互聯(lián)網(wǎng)上所有與它相似的圖片。你輸入網(wǎng)片的網(wǎng)址，或者直接上傳圖片，Google就會(huì)找出與其相似的圖片。下面這張圖片是美國(guó)女演員Alyson Hannigan。

　　上傳后，Google返回如下結(jié)果：

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　類(lèi)似的”相似圖片搜索引擎”還有不少，TinEye甚至可以找出照片的拍攝背景。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　===================================================

　　這種技術(shù)的原理是什么？計(jì)算機(jī)怎么知道兩張圖片相似呢？

　　根據(jù)Neal Krawetz博士的解釋?zhuān)矸浅：?jiǎn)單易懂。我們可以用一個(gè)快速算法，就達(dá)到基本的效果。

　　這里的關(guān)鍵技術(shù)叫做”感知哈希算法”（Perceptual hash algorithm），它的作用是對(duì)每張圖片生成一個(gè)”指紋”（fingerprint）字符串，然后比較不同圖片的指紋。結(jié)果越接近，就說(shuō)明圖片越相似。

　　下面是一個(gè)最簡(jiǎn)單的實(shí)現(xiàn)：

　　第一步，縮小尺寸。

　　將圖片縮小到8×8的尺寸，總共64個(gè)像素。這一步的作用是去除圖片的細(xì)節(jié)，只保留結(jié)構(gòu)、明暗等基本信息，摒棄不同尺寸、比例帶來(lái)的圖片差異。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　第二步，簡(jiǎn)化色彩。

　　將縮小后的圖片，轉(zhuǎn)為64級(jí)灰度。也就是說(shuō)，所有像素點(diǎn)總共只有64種顏色。

　　第三步，計(jì)算平均值。

　　計(jì)算所有64個(gè)像素的灰度平均值。

　　第四步，比較像素的灰度。

　　將每個(gè)像素的灰度，與平均值進(jìn)行比較。大于或等于平均值，記為1；小于平均值，記為0。

　　第五步，計(jì)算哈希值。

　　將上一步的比較結(jié)果，組合在一起，就構(gòu)成了一個(gè)64位的整數(shù)，這就是這張圖片的指紋。組合的次序并不重要，只要保證所有圖片都采用同樣次序就行了。

　　得到指紋以后，就可以對(duì)比不同的圖片，看看64位中有多少位是不一樣的。在理論上，這等同于計(jì)算“漢明距離”（Hamming distance）。如果不相同的數(shù)據(jù)位不超過(guò)5，就說(shuō)明兩張圖片很相似；如果大于10，就說(shuō)明這是兩張不同的圖片。

　　具體的代碼實(shí)現(xiàn)，可以參見(jiàn)Wote用python語(yǔ)言寫(xiě)的imgHash.py。代碼很短，只有53行。使用的時(shí)候，第一個(gè)參數(shù)是基準(zhǔn)圖片，第二個(gè)參數(shù)是用來(lái)比較的其他圖片所在的目錄，返回結(jié)果是兩張圖片之間不相同的數(shù)據(jù)位數(shù)量（漢明距離）。

　　這種算法的優(yōu)點(diǎn)是簡(jiǎn)單快速，不受圖片大小縮放的影響，缺點(diǎn)是圖片的內(nèi)容不能變更。如果在圖片上加幾個(gè)文字，它就認(rèn)不出來(lái)了。所以，它的最佳用途是根據(jù)縮略圖，找出原圖。

　　實(shí)際應(yīng)用中，往往采用更強(qiáng)大的pHash算法和SIFT算法，它們能夠識(shí)別圖片的變形。只要變形程度不超過(guò)25%，它們就能匹配原圖。這些算法雖然更復(fù)雜，但是原理與上面的簡(jiǎn)便算法是一樣的，就是先將圖片轉(zhuǎn)化成Hash字符串，然后再進(jìn)行比較。

　　昨天，我在isnowfy的網(wǎng)站看到，還有其他兩種方法也很簡(jiǎn)單，這里做一些筆記。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　一、顏色分布法

　　每張圖片都可以生成顏色分布的直方圖（color histogram）。如果兩張圖片的直方圖很接近，就可以認(rèn)為它們很相似。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　任何一種顏色都是由紅綠藍(lán)三原色（RGB）構(gòu)成的，所以上圖共有4張直方圖（三原色直方圖 + 最后合成的直方圖）。

　　如果每種原色都可以取256個(gè)值，那么整個(gè)顏色空間共有1600萬(wàn)種顏色（256的三次方）。針對(duì)這1600萬(wàn)種顏色比較直方圖，計(jì)算量實(shí)在太大了，因此需要采用簡(jiǎn)化方法。可以將0～255分成四個(gè)區(qū)：0～63為第0區(qū)，64～127為第1區(qū)，128～191為第2區(qū)，192～255為第3區(qū)。這意味著紅綠藍(lán)分別有4個(gè)區(qū)，總共可以構(gòu)成64種組合（4的3次方）。

　　任何一種顏色必然屬于這64種組合中的一種，這樣就可以統(tǒng)計(jì)每一種組合包含的像素?cái)?shù)量。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　上圖是某張圖片的顏色分布表，將表中最后一欄提取出來(lái)，組成一個(gè)64維向量（7414， 230， 0， 0， 8， …， 109， 0， 0， 3415， 53929）。這個(gè)向量就是這張圖片的特征值或者叫”指紋”。

　　于是，尋找相似圖片就變成了找出與其最相似的向量。這可以用皮爾遜相關(guān)系數(shù)或者余弦相似度算出。

　　二、內(nèi)容特征法

　　除了顏色構(gòu)成，還可以從比較圖片內(nèi)容的相似性入手。

　　首先，將原圖轉(zhuǎn)成一張較小的灰度圖片，假定為50×50像素。然后，確定一個(gè)閾值，將灰度圖片轉(zhuǎn)成黑白圖片。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

　　如果兩張圖片很相似，它們的黑白輪廓應(yīng)該是相近的。于是，問(wèn)題就變成了，第一步如何確定一個(gè)合理的閾值，正確呈現(xiàn)照片中的輪廓？

　　顯然，前景色與背景色反差越大，輪廓就越明顯。這意味著，如果我們找到一個(gè)值，可以使得前景色和背景色各自的”類(lèi)內(nèi)差異最小”（minimizing the intra-class variance），或者”類(lèi)間差異最大”（maximizing the inter-class variance），那么這個(gè)值就是理想的閾值。

　　1979年，日本學(xué)者大津展之證明了，”類(lèi)內(nèi)差異最小”與”類(lèi)間差異最大”是同一件事，即對(duì)應(yīng)同一個(gè)閾值。他提出一種簡(jiǎn)單的算法，可以求出這個(gè)閾值，這被稱(chēng)為“大津法”（Otsu’s method）。下面就是他的計(jì)算方法。

　　假定一張圖片共有n個(gè)像素，其中灰度值小于閾值的像素為 n1 個(gè)，大于等于閾值的像素為 n2 個(gè)（ n1 + n2 = n ）。w1 和 w2 表示這兩種像素各自的比重。

　　w1 = n1 / n

　　w2 = n2 / n

　　再假定，所有灰度值小于閾值的像素的平均值和方差分別為 μ1 和 σ1，所有灰度值大于等于閾值的像素的平均值和方差分別為 μ2 和 σ2。于是，可以得到

　　類(lèi)內(nèi)差異 = w1（σ1的平方） + w2（σ2的平方）

　　類(lèi)間差異 = w1w2（μ1-μ2）^2

　　可以證明，這兩個(gè)式子是等價(jià)的：得到”類(lèi)內(nèi)差異”的最小值，等同于得到”類(lèi)間差異”的最大值。不過(guò)，從計(jì)算難度看，后者的計(jì)算要容易一些。

　　下一步用”窮舉法”，將閾值從灰度的最低值到最高值，依次取一遍，分別代入上面的算式。使得”類(lèi)內(nèi)差異最小”或”類(lèi)間差異最大”的那個(gè)值，就是最終的閾值。具體的實(shí)例和Java算法，請(qǐng)看這里。

　　計(jì)算機(jī)是怎么知道兩張圖片相似的呢？ ?

　　有了50×50像素的黑白縮略圖，就等于有了一個(gè)50×50的0-1矩陣。矩陣的每個(gè)值對(duì)應(yīng)原圖的一個(gè)像素，0表示黑色，1表示白色。這個(gè)矩陣就是一張圖片的特征矩陣。

　　兩個(gè)特征矩陣的不同之處越少，就代表兩張圖片越相似。這可以用”異或運(yùn)算”實(shí)現(xiàn)（即兩個(gè)值之中只有一個(gè)為1，則運(yùn)算結(jié)果為1，否則運(yùn)算結(jié)果為0）。對(duì)不同圖片的特征矩陣進(jìn)行”異或運(yùn)算”，結(jié)果中的1越少，就是越相似的圖片。

閱讀全文

計(jì)算機(jī)(82752) 計(jì)算機(jī)(82752)

評(píng)論

相關(guān)推薦

哪位高手發(fā)兩張共模干擾和差模干擾區(qū)別的波形圖片

哪位高手發(fā)兩張共模干擾和差模干擾區(qū)別的波形圖片，我不知道什么樣的波形干擾屬于共模干擾還是差模的，所以希望高手發(fā)一張共模的干擾波形和一張差模干擾的圖片，我看著對(duì)比一下，如果高手直接在兩幅圖片中指明區(qū)別，更加感謝

2010-11-14 07:18:03

計(jì)算機(jī)組成與設(shè)計(jì)

計(jì)算機(jī)組成與設(shè)計(jì) 計(jì)算機(jī)組成與設(shè)計(jì)是計(jì)算機(jī)科學(xué)中最基礎(chǔ)的課程之一，它主要闡述了計(jì)算機(jī)的組成原理和設(shè)計(jì)方法。隨著計(jì)算機(jī)技術(shù)的快速發(fā)展，計(jì)算機(jī)組成與設(shè)計(jì)也日益成為了計(jì)算機(jī)科學(xué)的熱門(mén)課程。本文將介紹計(jì)算機(jī)

2023-08-17 12:37:31

323

計(jì)算機(jī)通信的簡(jiǎn)單概念

計(jì)算機(jī)通信指的是在兩個(gè)或多個(gè)計(jì)算機(jī)之間進(jìn)行數(shù)據(jù)傳輸和信息交換的過(guò)程。計(jì)算機(jī)通信可以分為點(diǎn)對(duì)點(diǎn)通信和廣播通信兩種模式。在點(diǎn)對(duì)點(diǎn)通信模式下，數(shù)據(jù)從一個(gè)計(jì)算機(jī)直接傳輸?shù)搅硪粋€(gè)計(jì)算機(jī)，非常適合于一對(duì)一的交流。

2023-05-09 16:48:14

524

工控機(jī)能否作為普通的計(jì)算機(jī)來(lái)使用呢？

工業(yè)控制計(jì)算機(jī)（Industrial Personal Computer，IPC）簡(jiǎn)稱(chēng)工控機(jī)，具有重要的計(jì)算機(jī)屬性和特征，如具有計(jì)算機(jī)主板、CPU、硬盤(pán)、內(nèi)存、外設(shè)及接口，并有操作系統(tǒng)、控制網(wǎng)絡(luò)和協(xié)議、計(jì)算能力、友好的人機(jī)界面等。那么，工控機(jī)能否作為普通的計(jì)算機(jī)來(lái)使用呢？答案是

2023-03-31 09:27:14

1844

量子計(jì)算機(jī)即將到來(lái)

　　我們?cè)缇?b style="color: red">知道量子計(jì)算機(jī)正在開(kāi)發(fā)中。這種計(jì)算機(jī)可以解決原子和分子水平模擬化學(xué)反應(yīng)，藥物的靶向設(shè)計(jì)或創(chuàng)新材料的基本問(wèn)題。但我們也早就知道，這種計(jì)算機(jī)有可能破解當(dāng)今使用的許多安全技術(shù)，尤其是傳統(tǒng)密碼學(xué)。

2022-10-24 09:44:37

460

從零開(kāi)始的AIM65相似計(jì)算機(jī)

電子發(fā)燒友網(wǎng)站提供《從零開(kāi)始的AIM65相似計(jì)算機(jī).zip》資料免費(fèi)下載

2022-10-19 10:01:38

比量子計(jì)算機(jī)更容易構(gòu)建的新的計(jì)算機(jī)制造方法用液晶構(gòu)建計(jì)算機(jī)

兩位科學(xué)家在最新一期《科學(xué)進(jìn)展》雜志上撰文提出了一種新的計(jì)算機(jī)制造方法：用液晶構(gòu)建計(jì)算機(jī)，這種計(jì)算機(jī)將使用分子的朝向來(lái)存儲(chǔ)數(shù)據(jù)。在液晶計(jì)算機(jī)中，信息將被轉(zhuǎn)換成一系列有缺陷的朝向，根據(jù)朝向的不同，液晶

2022-08-24 19:58:27

898

計(jì)算機(jī)如何傳輸數(shù)據(jù) 網(wǎng)卡的工作原理

大家都知道計(jì)算機(jī)里面存儲(chǔ)的是一堆01組成的二進(jìn)制代碼，那么計(jì)算機(jī)是怎樣把這些數(shù)字信號(hào)傳輸出去的呢?

2022-05-07 11:58:51

2339

CPCI計(jì)算機(jī)

Compacc 是基于PICMG 標(biāo)準(zhǔn)的工業(yè)用嵌入式計(jì)算機(jī)總線標(biāo)準(zhǔn)。蘇州惠普聯(lián)電子有限公司的CompactPCI 產(chǎn)品群是基于CPCI標(biāo)準(zhǔn)的嵌入式計(jì)算機(jī)的產(chǎn)品系列，它的商業(yè)化應(yīng)用及發(fā)展取決于國(guó)際插件式計(jì)算機(jī)，設(shè)備及其他硬件軟件的廣泛應(yīng)用。

2022-04-22 09:47:55

聚焦智能交通建設(shè)，微智達(dá)提供智能張拉機(jī)專(zhuān)用工業(yè)計(jì)算機(jī)

隨著計(jì)算機(jī)技術(shù)的發(fā)展，人們?cè)诤芏嗟念I(lǐng)域都用到計(jì)算機(jī)技術(shù)，比如在工業(yè)中，就有工業(yè)計(jì)算機(jī)智能技術(shù)的典型應(yīng)用，其中，智能張拉機(jī)就是非常典型的代表。智能張拉是指不依靠工人手動(dòng)控制，而利用計(jì)算機(jī)智能控制技術(shù)

2022-02-24 10:20:14

168

用兩張圖了解STM32和RT-Thread發(fā)展歷史

兩張圖了解STM32和RT-Thread發(fā)展歷史

2020-03-01 14:16:06

3744

什么是量子計(jì)算機(jī)_量子計(jì)算機(jī)原理_量子計(jì)算的兩種有效方法

本文首先介紹了什么是量子計(jì)算機(jī)以及量子計(jì)算機(jī)的原理，其次通過(guò)引用文章解釋了量子計(jì)算的原理，文章的最后解釋了量子計(jì)算的兩種有效方法并附上了量子的示意圖

2019-07-30 17:41:22

10003

計(jì)算機(jī)編程語(yǔ)言發(fā)展的三個(gè)重要階段你都知道嗎？

第一代計(jì)算機(jī)語(yǔ)言稱(chēng)為機(jī)器語(yǔ)言。機(jī)器語(yǔ)言就是0/1代碼。計(jì)算機(jī)只能識(shí)別0和1。在計(jì)算機(jī)內(nèi)部，無(wú)論是一部電影還是一首歌曲或是一張圖片，最終保存的都是0/1代碼，因?yàn)镃PU只能執(zhí)行0/1代碼。那么這是不是就意味著我們編程一定要用0/1代碼呢？

2019-02-04 11:46:00

18050

計(jì)算機(jī)組成的原理是怎樣的？計(jì)算機(jī)組成原理(白中英)電子教材免費(fèi)下載

電子計(jì)算機(jī)從總體上來(lái)說(shuō)可分為兩大類(lèi)。一類(lèi)是電子模擬計(jì)算機(jī)。“模擬”就是相似的意思，例如計(jì)算尺是用長(zhǎng)度來(lái)標(biāo)示數(shù)值;時(shí)鐘是用指針在表盤(pán)上轉(zhuǎn)動(dòng)來(lái)表示時(shí)間;電表是用角度來(lái)反映電量大小，這些都是模擬計(jì)算裝置，模擬計(jì)算機(jī)的特點(diǎn)是數(shù)值由連續(xù)量來(lái)表示，運(yùn)算過(guò)程也是連續(xù)的。

2018-09-27 17:32:17

126

量子計(jì)算機(jī)的優(yōu)點(diǎn)_量子計(jì)算機(jī)的應(yīng)用_量子計(jì)算機(jī)的未來(lái)應(yīng)用

量子計(jì)算機(jī)是一類(lèi)遵循量子力學(xué)規(guī)律進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理量子信息的物理裝置。當(dāng)某個(gè)裝置處理和計(jì)算的是量子信息，運(yùn)行的是量子算法時(shí)，它就是量子計(jì)算機(jī)。量子計(jì)算機(jī)的概念源于對(duì)可逆計(jì)算機(jī)的研究。研究可逆計(jì)算機(jī)的目的是為了解決計(jì)算機(jī)中的能耗問(wèn)題。

2017-11-28 18:10:33

10955

基于計(jì)算機(jī)類(lèi)電子商務(wù)輔助教學(xué)軟件的開(kāi)發(fā)_張婷婷

基于計(jì)算機(jī)類(lèi)電子商務(wù)輔助教學(xué)軟件的開(kāi)發(fā)_張婷婷

2017-03-16 11:17:08

基于計(jì)算機(jī)圖片綜合臺(tái)帳管理系統(tǒng)耿偉

基于計(jì)算機(jī)圖片綜合臺(tái)帳管理系統(tǒng)_耿偉

2017-03-16 08:00:00

一文讀懂計(jì)算機(jī)視覺(jué)和機(jī)器人視覺(jué)

計(jì)算機(jī)視覺(jué)與機(jī)器人視覺(jué)有很多的相似之處，兩者的基本理論框架、底層理論、算法等是相似的，但計(jì)算機(jī)視覺(jué)與機(jī)器人視覺(jué)研究的最終目的不同：前者主要研究視覺(jué)檢驗(yàn)，精度要求高，速度不是主要考慮的問(wèn)題；而機(jī)器人視覺(jué)主要研究在視覺(jué)引導(dǎo)下機(jī)器人對(duì)環(huán)境的作用，有實(shí)時(shí)性的要求。

2016-11-16 15:44:05

6940

計(jì)算機(jī)組成原理_張鈞良.pdf

計(jì)算機(jī)組成原理]張鈞良.下載于學(xué)習(xí)資料庫(kù)

2016-01-20 17:04:54

109

什么是計(jì)算機(jī)算法？

什么是計(jì)算機(jī)算法？要使計(jì)算機(jī)工作，您就必須編寫(xiě)計(jì)算機(jī)程序。要編寫(xiě)計(jì)算機(jī)程序，您就必須一步步地告訴計(jì)算機(jī)，您究竟想讓它干什么。然后，計(jì)算機(jī)按照每個(gè)步驟來(lái)機(jī)

2009-08-03 08:50:26

2673

計(jì)算機(jī)病毒知多少

計(jì)算機(jī)病毒知多少引言 計(jì)算機(jī)病毒很容易引起我們的注意。一方面，病毒讓我們知道自己

2009-07-30 08:32:33

1979

計(jì)算機(jī)的發(fā)展及應(yīng)用

2.1 計(jì)算機(jī)的發(fā)展史2.2 計(jì)算機(jī)的應(yīng)用2.3 計(jì)算機(jī)的展望

2009-04-11 09:32:10

計(jì)算機(jī)應(yīng)用基礎(chǔ)教案

介紹什么是計(jì)算機(jī)，計(jì)算機(jī)的特點(diǎn)，計(jì)算機(jī)的應(yīng)用與發(fā)展：什么是計(jì)算機(jī)；計(jì)算機(jī)的發(fā)展；計(jì)算機(jī)的分類(lèi)；計(jì)算機(jī)的主要應(yīng)用；計(jì)算機(jī)硬件系統(tǒng)：結(jié)合具體實(shí)例

2008-09-25 12:45:05

110

已全部加載完成

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

計(jì)算機(jī)是怎么知道兩張圖片相似的呢？

評(píng)論

哪位高手發(fā)兩張共模干擾和差模干擾區(qū)別的波形圖片

計(jì)算機(jī)組成與設(shè)計(jì)

計(jì)算機(jī)通信的簡(jiǎn)單概念

工控機(jī)能否作為普通的計(jì)算機(jī)來(lái)使用呢？

量子計(jì)算機(jī)即將到來(lái)

從零開(kāi)始的AIM65相似計(jì)算機(jī)

比量子計(jì)算機(jī)更容易構(gòu)建的新的計(jì)算機(jī)制造方法用液晶構(gòu)建計(jì)算機(jī)

計(jì)算機(jī)如何傳輸數(shù)據(jù) 網(wǎng)卡的工作原理

CPCI計(jì)算機(jī)

聚焦智能交通建設(shè)，微智達(dá)提供智能張拉機(jī)專(zhuān)用工業(yè)計(jì)算機(jī)

用兩張圖了解STM32和RT-Thread發(fā)展歷史

什么是量子計(jì)算機(jī)_量子計(jì)算機(jī)原理_量子計(jì)算的兩種有效方法

計(jì)算機(jī)編程語(yǔ)言發(fā)展的三個(gè)重要階段你都知道嗎？

計(jì)算機(jī)組成的原理是怎樣的？計(jì)算機(jī)組成原理(白中英)電子教材免費(fèi)下載

量子計(jì)算機(jī)的優(yōu)點(diǎn)_量子計(jì)算機(jī)的應(yīng)用_量子計(jì)算機(jī)的未來(lái)應(yīng)用

基于計(jì)算機(jī)類(lèi)電子商務(wù)輔助教學(xué)軟件的開(kāi)發(fā)_張婷婷

基于計(jì)算機(jī)圖片綜合臺(tái)帳管理系統(tǒng)耿偉

一文讀懂計(jì)算機(jī)視覺(jué)和機(jī)器人視覺(jué)

計(jì)算機(jī)組成原理_張鈞良.pdf

什么是計(jì)算機(jī)算法？

計(jì)算機(jī)病毒知多少

計(jì)算機(jī)的發(fā)展及應(yīng)用

計(jì)算機(jī)應(yīng)用基礎(chǔ)教案