(文章來(lái)源:量子認(rèn)知)
在計(jì)算機(jī)科學(xué)和信息論中,數(shù)據(jù)壓縮算法是按照特定的編碼機(jī)制將未經(jīng)編碼的數(shù)據(jù)比特(或者其它信息相關(guān)的單位)較為緊湊地表示信息的方法。常見(jiàn)的例子如ZIP文件格式,ZIP文件格式是一種數(shù)據(jù)壓縮和文檔儲(chǔ)存的文件格式,以便于在網(wǎng)絡(luò)上傳播和分發(fā)文件。這種格式不僅僅提供壓縮功能占有較少信息空間,還可作為歸檔工具(Archiver),將許多文件存儲(chǔ)到同一個(gè)文件中。現(xiàn)在我們?cè)S多人的電腦里就有這種格式及其壓縮算法。
數(shù)據(jù)壓縮能夠?qū)崿F(xiàn)是因?yàn)槎鄶?shù)現(xiàn)實(shí)的數(shù)據(jù)都有統(tǒng)計(jì)冗余。有的數(shù)據(jù)比起其它數(shù)據(jù)更加常用,有的數(shù)據(jù)的使用可能性非常小。數(shù)據(jù)壓縮算法通常利用統(tǒng)計(jì)冗余,這樣就能更加簡(jiǎn)練地、但仍然是完整地表示發(fā)送方的數(shù)據(jù)。
熵是物理學(xué)和生物學(xué)中一個(gè)重要的計(jì)算參數(shù),是一種測(cè)量在動(dòng)力學(xué)方面不能做功的能量總數(shù),也就是當(dāng)總體的熵增加,其做功能力也下降,熵的量度是能量退化的指標(biāo)。熵亦被用于計(jì)算一個(gè)系統(tǒng)中的失序現(xiàn)象,也就是計(jì)算該系統(tǒng)混亂的程度。熵是一個(gè)描述系統(tǒng)狀態(tài)的函數(shù),在科技中經(jīng)常用熵的參考值和變化量進(jìn)行分析比較,它在控制論、概率論、數(shù)論、天體物理、生命科學(xué)等領(lǐng)域都有重要應(yīng)用,在不同的學(xué)科中也有引申出的更為具體的定義,是各領(lǐng)域十分重要的參量。
熵是衡量系統(tǒng)的分子無(wú)序性或隨機(jī)性的一種指標(biāo),對(duì)于理解系統(tǒng)的物理組成至關(guān)重要。在復(fù)雜的物理系統(tǒng)中,內(nèi)部元素的相互作用是不可避免的,這使得熵的計(jì)算成為一項(xiàng)計(jì)算量大且通常難以解決。
有人可能會(huì)感到奇怪,上面提到的數(shù)據(jù)壓縮算法和熵這兩個(gè)不同概念,兩者看起來(lái)毫不相干,怎么就連到了一起來(lái)了呢?現(xiàn)在,以色列特拉維夫大學(xué)(Tel Aviv University)的一項(xiàng)最新研究成果提出了一種非常簡(jiǎn)單而有效的熵計(jì)算方法,這種方法很可能就存在于你的電腦里的數(shù)據(jù)壓縮算法,就可以簡(jiǎn)單而又方便地計(jì)算熵。這項(xiàng)研究成果發(fā)表在最近一期的《物理評(píng)論快報(bào)》上。
特拉維夫大學(xué)的科學(xué)家們發(fā)現(xiàn)了這種使用標(biāo)準(zhǔn)壓縮算法,利用我們?cè)谟?jì)算機(jī)上都擁有的zip軟件來(lái)計(jì)算熵。通過(guò)使用超級(jí)計(jì)算機(jī)來(lái)模擬患者處于患病狀態(tài)的蛋白質(zhì)的折疊與差錯(cuò)折疊。他們的研究表明,使用標(biāo)準(zhǔn)壓縮算法,就可以計(jì)算出蛋白質(zhì)的熵值來(lái)提供有關(guān)這些蛋白質(zhì)物理性質(zhì)的新見(jiàn)解幫助診斷。
這種計(jì)算熵的新方法利用計(jì)算機(jī)仿真的強(qiáng)大功能,可以滿足解決科學(xué)和醫(yī)學(xué)領(lǐng)域緊急而又及時(shí)的迫切需求。研究人員認(rèn)為,這項(xiàng)研究具有無(wú)限的應(yīng)用,從生物醫(yī)學(xué)模擬到在物理、化學(xué)或材料科學(xué)領(lǐng)域進(jìn)行的基礎(chǔ)研究,這種新算法在任何計(jì)算機(jī)上都將易于使用。
研究人員說(shuō):一個(gè)高中生就可以使用我們的概念方法來(lái)計(jì)算一個(gè)復(fù)雜的物理系統(tǒng)的XY模型的熵。熵過(guò)去被認(rèn)為是一個(gè)具有挑戰(zhàn)性的問(wèn)題,但是學(xué)生在很少的指導(dǎo)下即可以完成。這證明了幾乎任何人都可以輕松地使用這種方法來(lái)解決非常有趣的問(wèn)題。
研究人員是在和學(xué)生們從信息論的角度討論熵時(shí),產(chǎn)生了這種計(jì)算方法的構(gòu)想。他們想知道這個(gè)想法在實(shí)踐中而不是理論上是否行得通。他們用可以比較的熵值模擬了一些標(biāo)準(zhǔn)物理系統(tǒng)。很快,他們發(fā)現(xiàn)壓縮后的模擬數(shù)據(jù)文件大小會(huì)按預(yù)期的熵增加和減少。不久之后,他們意識(shí)到可以將壓縮文件的大小轉(zhuǎn)換為可用的值——物理熵。令人驚訝的是,他們進(jìn)行了簡(jiǎn)單的轉(zhuǎn)換即對(duì)所有研究的系統(tǒng)都有效。
研究人員目前正在將其方法與概念應(yīng)用擴(kuò)展到各種各樣的系統(tǒng)中。研究人員總結(jié)道:“自從我們開(kāi)始工作并談?wù)撐覀兊墓ぷ饕詠?lái),許多來(lái)自不同領(lǐng)域的研究人員都與我們接觸,要求我們幫助他們根據(jù)他們的數(shù)據(jù)計(jì)算熵。” “目前,我們專注于蛋白質(zhì)折疊的模擬,這是一個(gè)及時(shí)而緊迫的話題,可以從我們的發(fā)現(xiàn)中受益匪淺。”
(責(zé)任編輯:fqj)
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7067瀏覽量
89108 -
計(jì)算
+關(guān)注
關(guān)注
2文章
450瀏覽量
38824
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論