天天狠天天透,综合色网站,一个人在线观看免费的视频bd

人工智能，尤其是深度學(xué)習(xí)是一種正在改變?nèi)藗兩畹脑S多方面的計(jì)算技術(shù)。深度學(xué)習(xí)的算法需要大量的數(shù)據(jù)。數(shù)量確實(shí)取決于算法和生成的網(wǎng)絡(luò)模型的目標(biāo)，但對(duì)于一些復(fù)雜的模式來(lái)說(shuō)，它可能會(huì)運(yùn)行數(shù)億的輸入集合。

人工智能是計(jì)算領(lǐng)域的熱門話題之一，并且有著充分的理由。深度學(xué)習(xí)(DL)中的新技術(shù)在某些問(wèn)題上有能力創(chuàng)建比人類精確度更好的神經(jīng)網(wǎng)絡(luò)。圖像識(shí)別是深度學(xué)習(xí)(DL)模型如何在識(shí)別圖像中的對(duì)象(對(duì)象檢測(cè)和分類)方面實(shí)現(xiàn)比人類準(zhǔn)確性更好的一個(gè)例子。

ImageNet競(jìng)賽就是一個(gè)例子。自2010年以來(lái)，ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)(ILSVRC)已被用作圖像識(shí)別改進(jìn)的衡量標(biāo)準(zhǔn)。在2011年，其錯(cuò)誤率約為25%(該工具可以正確識(shí)別培訓(xùn)數(shù)據(jù)集之外的75%的圖像)。2012年，深度神經(jīng)網(wǎng)絡(luò)(DNN)的錯(cuò)誤率降低到16%。在接下來(lái)的幾年里，其錯(cuò)誤率將降至個(gè)位數(shù)。在2017年，36支參賽團(tuán)隊(duì)中有29人的失誤率低于5%，這通常要比人類識(shí)別做的更好。

深度學(xué)習(xí)使用各種類型的神經(jīng)網(wǎng)絡(luò)，可應(yīng)用于各種各樣的問(wèn)題。創(chuàng)建深度學(xué)習(xí)模型通常有兩個(gè)主要步驟：第一步就是所謂的訓(xùn)練。這是讓模型重復(fù)讀取輸入數(shù)據(jù)集，并調(diào)整模型參數(shù)以最小化錯(cuò)誤(正確輸出與計(jì)算輸出之間的差異)的過(guò)程。這一步需要大量的輸入，需要極端大量的計(jì)算量。

第二步發(fā)生在模型訓(xùn)練后，稱之為推理。這是訓(xùn)練模型在生產(chǎn)中的部署。生產(chǎn)意味著該模型可用于讀取未用于培訓(xùn)的數(shù)據(jù)。它產(chǎn)生用于某個(gè)任務(wù)的輸出，而不是訓(xùn)練神經(jīng)網(wǎng)絡(luò)。這一步也有一個(gè)計(jì)算組件。它不需要大量計(jì)算，它需要實(shí)現(xiàn)諸如最小化延遲、最佳可能精度，最大化吞吐量，以及最大化能源效率等目標(biāo)。

用于執(zhí)行這兩個(gè)步驟的計(jì)算的軟件由框架完成。這些軟件工具和數(shù)據(jù)庫(kù)可以讀取通常用Python編寫的腳本，告訴框架需要什么樣的操作以及神經(jīng)網(wǎng)絡(luò)是什么樣的。該代碼然后由框架讀取，然后執(zhí)行。框架的例子有Tensorflow、Caffe或PyTorch。

有關(guān)IO模式的問(wèn)題

通過(guò)研究深度學(xué)習(xí)(DL)框架的功能，可以了解IO模式。人們不需要知道具體框架的細(xì)節(jié)，也不需要了解神經(jīng)網(wǎng)絡(luò)背后的數(shù)學(xué)知識(shí)。

深度學(xué)習(xí)(DL)框架中訓(xùn)練步驟的基本流程非常簡(jiǎn)單。神經(jīng)網(wǎng)絡(luò)需要相當(dāng)多的輸入數(shù)據(jù)來(lái)正確訓(xùn)練網(wǎng)絡(luò)來(lái)執(zhí)行任務(wù)。它可以是圖像、視頻、音量、數(shù)字或幾乎任何數(shù)據(jù)的組合。

人們需要大量的數(shù)據(jù)。此外，其數(shù)據(jù)必須非常多樣化，并為每個(gè)輸入提供廣泛的信息。例如，確定某人是男性還是女性的簡(jiǎn)單面部識(shí)別需要超過(guò)1億張圖像。

輸入數(shù)據(jù)能夠以各種方式進(jìn)行存儲(chǔ)，從簡(jiǎn)單的csv文件中獲取真正少量的輸入數(shù)據(jù)，以便了解深度神經(jīng)網(wǎng)絡(luò)(DNN)的數(shù)據(jù)庫(kù)，以及包含圖像的數(shù)據(jù)庫(kù)。只要深度神經(jīng)網(wǎng)絡(luò)(DNN)可以訪問(wèn)數(shù)據(jù)并理解輸入格式，數(shù)據(jù)也可以分布在不同的格式和工具中。它也可以是結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的組合，只要用戶知道數(shù)據(jù)和格式，并且可以在模型中表達(dá)這些數(shù)據(jù)和格式即可。

存儲(chǔ)介質(zhì)上的數(shù)據(jù)大小可能會(huì)有所不同。在極端情況下，來(lái)自MNIST數(shù)據(jù)集的簡(jiǎn)單圖像是28×28灰度圖像(值從0到255)。總共有784個(gè)像素，這格式非常小。如今人們擁有4K分辨率的電視機(jī)和相機(jī)。這將是4,096 x 4,096像素，總共16,777,216個(gè)像素。

4K色彩表示通常以8位(256個(gè)選擇)開(kāi)始，或者可以達(dá)到16位信息。這可能導(dǎo)致非常大的圖像。如果將一個(gè)4K圖像制作為分辨率為4520 x 2540和8位的單個(gè)未壓縮的tiff文件，則其大小為45.9 MB。而對(duì)于16位色的圖像來(lái)說(shuō)，其大小為91.8 MB。

如果組織擁有1億張圖片，對(duì)于一些面部識(shí)別算法來(lái)說(shuō)是合理的，組織擁有這么多文件，這對(duì)當(dāng)今的文件系統(tǒng)來(lái)說(shuō)并不算太壞。在8位圖像情況下使用的總空間是4.59 PB。對(duì)于使用大型高分辨率圖像的單個(gè)神經(jīng)網(wǎng)絡(luò)(NN)來(lái)說(shuō)，這是相當(dāng)大的空間。

一般來(lái)說(shuō)，神經(jīng)網(wǎng)絡(luò)在訓(xùn)練網(wǎng)絡(luò)時(shí)有兩個(gè)階段。第一階段稱為前饋。它接受輸入并通過(guò)網(wǎng)絡(luò)進(jìn)行處理。輸出與正確的輸出進(jìn)行比較以產(chǎn)生錯(cuò)誤。然后通過(guò)網(wǎng)絡(luò)傳播這個(gè)錯(cuò)誤(反向傳播)來(lái)調(diào)整網(wǎng)絡(luò)的參數(shù)，以便希望減少網(wǎng)絡(luò)產(chǎn)生的錯(cuò)誤。

這個(gè)過(guò)程繼續(xù)進(jìn)行，以便所有圖像通過(guò)網(wǎng)絡(luò)進(jìn)行處理。這被稱為epoch(迭代次數(shù)，1個(gè)epoch等于使用訓(xùn)練集中的全部樣本訓(xùn)練一次)。培訓(xùn)一個(gè)網(wǎng)絡(luò)達(dá)到所需的性能水平可能需要數(shù)百、數(shù)千或數(shù)萬(wàn)個(gè)epoch。深度學(xué)習(xí)框架(例如Tensorflow或Caffe或PyTorch)負(fù)責(zé)用戶創(chuàng)建的網(wǎng)絡(luò)模型的整個(gè)過(guò)程。

整體IO進(jìn)程

深度學(xué)習(xí)的IO模式的簡(jiǎn)要概述是數(shù)據(jù)一次又一次地被讀取。深度學(xué)習(xí)經(jīng)常重復(fù)讀取(重讀)。請(qǐng)注意讀取一些文字，但與閱讀相比，它的工作量是很小的，因?yàn)樗饕窃谏窠?jīng)網(wǎng)絡(luò)訓(xùn)練期間檢查指向。但是，為了改進(jìn)神經(jīng)網(wǎng)絡(luò)訓(xùn)練，可以使用一些影響IO模式的選項(xiàng)。

作為讀取或?qū)懭霐?shù)據(jù)量的示例，在此假設(shè)網(wǎng)絡(luò)需要1億張圖像，其中每張圖像為45.9 MB。此外，假設(shè)網(wǎng)絡(luò)模型需要大約40MB來(lái)保存，并且每100個(gè)epoch保存一次，并且需要5000個(gè)epoch來(lái)訓(xùn)練模型。

如前所述，一個(gè)epoch需要讀取4.59 PB的數(shù)據(jù)。這需要重復(fù)5000次。這總共需要讀取22.95EB的數(shù)據(jù)。如果每個(gè)圖像是單個(gè)文件，它還需要讀取500億個(gè)文件。

對(duì)于寫入IO，模型需要寫入50次。這是總共2 GB和50個(gè)寫入。與讀取相比，其工作量是非常小的。

對(duì)于這個(gè)例子，總共有459個(gè)PB執(zhí)行了100億個(gè)讀取IO。隨后是40MB的寫入IO。整個(gè)IO模式總共重復(fù)50次。

這是面向識(shí)別應(yīng)用的深度神經(jīng)網(wǎng)絡(luò)(DNN)的基本IO模式。為了減少訓(xùn)練時(shí)間，可以使用幾種技術(shù)。以下的主題是從IO角度對(duì)這些技術(shù)進(jìn)行快速概述。

訓(xùn)練技巧

神經(jīng)網(wǎng)絡(luò)(NN)訓(xùn)練中使用的第一種技術(shù)是輸入數(shù)據(jù)的隨機(jī)混洗。幾乎所有的時(shí)間都用它來(lái)減少所需的歷元(參考的時(shí)刻點(diǎn))并防止過(guò)擬合(優(yōu)化模型到數(shù)據(jù)集，但是模型在現(xiàn)實(shí)世界的數(shù)據(jù)上表現(xiàn)不佳)。

在新的epoch開(kāi)始之前，數(shù)據(jù)讀取的順序是隨機(jī)的。這意味著讀取的IO模式是基于每個(gè)圖像的隨機(jī)數(shù)。在閱讀個(gè)人圖像時(shí)是連續(xù)的，但在圖像之間是隨機(jī)的。因此，由于隨機(jī)性，將模式表征為“重讀”而非“讀取”是困難的。

也有可以從數(shù)據(jù)庫(kù)中讀取數(shù)據(jù)的框架。IO模式的讀取仍然非常繁重，可能會(huì)隨機(jī)對(duì)數(shù)據(jù)進(jìn)行混洗。這可能會(huì)使IO模式的細(xì)節(jié)更加復(fù)雜化，因?yàn)閿?shù)據(jù)庫(kù)位于內(nèi)存和框架之間。

有時(shí)框架也會(huì)使用IO的mmap()函數(shù)。這是一個(gè)將文件或設(shè)備映射到內(nèi)存的系統(tǒng)調(diào)用。當(dāng)將虛擬內(nèi)存區(qū)域映射到文件時(shí)，它被稱為“基于文件的映射”。讀取某些內(nèi)存區(qū)域?qū)?huì)讀取文件。這是默認(rèn)行為。

無(wú)論是否使用mmap()，IO模式仍然是重讀的，遵循以上討論的模式。然而，使用mmap()會(huì)使分析復(fù)雜化，因?yàn)镮O直接從文件到內(nèi)存。

另一種常用的提高訓(xùn)練性能的技術(shù)稱為批處理。在每個(gè)輸入圖像(包括向前和向后傳播)之后更新網(wǎng)絡(luò)，而不是在輸入“批量”圖像之后更新網(wǎng)絡(luò)。網(wǎng)絡(luò)的反向傳播部分對(duì)錯(cuò)誤進(jìn)行操作，例如對(duì)它們進(jìn)行平均，以更新網(wǎng)絡(luò)參數(shù)。這通常不會(huì)改變IO模式，因?yàn)閳D像仍然需要被讀取，但它可能會(huì)影響收斂速度。一般來(lái)說(shuō)，它可以減緩收斂速度，但后向傳播的發(fā)生較少，提高了計(jì)算速度。

在使用GPU(圖形處理單元)進(jìn)行訓(xùn)練時(shí)，使用批處理還有助于提高性能。批處理不是將文件從CPU移動(dòng)到GPU，而是允許用戶將多個(gè)文件復(fù)制到GPU。這可以提高從CPU到GPU的吞吐量，并減少數(shù)據(jù)傳輸時(shí)間。以這個(gè)例子為例，批處理大小為32將減少數(shù)據(jù)傳輸?shù)?125000個(gè)傳輸?shù)臄?shù)量。

批處理確實(shí)有助于收斂，但不會(huì)真正影響IO模式。該模式仍然是隨機(jī)讀取，寫入很少。但它可以改變框架創(chuàng)建的輸出量。

數(shù)據(jù)存儲(chǔ)與深度學(xué)習(xí)

在以往，有人討論數(shù)據(jù)將變得越來(lái)越冷。這意味著在創(chuàng)建數(shù)據(jù)后，很少再次使用它。而人們通過(guò)檢查數(shù)據(jù)，包括工程和企業(yè)數(shù)據(jù)，并發(fā)現(xiàn)了一些非常有趣的趨勢(shì)：

?這兩種工作負(fù)載都更加面向?qū)懭搿Ｗx寫字節(jié)比率已顯著下降(從4：1到2：1)

?相對(duì)于只讀和只寫訪問(wèn)模式，讀寫訪問(wèn)模式增加了30倍。

?文件很少重新打開(kāi)。超過(guò)66%只重開(kāi)一次，95%少于五次。

?文件很少重新打開(kāi)。

?研究期間超過(guò)90%的活動(dòng)存儲(chǔ)空間未被使用。

?一小部分客戶占文件活動(dòng)的很大一部分。不到1%的客戶占文件請(qǐng)求的50%。

而總結(jié)數(shù)據(jù)的總體使用非常容易。

?IO模式非常重視寫入。

?數(shù)據(jù)很少被重復(fù)使用，但仍然存在。

比較深入學(xué)習(xí)算法的IO模式，可以發(fā)現(xiàn)它與傳統(tǒng)工程師、HPC和企業(yè)應(yīng)用程序的做法幾乎完全相反。深度學(xué)習(xí)非常重讀IO導(dǎo)向，數(shù)據(jù)在設(shè)計(jì)和訓(xùn)練模型時(shí)被重復(fù)使用。即使在模型被訓(xùn)練之后，仍然需要用新數(shù)據(jù)來(lái)增加現(xiàn)有的訓(xùn)練數(shù)據(jù)集，特別是模型輸出中的誤差。這是為了隨著時(shí)間的推移對(duì)模型進(jìn)行的改進(jìn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

IO

IO

+關(guān)注

關(guān)注
0

文章
448

瀏覽量
39132
數(shù)據(jù)存儲(chǔ)

數(shù)據(jù)存儲(chǔ)

+關(guān)注

關(guān)注
5

文章
970

瀏覽量
50894
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5500

瀏覽量
121113

原文標(biāo)題：數(shù)據(jù)存儲(chǔ)、人工智能和IO模式

文章出處：【微信號(hào)：D1Net08，微信公眾號(hào)：AI人工智能D1net】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

2023年使用樹莓派和替代品進(jìn)行深度學(xué)習(xí)

此頁(yè)面可幫助您在Raspberry Pi或Google Coral或Jetson Nano等替代品上構(gòu)建深度學(xué)習(xí)模式。有關(guān)深度

發(fā)表于 05-05 09:47 ?2674次閱讀

2023年使用樹莓派和替代品進(jìn)行<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>

淺談示波器的存儲(chǔ)深度

信號(hào)，只需要500點(diǎn)的記錄長(zhǎng)度；但如果要解析一個(gè)復(fù)雜的數(shù)字數(shù)據(jù)流，則需要有上萬(wàn)個(gè)點(diǎn)或更多點(diǎn)的存儲(chǔ)深度，這是普通存儲(chǔ)是做不到的，這時(shí)候就需要我們選擇長(zhǎng)

發(fā)表于 05-07 10:46

數(shù)據(jù)存儲(chǔ)與文件IO后續(xù)資源包 Datalogging_FileIO

數(shù)據(jù)存儲(chǔ)與文件IO后續(xù)資源包，供大家參考學(xué)習(xí)

發(fā)表于 06-04 00:24

LabVIEW讀取示波器數(shù)據(jù)的存儲(chǔ)深度問(wèn)題

LabVIEW讀取示波器發(fā)過(guò)來(lái)的數(shù)據(jù)，每次只能讀去1000個(gè)點(diǎn)，但是示波器數(shù)據(jù)的存儲(chǔ)深度遠(yuǎn)遠(yuǎn)大于1000，請(qǐng)問(wèn)怎樣可以改變LabVIEW讀取示波器數(shù)

發(fā)表于 07-14 08:58

淺談示波器的存儲(chǔ)深度

。長(zhǎng)存儲(chǔ)對(duì)測(cè)量的影響明白了存儲(chǔ)深度與取樣速度密切關(guān)系后，我們來(lái)淺談下長(zhǎng)存儲(chǔ)對(duì)于我們平常的測(cè)量帶來(lái)什么的影響呢？平常分析一個(gè)十分穩(wěn)定的正弦信號(hào)，只需要500點(diǎn)的記錄長(zhǎng)度；但如果要解析一個(gè)

發(fā)表于 08-10 16:02

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合

發(fā)表于 07-04 16:07

IO擴(kuò)展模式IO模式

IO擴(kuò)展模式IO模式，我們最開(kāi)始學(xué)習(xí)51單片機(jī)的時(shí)候。***itP0_0 = P0^0;//位定義P0_0 = 1; //直接對(duì)端口進(jìn)行賦值

發(fā)表于 11-30 06:17

示波器的變長(zhǎng)存儲(chǔ)深度和分段存儲(chǔ)

和準(zhǔn)確。所以LOTO示波器的存儲(chǔ)深度是變長(zhǎng)的。在這個(gè)模式下，LOTO示波器還提供了500幀的PC緩存功能，還提供了余暉功能。這兩個(gè)功能記錄多幀的數(shù)據(jù)和波形，分別橫向排開(kāi)顯示以及垂直疊加

發(fā)表于 06-22 15:44

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

準(zhǔn)確的模型。有了上述機(jī)制，現(xiàn)在可以通過(guò)讓神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)各種問(wèn)題來(lái)自動(dòng)解決問(wèn)題，創(chuàng)建高精度模型，并對(duì)新數(shù)據(jù)進(jìn)行推理。然而，由于單個(gè)神經(jīng)網(wǎng)絡(luò)只能解決簡(jiǎn)單的問(wèn)題，人們嘗試通過(guò)構(gòu)建深度神經(jīng)網(wǎng)絡(luò) (DNN

發(fā)表于 02-17 16:56

PLASTER：一個(gè)與深度學(xué)習(xí)性能有關(guān)的框架

PLASTER 是一個(gè)與深度學(xué)習(xí)有關(guān)的框架，為致力于開(kāi)發(fā)和部署基于 AI 的服務(wù)的人士提供了全方位指導(dǎo)。本文介紹了每個(gè)框架元素的測(cè)量方式，以幫助您應(yīng)對(duì)諸多 AI 挑戰(zhàn)。

發(fā)表于 06-22 15:07 ?3505次閱讀

為什么人工智能和深度學(xué)習(xí)的存儲(chǔ)很重要

如今的人工智能和深度學(xué)習(xí)應(yīng)用程序中使用了大數(shù)據(jù)集和快速I/O技術(shù)，但數(shù)據(jù)存儲(chǔ)可能會(huì)導(dǎo)致性能問(wèn)題。人們需要了解人工智能和

發(fā)表于 11-20 10:53 ?2363次閱讀

IO 與 MM模式

IO擴(kuò)展模式IO模式，我們最開(kāi)始學(xué)習(xí)51單片機(jī)的時(shí)候。 sbit P0_0 = P0^0; //位定義 P0_0 = 1;

發(fā)表于 11-21 17:51 ?1次下載

什么是深度學(xué)習(xí)（Deep Learning）？深度學(xué)習(xí)的工作原理詳解

學(xué)習(xí)中的“深度”一詞表示用于識(shí)別數(shù)據(jù)模式的多層算法或神經(jīng)網(wǎng)絡(luò)。DL 高度靈活的架構(gòu)可以直接從原始數(shù)據(jù)中學(xué)

發(fā)表于 04-01 10:34 ?1.1w次閱讀

讀懂深度學(xué)習(xí)，走進(jìn)“深度學(xué)習(xí)+”階段

人工智能的概念在1956年就被提出，如今終于走入現(xiàn)實(shí)，離不開(kāi)一種名為“深度學(xué)習(xí)”的技術(shù)。深度學(xué)習(xí)的運(yùn)作模式，如同一場(chǎng)傳話游戲。給神經(jīng)網(wǎng)絡(luò)輸入

發(fā)表于 01-14 23:34 ?882次閱讀

什么是深度學(xué)習(xí)算法？深度學(xué)習(xí)算法的應(yīng)用

。在深度學(xué)習(xí)中，使用了一些快速的算法，比如卷積神經(jīng)網(wǎng)絡(luò)以及深度神經(jīng)網(wǎng)絡(luò)，這些算法在大量數(shù)據(jù)處理和圖像識(shí)別上面有著非常重要的作用。深度

發(fā)表于 08-17 16:03 ?2145次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

有關(guān)IO模式的問(wèn)題,數(shù)據(jù)存儲(chǔ)與深度學(xué)習(xí)

評(píng)論

2023年使用樹莓派和替代品進(jìn)行深度學(xué)習(xí)

淺談示波器的存儲(chǔ)深度

數(shù)據(jù)存儲(chǔ)與文件IO后續(xù)資源包 Datalogging_FileIO

LabVIEW讀取示波器數(shù)據(jù)的存儲(chǔ)深度問(wèn)題

淺談示波器的存儲(chǔ)深度

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

IO擴(kuò)展模式IO模式

示波器的變長(zhǎng)存儲(chǔ)深度和分段存儲(chǔ)

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

PLASTER：一個(gè)與深度學(xué)習(xí)性能有關(guān)的框架

為什么人工智能和深度學(xué)習(xí)的存儲(chǔ)很重要

IO 與 MM模式

什么是深度學(xué)習(xí)（Deep Learning）？深度學(xué)習(xí)的工作原理詳解

讀懂深度學(xué)習(xí)，走進(jìn)“深度學(xué)習(xí)+”階段

什么是深度學(xué)習(xí)算法？深度學(xué)習(xí)算法的應(yīng)用