亚洲精品片,丝瓜茄子绿巨人秋葵榴莲污,天天爱天天做天天爽

人工智能、機器學習、深度學習應用的強烈需求對數據中心的性能、可靠性和可擴展性提出了挑戰，尤其是當架構師模仿公共云的設計以簡化向混合云和內部部署的過渡時。

GPU（圖形處理單元）服務器如今很常見，圍繞GPU計算的生態系統正在迅速發展，以提高GPU工作負載的效率和可擴展性。然而在避免存儲和網絡中潛在的瓶頸的同時，也有一些技巧可以很大限度地提高GPU的利用率。

Excelero公司首席技術官Sven Breuner和首席架構師Kirill Shoikhet提供了9個為人工智能、機器學習和深度學習做好準備的更好實踐。

數據點1：了解目標系統性能、投資回報率和可擴展性計劃。

這樣，他們就可以與數據中心目標相吻合。隨著人工智能成為核心業務的重要組成部分，大多數組織都從最初的少量預算和少量培訓數據集入手，并為無縫和快速的系統增長在基礎設施方面做好準備。需要構建所選的硬件和軟件基礎設施，以實現靈活的橫向擴展，以避免在每個新的增長階段產生破壞性的變化。數據科學家與系統管理員之間的緊密協作對于了解性能要求，并了解基礎設施可能需要隨著時間的推移而發展而至關重要。

數據點2：評估集群多個GPU系統。

在擁有多個GPU的服務器中可以在系統內部實現高效的數據共享和通信，并具有成本效益，而參考設計假定將來會在集群中使用，并且在單個服務器中最多支持16個GPU。多GPU服務器需要準備好以非常高的速率讀取傳入的數據，以保持GPU滿載運行，這意味著它需要一個超高速網絡連接，一直到培訓數據庫的存儲系統。但是在某個時候，單臺服務器將不足以在合理的時間內通過不斷增長的培訓數據庫進行工作，因此，在設計中構建共享存儲基礎設施將使得隨著人工智能、機器學習、深度學習用途的擴展，并更容易添加GPU服務器。

數據點3：評估人工智能工作流程各個階段的瓶頸。

數據中心基礎設施需要能夠同時處理人工智能工作流程的所有階段。對于具有成本效益的數據中心來說，擁有可靠的資源調度和共享概念是至關重要的，因此，當一組數據科學家獲得需要攝取和準備的新數據時，其他人將對其可用數據進行培訓，而在其他地方，先前生成的模型將用于生產。Kubernetes已經成為解決這一問題的主要解決方案，它使云計算技術在內部部署很容易獲得，并使混合部署變得可行。

數據點4：查看用于優化GPU利用率和性能的策略。

許多人工智能、機器學習、深度學習應用程序的計算密集型性質使基于GPU的服務器成為常見選擇。但是，盡管GPU可以有效地從內存加載數據，但是訓練數據集通常遠遠超過內存的容量，并且涉及的大量文件變得更加難以攝取。在GPU服務器之間以及與存儲基礎設施之間、實現GPU數量與可用CPU功率、內存和網絡帶寬之間的最佳平衡至關重要。

數據點5：支持訓練和推理階段的需求。

在訓練系統“看貓”的一個經典示例中，計算機執行數字游戲（或更確切地說是GPU）需要看到很多顏色各不相同的貓。由于包含大量并行文件讀取的訪問的性質，NVMe閃存通過提供超低的訪問延遲和每秒的大量讀取操作很好地滿足了這些要求。在推理階段，其挑戰是相似的，因為對象識別通常實時進行，這是NVMe閃存還具有延遲優勢的另一個用例。

數據點6：考慮并行文件系統和替代方案。

諸如IBM公司的SpectrumScale或BeeGFS之類的并行文件系統可以幫助有效地處理大量小文件的元數據，并通過在網絡上每秒交付數萬個小文件，從而使機器學習數據集的分析速度提高3到4倍。鑒于訓練數據具有只讀性，因此在將數據量直接提供給GPU服務器并通過Kubernetes之類的框架以共享方式共享數據時，也可以完全避免使用并行文件系統。

數據點7：選擇正確的網絡主干。

人工智能、機器學習、深度學習通常是一種新的工作負載，將其重新安裝到現有的網絡基礎設施中，通常無法支持復雜計算和快速高效數據傳輸所需的低延遲、高帶寬、高消息速率和智能卸載。基于RDMA的網絡傳輸RoCE（融合以太網上的RDMA）和InfiniBand已成為滿足這些新需求的標準。

數據點8：考慮四個存儲系統的性價比杠桿。

（1）高讀取吞吐量與低延遲結合在一起，這不會限制混合部署，并且可以在云平臺或內部部署資源上運行。

（2）數據保護。人工智能、機器學習、深度學習存儲系統通常比數據中心中的其他系統要快得多，因此在完全故障后從備份中恢復可能會花費很長時間，并且會中斷正在進行的操作。深度學習訓練的只讀特性使它非常適合分布式擦除編碼，在這種存儲中，最高容錯能力已經內置在主存儲系統中，原始容量和可用容量之間的差異很小。

（3）容量彈性可適應任何大小或類型的驅動器，以便隨著閃存介質的發展和閃存驅動器特性的擴展，數據中心可以在最重要的情況下最大程度地實現規模化的性價比。

（4）性能彈性。由于人工智能數據集需要隨著時間的推移而增長，以進一步提高模型的準確性，因此存儲基礎設施應實現接近線性的縮放系數，在這種情況下，每增加一次存儲都會帶來同等的增量性能。這使得組織可以從小規模開始，并根據業務需要無中斷地增長。

數據點9：設置基準和性能指標以幫助實現可擴展性。

例如，對于深度學習存儲，一種度量標準可能是每個GPU每秒處理X個文件（通常為數千或數萬個），其中每個文件的平均大小為Y（從幾十個到數千個）KB。預先建立適當的度量標準有助于從一開始就確定架構方法和解決方案，并指導后續擴展。
責編AJX

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1791

文章
47208

瀏覽量
238304
機器學習

機器學習

+關注

關注
66

文章
8408

瀏覽量
132580
深度學習

深度學習

+關注

關注
73

文章
5500

瀏覽量
121118

百度深度學習研究院科學家深度講解人工智能

過優異成績。其主要的興趣是關注人工智能特別是計算機視覺技術如何從技術、產品和商業角度在真實世界中大規模落地。主題簡介及亮點：講者作為人工智能行業內少有的兼顧算法研究和產品應用的專家，希望基于自己多年

發表于 07-19 10:01

人工智能和機器學習的前世今生

，進行了大量的假設迭代。正是這種假設使得機器學習算法能夠在短時間內得到一個更好地逼近目標函數的近似值。人工智能vs

發表于 08-27 10:16

資深大牛認證的干貨：人工智能與matlab學習資料

超10多年工作經驗的資深大牛推薦的人工智能&MATLAB學習資料。1. 主題演講： 人工智能 & 你, 準備好了嗎？2. 《MATLAB 機器

發表于 11-06 15:47

【限時免費領取】超值200G人工智能零基礎最全學習資料包，滿足你的學習需求！

`春風拂面，萬物生長，在復蘇的五月Elecfans小助手為你精心準備了人工智能學習養料足足200G的超值人工智能學習資料包相關資料截圖（Py

發表于 05-06 10:50

【專輯精選】人工智能之Python教程與資料

基礎教程（含100例程和crossin全60課）《Python編程：從入門到實踐》的源代碼python機器學習和深度學習的

發表于 05-06 17:57

史上最全AI人工智能入門+進階學習視頻全集（200G）【免費領取】

語言使用，數學庫、數據結構及相關算法，深入學習AI算法模型訓練、分析，神經網絡、機器學習、深度學習等因此，為了幫助大家

發表于 11-27 12:10

人工智能、數據挖掘、機器學習和深度學習的關系

人工智能、數據挖掘、機器學習和深度學習之間，主要有什么關系？

發表于 03-16 11:35

python人工智能/機器學習基礎是什么

python人工智能——機器學習——機器學習基礎

發表于 04-28 14:46

人工智能芯片是人工智能發展的

人工智能芯片是人工智能發展的 | 特倫斯謝諾夫斯基責編 | 屠敏本文內容經授權摘自《深度學習智能時代的核心驅動力量》從AlphaGo的人機

發表于 07-27 07:02

人工智能基本概念機器學習算法

目錄人工智能基本概念機器學習算法1. 決策樹2. KNN3. KMEANS4. SVM5. 線性回歸深度學習算法1. BP2. GANs3.

發表于 09-06 08:21

什么是人工智能、機器學習、深度學習和自然語言處理？

理論，使計算機具有自我意識和自主性，而目前它們的化身是依賴于運行用戶定義程序的機器。機器學習是人工智能的一個子集，它涉及到從經驗中

發表于 03-22 11:19

機器學習和人工智能有什么區別？

機器學習和人工智能有什么區別？當今唯一可用的軟件選項是 ML 系統。在十年左右的時間里，當計算能力和算法開發達到可以顯著影響結果的地步時，我們將見證第一個真正的

發表于 04-12 08:21

人工智能、機器學習、深度學習有什么關系？

有三個詞，這兩年出現的頻率越來越高：人工智能（AI），機器學習（ML），深度學習（DL），到底他

發表于 06-08 15:19 ?1.2w次閱讀

人工智能/機器學習/深度學習的關系

“機器學習”“人工智能”“深度學習”這三個詞常常被人混淆，但其實它們出現的時間相隔甚遠，“

發表于 01-03 15:29 ?8093次閱讀

人工智能與機器學習、深度學習的區別

人工智能包含了機器學習和深度學習。你可以在圖中看到，機器學習

發表于 03-29 11:04 ?1486次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

九個為人工智能、機器學習和深度學習做好準備的更好實踐

評論

百度深度學習研究院科學家深度講解人工智能

人工智能和機器學習的前世今生

資深大牛認證的干貨：人工智能與matlab學習資料

【限時免費領取】超值200G人工智能零基礎最全學習資料包，滿足你的學習需求！

【專輯精選】人工智能之Python教程與資料

史上最全AI人工智能入門+進階學習視頻全集（200G）【免費領取】

人工智能、數據挖掘、機器學習和深度學習的關系

python人工智能/機器學習基礎是什么

人工智能芯片是人工智能發展的

人工智能基本概念機器學習算法

什么是人工智能、機器學習、深度學習和自然語言處理？

機器學習和人工智能有什么區別？

人工智能、機器學習、深度學習有什么關系？

人工智能/機器學習/深度學習的關系

人工智能與機器學習、深度學習的區別