亚洲成人高清在线,天美蜜桃精东乌鸦果冻麻豆,婷婷亚洲国产成人精品性色

ML Ops 是 AI 領(lǐng)域中一個(gè)相對(duì)較新的概念，可解釋為「機(jī)器學(xué)習(xí)操作」。如何更好地管理數(shù)據(jù)科學(xué)家和操作人員，以便有效地開發(fā)、部署和監(jiān)視模型？其中數(shù)據(jù)質(zhì)量至關(guān)重要。

本文將介紹 ML Ops，并強(qiáng)調(diào)數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用。

ML Ops 的發(fā)展彌補(bǔ)了機(jī)器學(xué)習(xí)與傳統(tǒng)軟件工程之間的差距，而數(shù)據(jù)質(zhì)量是 ML Ops 工作流的關(guān)鍵，可以加速數(shù)據(jù)團(tuán)隊(duì)，并維護(hù)對(duì)數(shù)據(jù)的信任。

什么是 ML Ops

ML Ops 這個(gè)術(shù)語(yǔ)從 DevOps 演變而來。

DevOps 是一組過程、方法與系統(tǒng)的統(tǒng)稱，用于促進(jìn)開發(fā)（應(yīng)用程序 / 軟件工程）、技術(shù)運(yùn)營(yíng)和質(zhì)量保障（QA）部門之間的溝通、協(xié)作與整合。DevOps 旨在重視軟件開發(fā)人員（Dev）和 IT 運(yùn)維技術(shù)人員（Ops）之間溝通合作的文化、運(yùn)動(dòng)或慣例。透過自動(dòng)化軟件交付和架構(gòu)變更的流程，來使得構(gòu)建、測(cè)試、發(fā)布軟件能夠更加地快捷、頻繁和可靠。

而 MLOps 基于可提高工作流效率的 DevOps 原理和做法，例如持續(xù)集成、持續(xù)交付和持續(xù)部署。ML Ops 將這些原理應(yīng)用到機(jī)器學(xué)習(xí)過程，其目標(biāo)是：

更快地試驗(yàn)和開發(fā)模型

更快地將模型部署到生產(chǎn)環(huán)境

質(zhì)量保證

DevOps 的常用示例是使用多種工具對(duì)代碼進(jìn)行版本控制，如 git、代碼審查、持續(xù)集成（CI，即頻繁地將代碼合并到共享主線中）、自動(dòng)測(cè)試和持續(xù)部署（CD，即自動(dòng)將代碼合并到生產(chǎn)環(huán)境）。

在應(yīng)用于機(jī)器學(xué)習(xí)時(shí)，ML Ops 旨在確保模型輸出質(zhì)量的同時(shí)，加快機(jī)器學(xué)習(xí)模型的開發(fā)和生產(chǎn)部署。但是，與軟件開發(fā)不同，ML 需要處理代碼和數(shù)據(jù)：

機(jī)器學(xué)習(xí)始于數(shù)據(jù)，而數(shù)據(jù)來源不同，需要用代碼對(duì)不同來源數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和存儲(chǔ)。

然后，將處理好的數(shù)據(jù)提供給數(shù)據(jù)科學(xué)家，數(shù)據(jù)科學(xué)家進(jìn)行代碼編寫，完成特征工程、開發(fā)、訓(xùn)練和測(cè)試機(jī)器學(xué)習(xí)模型，最終將這些模型部署到生產(chǎn)環(huán)境中。

在生產(chǎn)中，ML 模型是以代碼的形式存在的，輸入數(shù)據(jù)同樣可以從各種來源獲取，并創(chuàng)建用于輸入產(chǎn)品和業(yè)務(wù)流程的輸出數(shù)據(jù)。

人工智能科普：數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用

雖然上文的描述對(duì)該過程進(jìn)行了簡(jiǎn)化，但是仍然可以看出代碼和數(shù)據(jù)在 ML 環(huán)境中是緊密耦合的，而 ML Ops 需要兼顧兩者。

具體來說，這意味著 ML Ops 包含以下任務(wù)：

對(duì)用于數(shù)據(jù)轉(zhuǎn)換和模型定義的代碼進(jìn)行版本控制;

在投入生產(chǎn)之前，對(duì)所獲取的數(shù)據(jù)和模型代碼進(jìn)行自動(dòng)測(cè)試;

在穩(wěn)定且可擴(kuò)展的環(huán)境中將模型部署到生產(chǎn)中;

監(jiān)控模型性能和輸出。

數(shù)據(jù)測(cè)試和文檔記錄如何適配 ML Ops？

ML Ops 旨在加速機(jī)器學(xué)習(xí)模型的開發(fā)和生產(chǎn)部署，同時(shí)確保模型輸出的質(zhì)量。當(dāng)然，對(duì)于數(shù)據(jù)質(zhì)量人員來說，要實(shí)現(xiàn) ML 工作流中各個(gè)階段的加速和質(zhì)量，數(shù)據(jù)測(cè)試和文檔記錄是非常重要的：

在利益相關(guān)者方面，質(zhì)量差的數(shù)據(jù)會(huì)影響他們對(duì)系統(tǒng)的信任，從而對(duì)基于該系統(tǒng)做出決策產(chǎn)生負(fù)面影響。甚至更糟的是，未引起注意的數(shù)據(jù)質(zhì)量問題可能導(dǎo)致錯(cuò)誤的結(jié)論，并糾正這些問題又會(huì)浪費(fèi)很多時(shí)間。

在工程方面，急于修復(fù)下游消費(fèi)者注意到的數(shù)據(jù)質(zhì)量問題，是消耗團(tuán)隊(duì)時(shí)間并緩慢侵蝕團(tuán)隊(duì)生產(chǎn)力和士氣的頭號(hào)問題之一。

此外，數(shù)據(jù)文檔記錄對(duì)于所有利益相關(guān)者進(jìn)行數(shù)據(jù)交流、建立數(shù)據(jù)合同至關(guān)重要。

下文將從非常抽象的角度介紹 ML pipeline 中的各個(gè)階段，并討論數(shù)據(jù)測(cè)試和文檔記錄如何適應(yīng)每個(gè)階段。

1. 數(shù)據(jù)獲取階段

即使是在數(shù)據(jù)集處理的早期階段，從長(zhǎng)遠(yuǎn)來看，對(duì)數(shù)據(jù)進(jìn)行質(zhì)量檢查和文檔記錄可以極大地加速操作。對(duì)于工程師來說，可靠的數(shù)據(jù)測(cè)試非常重要，可以使他們安全地對(duì)數(shù)據(jù)獲取 pipeline 進(jìn)行更改，而不會(huì)造成不必要的問題。同時(shí)，當(dāng)從內(nèi)部和外部上游來源獲取數(shù)據(jù)時(shí)，為了確保數(shù)據(jù)出現(xiàn)未預(yù)料的更改，在獲取階段進(jìn)行數(shù)據(jù)驗(yàn)證是非常重要的。

2. 模型開發(fā)

本文將特征工程、模型訓(xùn)練和模型測(cè)試作為核心模型開發(fā)流程的一部分。在這個(gè)不斷迭代的過程中，圍繞數(shù)據(jù)轉(zhuǎn)換代碼和支持?jǐn)?shù)據(jù)科學(xué)家的模型輸出提供支持，因此在一個(gè)地方進(jìn)行更改不會(huì)破壞其他地方的內(nèi)容。

在傳統(tǒng)的 DevOps 中，通過 CI/CD 工作流進(jìn)行持續(xù)的測(cè)試，可以快速地找出因代碼修改而引入的任何問題。更進(jìn)一步，大多數(shù)軟件工程團(tuán)隊(duì)要求開發(fā)人員不僅要使用現(xiàn)有的測(cè)試來測(cè)試代碼，還要在創(chuàng)建新功能時(shí)添加新的測(cè)試。同樣，運(yùn)行測(cè)試以及編寫新的測(cè)試應(yīng)該是 ML 模型開發(fā)過程的一部分。

3. 在生產(chǎn)中運(yùn)行模型

與所有 ML Ops 一樣，在生產(chǎn)環(huán)境中運(yùn)行的模型依賴于代碼和輸入數(shù)據(jù)，來產(chǎn)生可靠的結(jié)果。與數(shù)據(jù)獲取階段類似，我們需要保護(hù)數(shù)據(jù)輸入，以避免由于代碼更改或?qū)嶋H數(shù)據(jù)更改而引起的不必要問題。同時(shí)，我們還應(yīng)該圍繞模型輸出進(jìn)行一些測(cè)試，以確保模型繼續(xù)滿足我們的期望。

尤其是在具有黑盒 ML 模型的環(huán)境中，建立和維護(hù)質(zhì)量標(biāo)準(zhǔn)對(duì)于模型輸出至關(guān)重要。同樣地，在共享區(qū)域記錄模型的預(yù)期輸出可以幫助數(shù)據(jù)團(tuán)隊(duì)和利益相關(guān)者定義和傳達(dá)「數(shù)據(jù)合同」，從而增加 ML pipeline 的透明度和信任度。

人工智能科普：數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用

原文鏈接：https://greatexpectations.io/blog/ml-ops-data-quality/
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7014

瀏覽量
88980
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47233

瀏覽量
238350
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8411

瀏覽量
132600

評(píng)論

相關(guān)推薦

嵌入式和人工智能究竟是什么關(guān)系?

。此外，嵌入式系統(tǒng)在人工智能算法優(yōu)化和部署中也起到了關(guān)鍵作用。通過將人工智能算法部署到嵌入式設(shè)備，我們可以實(shí)現(xiàn)對(duì)算法的靈活優(yōu)化和調(diào)整，以

發(fā)表于 11-14 16:39

soc在人工智能中的創(chuàng)新應(yīng)用

社會(huì)計(jì)算（Social Computing, SOC）是一個(gè)跨學(xué)科領(lǐng)域，它結(jié)合了社會(huì)科學(xué)、計(jì)算機(jī)科學(xué)和人工智能，以理解和設(shè)計(jì)社會(huì)互動(dòng)中的技術(shù)系統(tǒng)。隨著人工智能（AI）技術(shù)的發(fā)展，SOC在

發(fā)表于 11-10 09:30 ?378次閱讀

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

了電力的實(shí)時(shí)平衡和優(yōu)化，有效降低了電網(wǎng)的運(yùn)行成本和故障率。此外，書中還討論了人工智能在能源科學(xué)研究中的挑戰(zhàn)和機(jī)遇。這些挑戰(zhàn)包括數(shù)據(jù)質(zhì)量、算法優(yōu)化、隱私保護(hù)等方面，而機(jī)遇則體現(xiàn)在技術(shù)創(chuàng)

發(fā)表于 10-14 09:27

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

人工智能在科學(xué)研究中的核心技術(shù)，包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石，使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集，從而發(fā)現(xiàn)隱藏在數(shù)據(jù)

發(fā)表于 10-14 09:16

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

。 5. 展望未來最后，第一章讓我對(duì)人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新未來充滿了期待。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展，AI將在更多領(lǐng)域發(fā)揮關(guān)鍵作用，從基礎(chǔ)科學(xué)到應(yīng)用科學(xué)，從理論研究到實(shí)踐應(yīng)用，都將迎來前所未有

發(fā)表于 10-14 09:12

risc-v在人工智能圖像處理應(yīng)用前景分析

定制性。這些特點(diǎn)使得RISC-V在多個(gè)領(lǐng)域，包括人工智能圖像處理領(lǐng)域，具有顯著的優(yōu)勢(shì)。二、RISC-V在人工智能圖像處理中的優(yōu)勢(shì) 開源性和

發(fā)表于 09-28 11:00

FPGA在人工智能中的應(yīng)用有哪些？

FPGA（現(xiàn)場(chǎng)可編程門陣列）在人工智能領(lǐng)域的應(yīng)用非常廣泛，主要體現(xiàn)在以下幾個(gè)方面：一、深度學(xué)習(xí)加速訓(xùn)練和推理過程加速：FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性

發(fā)表于 07-29 17:05

西部數(shù)據(jù)發(fā)布AI數(shù)據(jù)周期框架，推動(dòng)人工智能革新

在人工智能領(lǐng)域持續(xù)革新的今天，西部數(shù)據(jù)公司憑借其深厚的技術(shù)積累，正式發(fā)布了全新的人工智能數(shù)據(jù)周期（AI Data Cycle）框架。這一框架

發(fā)表于 06-14 17:55 ?1015次閱讀

西部數(shù)據(jù)發(fā)布全新人工智能數(shù)據(jù)周期存儲(chǔ)框架，助力用戶發(fā)掘人工智能價(jià)值

公司持續(xù)拓展旗下企業(yè)級(jí)SSD和HDD產(chǎn)品組合，應(yīng)對(duì)全新人工智能數(shù)據(jù)周期中的關(guān)鍵工作負(fù)載 2024年6月7日，上海- 西部數(shù)據(jù)公司（NASDA

發(fā)表于 06-11 10:57 ?409次閱讀

人工智能在影像升級(jí)中的關(guān)鍵作用

GPU和深度學(xué)習(xí)的結(jié)合對(duì)于使人工智能更快、更高效地升級(jí)也至關(guān)重要。GPU可以同時(shí)處理大量數(shù)據(jù)，從而實(shí)現(xiàn)更快的訓(xùn)練和推理。

發(fā)表于 03-11 18:15 ?218次閱讀

引領(lǐng)數(shù)字時(shí)代：華為云函數(shù)工作流與人工智能的共舞

）正成為各行業(yè)關(guān)注的焦點(diǎn)。AIGC 不僅在圖像生成領(lǐng)域有廣泛的應(yīng)用，更是推動(dòng)著產(chǎn)業(yè)發(fā)展，提升著工作效率，為人類發(fā)展帶來了積極的促進(jìn)作用。函數(shù)工作流：StableDiffusion 應(yīng)用托管重要場(chǎng)景隨著科技的不斷演進(jìn)，

發(fā)表于 03-09 23:44 ?213次閱讀

WiFi模塊引領(lǐng)智能制造時(shí)代：工業(yè)4.0中的關(guān)鍵作用

模塊在工業(yè)4.0中的關(guān)鍵作用。實(shí)時(shí)數(shù)據(jù)傳輸與監(jiān)控 WiFi模塊在工業(yè)4.0中的一個(gè)

發(fā)表于 02-29 15:23 ?438次閱讀

嵌入式人工智能的就業(yè)方向有哪些?

嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下，嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下，眾多名企也紛紛在嵌入式

發(fā)表于 02-26 10:17

語(yǔ)音數(shù)據(jù)集在智能駕駛中的關(guān)鍵作用與應(yīng)用

中的關(guān)鍵作用、應(yīng)用、挑戰(zhàn)以及未來的發(fā)展趨勢(shì)。二、語(yǔ)音數(shù)據(jù)集在智能駕駛中的

發(fā)表于 01-31 16:22 ?466次閱讀

DC電源模塊在物聯(lián)網(wǎng)設(shè)備中的關(guān)鍵作用

BOSHIDA ?DC電源模塊在物聯(lián)網(wǎng)設(shè)備中的關(guān)鍵作用 DC電源模塊在物聯(lián)網(wǎng)設(shè)備中發(fā)揮著關(guān)鍵作用。物聯(lián)網(wǎng)設(shè)備通常需要穩(wěn)定可靠的電源供應(yīng)，以保

發(fā)表于 01-16 14:03 ?576次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

人工智能科普：數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用

評(píng)論

嵌入式和人工智能究竟是什么關(guān)系?

soc在人工智能中的創(chuàng)新應(yīng)用

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

risc-v在人工智能圖像處理應(yīng)用前景分析

FPGA在人工智能中的應(yīng)用有哪些？

西部數(shù)據(jù)發(fā)布AI數(shù)據(jù)周期框架，推動(dòng)人工智能革新

西部數(shù)據(jù)發(fā)布全新人工智能數(shù)據(jù)周期存儲(chǔ)框架，助力用戶發(fā)掘人工智能價(jià)值

人工智能在影像升級(jí)中的關(guān)鍵作用

引領(lǐng)數(shù)字時(shí)代：華為云函數(shù)工作流與人工智能的共舞

WiFi模塊引領(lǐng)智能制造時(shí)代：工業(yè)4.0中的關(guān)鍵作用

嵌入式人工智能的就業(yè)方向有哪些?

語(yǔ)音數(shù)據(jù)集在智能駕駛中的關(guān)鍵作用與應(yīng)用

DC電源模塊在物聯(lián)網(wǎng)設(shè)備中的關(guān)鍵作用