AutoML是一項技術,客戶可以攜帶數據并離開模型而不必擔心訓練機器學習模型所涉及的復雜工作流程。它大大簡化了基于成熟算法的數據準備,特征工程,模型選擇和超參數調整的方法。
基于公共云的ML平臺即服務(PaaS)產品(例如Azure ML,IBM Watson Studio和Google Cloud AI)具有AutoML組件。AWS遲遲未將AutoML功能引入其SageMaker平臺。自2019年發布SageMaker AutoPilot以來,亞馬遜一直在不斷改善其托管ML平臺的AutoML功能。
通過最近添加的SageMaker JumpStart,AWS現在擁有完整的AutoML功能,涵蓋了回歸,分類,視覺和自然語言處理領域。
盡管AWS并未正式稱呼Amazon SageMaker Autopilot和JumpStart服務AutoML,但它們是Azure AutoML和Google Cloud AutoML的替代產品。
Amazon SageMaker Autopilot針對諸如銷售預測,推薦系統,呼叫中心路由和廣告優化之類的方案,這些方案依賴于通常存儲在CSV文件,關系數據庫和NoSQL數據庫中的數據集。
基于XGBoost和Linear Learner算法,Autopilot非常適合處理線性回歸,邏輯回歸以及二元或多元分類問題。通過添加深度學習算法,Autopilot可以處理不可線性分離的復雜數據。
Amazon SageMaker Autopilot的主要與眾不同之處在于,自動生成筆記本是AutoML工作流程的一部分。客戶只能創建一個Autopilot作業來生成筆記本,而不是運行整個過程。這些筆記本基于在數據科學界流行的標準開源Juypter筆記本。開發人員和數據科學家可以下載筆記本,以了解數據準備工作的完成方式以及為每個候選人構建的單獨管道所使用的算法。
在re:Invent 2020上宣布的Amazon SageMaker JumpStart是Amazon SageMaker Studio的最新成員,后者是面向AWS客戶的集成ML開發平臺。盡管Amazon SageMaker Autopilot處理通常以表格格式存儲的結構化數據,但SageMaker JumpStart專注于視覺和NLP域。
Amazon SageMaker JumpStart包含三個組件-開源模型部署,解決方案和基于較小的定制數據集的現有開源模型構建的定制模型。
亞馬遜利用TensorFlow和PyTorch提供的官方模型動物園來提供開源模型部署。只需單擊一下,即可在SageMaker Studio中提供150多個模型。AWS下載模型,在SageMaker中注冊它們,并公開一個端點進行推斷。
例如,您可以一鍵顯示ResNet或MobileNet SSD模型以進行圖像分類和對象檢測。部署模型后,SageMaker會將您指向帶有示例代碼的Jupyter Notebook,以調用推理端點。
部署使用公共數據集(例如ImageNet或CIFAR-100)訓練的現有計算機視覺模型可能對企業不是很有用。他們需要使用與特定業務問題保持一致的自定義數據集進行訓練的模型。例如,組織可能需要識別在接待區沒有面具的人。沒有公開可用的模型可以可靠地檢測沒有面罩的面部。
責任編輯:lq
-
機器學習
+關注
關注
66文章
8435瀏覽量
132887 -
數據集
+關注
關注
4文章
1209瀏覽量
24772 -
自然語言處理
+關注
關注
1文章
619瀏覽量
13605
發布評論請先 登錄
相關推薦
評論