使領域專家能夠執行數據科學對業務有明顯的好處。但是,這不是一夜之間發生的事情。隨著組織開始將數據分析工具交到其領域專家手中,挑戰可能會出現,包括向持懷疑態度的人展示數據分析的價值。準備好應對這些挑戰將使項目向前發展,并使批評者陷入困境。
新技術的學習曲線
挑戰:數據分析領域的創新步伐非???,每一項新技術都有自己的學習曲線。在許多情況下,原始技術是由計算機科學家開發的,目標受眾也是具有非常強大的編程技能的人。這些軟件包是用許多不同的編程語言實現的,所以對于那些不全職編寫代碼的人來說,學習曲線非常陡峭。
溶液:具有領域知識的工程師應該尋找能夠讓他們快速啟動和運行的工具,最好是在他們已經熟悉的計算平臺中。像MATLAB中的那些點擊式應用程序可以作為這些工程師的簡單起點。除此之外,通常需要一個編程接口來微調分析,以提高穩健性和準確性。如果企業認真對待數據分析,他們也應該尋找培訓課程,這些課程可以幫助工程師比從反復試驗中學習更快地成長。
數據分析領域的大量前沿研究創造了一波有可能顛覆性的新技術浪潮。然而,在那股浪潮之后,成功的工具出現了,這些工具對于具有領域知識的工程師來說已經足夠通用。
工程師或數據科學家:誰做什么?
挑戰:組織正試圖確定“誰是做這項工作的正確團隊?雖然數據科學家通常在機器學習方面具有很強的背景,但他們通常對業務及其產品的來龍去脈很陌生或不熟悉。工程和科學團隊對業務及其產品有了解,但可能沒有機器學習的經驗。
溶液:一個常見的折衷方案是將具有領域知識的工程師與數據科學家配對,以利用他們的各自優勢,但在許多情況下,這可能是不可能的,因為領域專家遠遠多于數據科學家。另一種解決方案是采用工具,同時降低機器學習的標準(對于領域專家)并提供靈活性和可擴展性(對于數據科學家)。在實踐中,這意味著采用一種既具有圖形界面(即應用程序)又具有編程語言的工具。
即使數據科學小組在組織內不斷壯大,數據科學工作也將繼續由具有領域知識的工程師和數據科學家完成。兩者都將在企業成功采用數據分析方面發揮重要作用,因此創建一個可以進行協作的環境是關鍵。
分析最終會在哪里結束?
挑戰:如果成功開發的分析或機器學習模型無法與業務的系統、產品和服務集成,則其對業務的價值有限。這可能意味著將分析與IT組織維護的服務器集成,或將分析部署到嵌入式設備(例如物聯網系統中的邊緣節點)。
傳統上,分析是在適合研究和開發的工具中開發的,但不適合在生產中運行分析,因此分析必須重新編碼為不同的編程語言,然后才能部署。此過程通常需要數周到數月,并且可能會引入錯誤。
溶液:用于開發分析的平臺提供了打包算法以在不同生產環境中運行的方法。尋找一種工具,該工具可提供集成路徑和應用程序服務器,以便與常見 IT 系統配合使用,并且還面向嵌入式設備。例如,MATLAB 提供了部署路徑,用于將分析與 IT 系統中常用的編程語言(例如 Java 和 .NET)集成,以及將分析轉換為可在嵌入式設備上運行的獨立 C 代碼。這兩個部署選項都可以通過點擊式界面訪問,這使得它們對具有領域知識的工程師具有吸引力。通過自動執行將分析轉換為在生產系統中運行的過程,這些工具可顯著縮短設計迭代的時間。
使領域專家能夠將機器學習和其他數據分析技術應用于其工作的技術將繼續存在。它們為工程團隊提供了令人興奮的創新機會 - 無論是在設計工作流程還是他們創造的產品中。數據科學家的短缺似乎不會很快得到解決。領域專家將在填補這一空白方面發揮關鍵作用。他們對業務及其生產的產品的了解使他們能夠很好地找到應用數據分析技術的創新方法。
審核編輯:郭婷
-
matlab
+關注
關注
185文章
2977瀏覽量
230601 -
機器學習
+關注
關注
66文章
8422瀏覽量
132741
發布評論請先 登錄
相關推薦
評論