隨著企業以數據為中心的文化,以做出決策和規劃,數據科學家對全球企業的重要性日益增加。但是企業無法足夠快地聘請數據科學家,因為合格候選人仍然非常有限。
為了應對數據科學家短缺的問題,企業正在采取各種方法,以從他們可以找到和保留的少數數據專業人員中獲取最大的收益。
自動化
數據科學家完成的很多工作側重于數據管理和操作任務,例如識別數據源、合并數據集和驗證數據質量。這些任務并不是通常聘用數據科學家的目的,他們應該負責高價值工作。隨著更多的自動化工作進入企業,這種情況正在改變。
自動機器學習(ML)軟件公司DotData首席執行官兼創始人Ryohei Fujimaki說:“通過自動化,模型開發以及模型操作得到極大簡化。新的數據科學自動化平臺將使企業只需付出最小的努力,便可在生產中部署、操作和維護數據科學流程,從而幫助企業最大程度地利用其AI和ML投資以及當前的數據團隊。”
自動化數據工程軟件公司AtScale創始人兼首席技術官Matthew Baird表示,在數據科學自動化領域,最有前景的發展是在自主數據工程領域,該領域實現了數據管理和處理任務的自動化。
Baird 稱:“這些進步是以‘實時’數據工程的形式出現,如果具備所有知識并完整地輸入數據,自動化就可以像完美的數據工程團隊一樣工作。這包括了解如何最好地利用各種數據庫的基礎數據結構,其獨特的網絡特性、數據位置、本機安全設置和策略。”
自助服務分析
所有這些額外的數據管理和建模自動化功能不僅旨在最大程度地利用高級數據科學家,還可以讓公民數據科學家利用數據資源。通過自助服務分析擴展數據探索是解決數據科學家短缺的另一種流行方法。
Baird 稱:“自主數據工程技術的進步,再加上自助服務分析帶來很多公民分析人員,可讓寶貴的數據科學和數據工程資源專注于更高價值的活動,例如構建下一代機器學習或人工智能模型。”
創建跨職能團隊
同時,企業開始看到自助服務分析工具和自動化的局限性。
深度學習軟件公司Pathmind創始人兼首席執行官Chris Nicholson說:“簡化數據科學的工具也限制了用戶的靈活性和選擇,這意味著某些需要定制的復雜任務不可能實現。” Nicholson認為,這種現實已導致很多公司探索新的團隊策略,以從有限的數據專家中獲取更多信息。
Nicholson說:“很多公司通過建立跨職能的數據科學團隊來應對數據科學家的短缺問題,這些團隊可以與企業中的很多業務部門合作,也可以聘用外部顧問。通常,限制企業數據科學價值的不是數據科學家的匱乏,而是企業收集的數據以及企業如何使人們訪問和處理數據。”
Nicholson說,跨職能團隊可以幫助企業解決因技術和內部政治障礙而造成的零散的數據孤島問題,只要正確的利益相關者在同一團隊中共同努力,就可以克服這些障礙。
這也可以緩解一個常見問題,這個問題看起來像數據科學家短缺,但其實更基礎,即太多數據科學項目看起來難以管理,因為它們沒有通往業務價值的明確途徑。
IT咨詢公司More Than Code首席顧問Sten Vesterli說:“太多的項目令人難以置信,企業將大量數據丟給數據科學家,然后說,‘看看你能做什么。’我們已經看到超過80%的數據科學項目無法從實驗室轉移到生產環境中,而企業需要將其數據科學家分配給最高價值的業務目標。”
更好地定義數據科學角色
圖形數據庫公司Neo4j的圖形分析和AI程序主管Amy Hodler表示,阻礙有效招聘數據科學家的一大問題是,企業正在使數據科學的頭銜和職責變得過于廣泛。
Hodler稱:“這使企業很難找到合適人選,這意味著新員工很難理解和適應業務目標。”
她認為,未來一年,很多企業將開始多樣化與數據科學相關的職位,從而創建子類別的工作重點和更加嚴格的工作要求。
內部培訓
Hodler還認為,企業將通過對現有員工進行更多內部培訓–這些員工表現出任何潛力或希望轉向數據科學崗位,以應對數據科學家的短缺。她說,企業必須戰略性地培養潛在數據科學家的特定技能。
Hodler說:“企業必須以長遠的眼光來清晰地評估和定義所需的技能,不僅需要考慮當今炙手可熱的工具/方法,而且還要投資可在未來數年內建立的核心概念。在未來幾年內,初級和高級數據科學家配對將對發展和保留這些員工變得至關重要。”
-
數據庫
+關注
關注
7文章
3794瀏覽量
64362 -
數據結構
+關注
關注
3文章
573瀏覽量
40123
發布評論請先 登錄
相關推薦
評論