一、什么是自服務數據集?
自服務數據集可以通過簡單的拖拽和可視化的操作,構建復雜的數據集,同時提供各種數據轉換功能,輕松實現強大的數據處理。
在自服務數據集中,通過添加不同類型的節點,并且添加連線做數據處理,便可構建出復雜的數據集。
?使用自服務數據集的好處:
1.可視化操作簡單便捷,容易上手;
2.當數據量復雜時,可通過自服務數據集的強大功能進行數據治理,整合。
二、為什么要使用自服務數據集?
??什么情況下需要用到自服務數據集?
在進行報表制作時,當遇到數據庫的數據較為復雜不能直接使用的時候,可以通過自服務數據集的數據處理功能先對數據進行處理,整合。
例如,在某一個組件需要需要用到兩個有關聯關系的數據集時,而一個組件又不能綁定兩個數據集,需要先對兩個數據集進行聯合,這個時候可以使用自服務數據集的聯接功能對兩個數據集進行聯接后再進行報表制作。
自服務數據集可進行一個或多個數據集之間的聯接,聯合,逆透視,去重以及分組和匯總等操作,只需要通過拖拽和可視化操作就可以進行數據處理和整合,十分簡單便捷,能夠很大的提高效率,無論是 IT 人員還是業務人員都可以很快上手操作。
三、如何使用自服務數據集?
用戶可通過添加數據節點的方式,將來自不同類型的數據集數據作為輸入節點,例如 Excel 數據集,內嵌數據集,SQL 數據集 ,Mongo 等各種任意數據集。在輸入節點之后接入各種聯接和轉換節點,各個節點之間可以任意組合和編輯,最后連線數據集結果節點,就可以完成數據的準備工作。
通過自服務聯接數據為例,介紹如何進行聯接數據,形成新的數據集。
1.可以通過拖拽的方式將要處理的數據集添加到自服務的空白畫布區域。
2.添加好數據后,通過操作選項里的節點功能可以對數據進行處理,包含以下功能:
(1)聯接和聯合節點。通過關聯節點,可將多張不同的表,組合成為一張表。關聯節點可以連接多個輸入節點。只能有一個輸出,鏡像節點除外,能連接的鏡像節點可以是(n>1)個。
(2)轉換節點:分為 抽樣,排序,透視表,逆透視表,分組和匯總,自循環列,鏡像,去重。通過轉換節點,可對表中的數據進行相應的處理。
(3)關聯和轉換節點的右鍵菜單包含,編輯節點,重命名,刪除,刷新(鏡像節點除外,鏡像節點右鍵菜單沒有編輯節點選項)。關聯,轉換節點第一次連接其輸入節點時會自動彈出編輯框。
3.以聯接功能為例,將需要連接的數據集拖拽到編輯區,拖拽“聯接”操作到編輯區,系統將自動對數據集和聯接節點進行連線。如果系統沒有自動連線,也可以對數據集和操作進行手動連線。默認狀態自動布局是置灰狀態。
當數據集結果節點有輸入時,自動布局才可使用。點擊自動布局,節點和節點之間的布局會根據既定算法優化,布局會更加合理美觀。
(1)自動布局前:
(2)自動布局后:
4. 兩個數據集進行聯接操作時,默認的是“內部聯接”的聯接方式,并會自動匹配聯接列。本例中,聯接方式為“內部聯接”,聯接列為“訂單ID”,即將兩張表訂單ID相同的數據組合在一起,如下圖所示。如果需要使用左聯接等其他的聯接方式,只需在聯接對話框中,設置所需的聯接方式和聯接列。
5.數據集結果展示
數據集結果節點 ,數據集結果節點是所有節點數據處理的終結點,數據集結果節點只能有一個輸入。刷新元數據后,新數據集的關聯數據顯示在右側
以上就是自服務數據集聯接的使用方法,通過簡單的幾步操作就可以將兩個數據集進行聯接,省去了寫代碼的繁瑣,還可以實時看到操作過程中的數據細節。除了聯接之外,還可以根據需求實現聯合、去重、自循環、逆透、分組和匯總等功能,處理數據能力強大,使用方便高效。
fqj
評論
查看更多