永洪深度分析模塊集成了復雜的統計算法和機器學習技術,能夠從海量數據中,挖掘具有潛在價值的關系、模式和趨勢,構建數據模型,做出預測分析,但其仍然需要數理統計和數據挖掘的基礎知識,使用門檻相對較高。
基于此,永洪BI推出了數據解釋組件,將AI深度分析的能力以可視化組件的形式展示出來,使其可以在任意的報告中使用AI的能力探索和挖掘數據之間的相關性。
接下來的文章中,我們將介紹數據解釋組件如何使用,以及是如何解釋數據的。
01功能入口
制作報告拖拽右側的組件面板的“小燈泡”到制作區域,綁定需要解釋分析的數據集的字段。
02功能介紹
分析(Analyze):將需要分析的字段放入其中,如天氣的好壞、股票的漲跌、用戶的評分、空氣的質量等。
解釋依據(Explainby):將可能導致出現分析字段的值的因素放入其中,如溫度、濕度、地區、年齡、行業、日期、車流量等。
03關鍵因素
綁定分析和解釋依據之后,通過永洪BI的AI算法計算后,得到對分析字段的關鍵因素,其主要的場景是可以用來展示哪些解釋依據會影響所分析的指標,以及對比這些解釋依據的相對重要性。
01分析字段的選擇值:
分析字段的選擇值:在此示例中,所選的值為“Low”。
02選項卡:
在視圖之間進行切換。“關鍵因素”顯示對所選分析字段影響較大的一些解釋依據。“最佳組合”顯示對所選分析字段影響較大的一些解釋依據的組合。
03關鍵因素的闡述:
幫助解釋左側分析結果的圖表。
04左側分析結果:
在此情況下,顯示關鍵影響因素列表。點擊其中一個關鍵因素后,出現右側分析結果。
05解釋依據的相對重要性闡述:
幫助解釋右側分析結果的圖表。
06右側分析結果:
在此情況下,顯示左側中已選中關鍵因素“組織里面的角色”的所有值。
07平均線:
除“consumer”(即選中的解釋依據)以外,計算了“組織里面的角色”的所有可能值的平均值。因此該計算適用于所有藍色的值。它顯示了其他低分“組織里面的角色”的百分比。
本例中,平均來看,除“consumer”的其他組織里面的角色約有13%打了低分(虛線所示)。
看到這里,有的小伙伴可能還是不知道具體是如何計算的。
就以上文的例子進行詳細解釋:此影響者的占比,即是consumer的計數占所有數據量的占比,141245/209503=67.42%,這是第5部分的數據量的占比的來源。
組織里面的角色:administrator的low的比例是3840/13852=27.72%,consumer的low的比例是42287/141245=29.93%,publisher的low的比例是5013/54406=9.21%,這些值即是柱圖的高度。
除“consumer”(即選中的解釋依據)以外,計算了“組織里面的角色”的所有可能值的平均值,即是下表中(3840+5013)/68258=12.96%,約為13%,這即是平均線的值。
左側的倍數2.31x,是由29.93%/12.96%得到的。
以該示例總結一下關鍵因素,選擇以下情況影響客戶評分為Low,可以分析出,導致客戶評分為Low的因素從大到小主要有:
客戶的有效期大于58個月、組織里面的角色是consumer、客戶關注的主題是可用性、安全性、訂閱類型是高級用戶、國家地區是法國,這些因素會使得客戶評分為Low的可能性增加。
如果對其中的某一個因素感興趣,可以繼續點擊關鍵因素排名,右側會展示此因素的詳細解釋,上方的文本展示了此因素的數據量占整個數據的百分比。
例如點擊組織中的角色是consumer,上方的文本展示了角色為consumer的客戶評分大概有67.42%的數據,下方的圖表展示了各個角色在導致低評級上的影響的比較分析。
評價來看,13%的所有角色給出了Low的評分,30%的consumer給出了Low,與其他的客戶角色相比,consumer給出低分的可能性高出2.31倍。
04最佳組合
使用“關鍵因素”選項卡分別評估每個解釋依據,切換選項卡后使用“最佳組合”選項卡查看解釋依據的組合,如何影響正在分析的指標。
01分析字段的選擇值:
在此示例中,所選的值為銷售額的“提高”。
02選項卡:
在視圖之間進行切換。“關鍵因素”顯示對所選分析字段影響較大的一些解釋依據。“最佳組合”顯示對所選分析字段影響較大的一些解釋依據的組合。
03最佳組合的分析結果:
在此情況下,顯示最佳組合列表。點擊其中一個最佳組合后,出現下側和右側分析結果。
04下側分析結果:
點擊其中一個最佳組合后,出現最佳組合的詳細信息,在此示例中,組合2的詳細信息為“邊際利潤大于114.50且利潤小于等于337”。
05右側分析結果:
在此情況下,顯示左側中已選中組合2中數據的平均值和整體中的平均值,并顯示對比。
06最佳組合右下分析結果:
以環形圖顯示組合2中的詳細數據量的占比。
以該示例總結一下最佳組合,影響銷售額提高的因素的組合有:組合1~組合7,組合2中“邊際利潤大于114.50且利潤小于等于337”的銷售額的平均值為347.61,整體的銷售額的平均值為192.99,在組合2中,包含了1236個數據點,占比29.1%。
注:
關鍵因素的數據集來源于[Moroet al., 2014] S. Moro, P. Cortez 和P.Rita. “一種預測銀行電話營銷成功的數據驅動方法。”DecisionSupport Systems, Elsevier, 62:22-31, June 2014。
最佳組合的數據集為永洪BI自帶的咖啡中國市場銷售數據。
? ? ? ?ymf
評論
查看更多