順序敏感的多源感知數據填補技術
近年來,隨著感知網絡的廣泛應用,感知數據呈爆炸式增長.但是由于受到硬件設備的固有限制、部署環境的隨機性以及數據處理過程中的人為失誤等多方面因素的影響。感知數據中通常包含大量的缺失值.而大多數現有的上層應用分析工具無法處理包含缺失值的數據集,因此對缺失數據進行填補是不可或缺的.目前也有很多缺失數據填補算法,但在缺失數據較為密集的情況下,已有算法的填補準確性很難保證,同時未考慮填補順序對填補精度的影響.基于此,提出了一種面向多源感知數據且順序敏感的缺失值填補框架OMSMVl(order-sensitive missing value imputation framework for multi-source sensory data).該框架充分利用感知數據特有的多維度相關性:時間相關性、空間相關性、屬性相關性對不同數據源間的相似度進行衡量:進而,基于多維度相似性構建以缺失數據源為中心的相似圖,并將已填補的缺失值作為觀測值用于后續填補過程中.同時考慮缺失數據源的整體分布,提出對缺失值進行順序敏感的填補,即:首先對缺失值的填補順序進行決策,再對缺失值進行填補.對缺失值進行順序填補能夠有效緩解在缺失數掘較為密集的情況下,由于缺失數據源的完整近鄰與其相似度較低引起的填補精度下降問題:最后,對KNN填補算法進行改進,提出一種新的基于近鄰節點的缺失值填補算法Nl(neighborhood-based imputation),該算法利用感知數據的多維度相似性對缺失數據源的所有近鄰節點進行查找,解決了KNN填補算法K值難以確定的問題,也進一步提高了填補準確性.利用兩個真實數據集,并與基本填補算法進行對比,驗證了算法的準確性及有效性.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%