順序敏感的多源感知數(shù)據(jù)填補技術(shù)
近年來,隨著感知網(wǎng)絡的廣泛應用,感知數(shù)據(jù)呈爆炸式增長.但是由于受到硬件設備的固有限制、部署環(huán)境的隨機性以及數(shù)據(jù)處理過程中的人為失誤等多方面因素的影響。感知數(shù)據(jù)中通常包含大量的缺失值.而大多數(shù)現(xiàn)有的上層應用分析工具無法處理包含缺失值的數(shù)據(jù)集,因此對缺失數(shù)據(jù)進行填補是不可或缺的.目前也有很多缺失數(shù)據(jù)填補算法,但在缺失數(shù)據(jù)較為密集的情況下,已有算法的填補準確性很難保證,同時未考慮填補順序?qū)μ钛a精度的影響.基于此,提出了一種面向多源感知數(shù)據(jù)且順序敏感的缺失值填補框架OMSMVl(order-sensitive missing value imputation framework for multi-source sensory data).該框架充分利用感知數(shù)據(jù)特有的多維度相關(guān)性:時間相關(guān)性、空間相關(guān)性、屬性相關(guān)性對不同數(shù)據(jù)源間的相似度進行衡量:進而,基于多維度相似性構(gòu)建以缺失數(shù)據(jù)源為中心的相似圖,并將已填補的缺失值作為觀測值用于后續(xù)填補過程中.同時考慮缺失數(shù)據(jù)源的整體分布,提出對缺失值進行順序敏感的填補,即:首先對缺失值的填補順序進行決策,再對缺失值進行填補.對缺失值進行順序填補能夠有效緩解在缺失數(shù)掘較為密集的情況下,由于缺失數(shù)據(jù)源的完整近鄰與其相似度較低引起的填補精度下降問題:最后,對KNN填補算法進行改進,提出一種新的基于近鄰節(jié)點的缺失值填補算法Nl(neighborhood-based imputation),該算法利用感知數(shù)據(jù)的多維度相似性對缺失數(shù)據(jù)源的所有近鄰節(jié)點進行查找,解決了KNN填補算法K值難以確定的問題,也進一步提高了填補準確性.利用兩個真實數(shù)據(jù)集,并與基本填補算法進行對比,驗證了算法的準確性及有效性.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%