資料介紹
大規(guī)模網(wǎng)絡(luò)環(huán)境和大數(shù)據(jù)相關(guān)技術(shù)的發(fā)展對傳統(tǒng)數(shù)據(jù)融合分析技術(shù)提出了新的挑戰(zhàn)。針對目前多源數(shù)據(jù)融合分析過程靈活性差,處理效率低的問題,提出了一種基于相似連接的多源數(shù)據(jù)并行預(yù)處理方法,該方法采用了分治和并行的思想。首先,通過對多源數(shù)據(jù)中的相似語義進行統(tǒng)一,對個性語義進行保留的預(yù)處理方法提高了靈活性;其次,提出了一種改進的并行MapReduce框架,提高了相似連接的效率。實驗結(jié)果表明,所提方法在保證數(shù)據(jù)完整性的基礎(chǔ)上,使總的數(shù)據(jù)量減小了32%.與傳統(tǒng)的MapReduce框架相比,改進后的框架在耗費時間方面減小了43. 91%,因此該方法可以有效提高多源數(shù)據(jù)融合分析的效率.
多源數(shù)據(jù)的預(yù)處理過程是網(wǎng)絡(luò)環(huán)境進行安全分析的重要環(huán)節(jié),根據(jù)實際的應(yīng)用采取相應(yīng)的具體措施山。一般性地,包括數(shù)據(jù)清理、數(shù)據(jù)格式轉(zhuǎn)換、數(shù)椐簡約等過程。其中數(shù)據(jù)清洗作為一個重要的環(huán)節(jié),通過按照一定規(guī)則篩選數(shù)據(jù),去除數(shù)據(jù)中的冗余部分。好的數(shù)據(jù)清洗方法不僅能夠降低系統(tǒng)處理數(shù)據(jù)所需的時間,并且能夠提高數(shù)據(jù)分析結(jié)果的準確度。為了對數(shù)據(jù)源進行靈活的數(shù)據(jù)清洗,盡量保留數(shù)據(jù)源的個性屬性,本文采用基于相似連接的數(shù)據(jù)清洗方法。相似連接在相似對象匹配問題中得到廣泛應(yīng)用,如互聯(lián)網(wǎng)、數(shù)據(jù)分析、數(shù)據(jù)庫等,匹配對象也日益多樣,如串、圖、字符串和集合等。為了適應(yīng)各種各樣的場景和對象,相似連接相關(guān)算法也得到了優(yōu)化和改進。無論是基于單行串行數(shù)據(jù)還是集合數(shù)據(jù),或是基于樹結(jié)構(gòu)還是圖結(jié)構(gòu),優(yōu)化和改進的方案主要以提高效率和靈活性或伸縮性為主。為了解決單行申行的相似連接候選集過多的問題,等提出了一種基于劃分的傳遞性的相似連接,該方法在相似匹配過程中利用傳遞性沒有使用全部子串,從而減少了匹配的候選集數(shù)目,提升了匹配的效率。為了提升算法的靈活性與伸縮性,Wang等提出了種快速相似連接算法,該算法既考慮到了相似的準確度,又考慮到了相似連接屬性的模糊度,可以進行靈活的篩選;然而隨著大數(shù)據(jù)與云計算等的出現(xiàn),由于數(shù)據(jù)量的龐大導(dǎo)致算法效率低,這也是相似連接算法面臨的難題之一。
- 基于多傳感器數(shù)據(jù)融合的GPS欺騙檢測方法 22次下載
- 基于多源數(shù)據(jù)結(jié)構(gòu)融合的輪式車輛運動測試 9次下載
- 基于動態(tài)加權(quán)和卡爾曼濾波的多源雷達信息加權(quán)融合方法 7次下載
- 基于特征融合學(xué)習(xí)的三角網(wǎng)格顯著區(qū)域檢測方法 17次下載
- 基于雙殘差超密集網(wǎng)絡(luò)的多模態(tài)醫(yī)學(xué)圖像融合方法 19次下載
- 結(jié)合多尺度邊緣保持分解與PCNN的圖像融合方法 16次下載
- 使用相似連接進行多源數(shù)據(jù)并行預(yù)處理的方法概述 12次下載
- 圖像融合的新思想和方法資料說明 5次下載
- 基于電力大數(shù)據(jù)的參數(shù)融合 8次下載
- 開關(guān)電容變換器在能量收集電路中提供了性能和靈活性 12次下載
- 利用 Arduino 的處理器靈活性獲得更廣泛的評估能力 6次下載
- 通過視覺和運動的緊密集成,提高準確度和靈活性 0次下載
- 水下目標運動分析(TMA)的數(shù)據(jù)融合方法 24次下載
- 基于小波變換的多源圖像數(shù)據(jù)融合與邊緣檢測方法
- 多傳感器數(shù)據(jù)融合中的數(shù)據(jù)預(yù)處理技術(shù)
- GaussDB數(shù)據(jù)庫存儲過程介紹 1054次閱讀
- 集成組件為超聲系統(tǒng)設(shè)計提供了靈活性 810次閱讀
- 數(shù)字電源排序設(shè)計選擇如何影響設(shè)計過程后期的靈活性 758次閱讀
- 一種可重構(gòu)的硬件處理器方法 795次閱讀
- 基于嵌入式微控制器與FPGA通過配置的效率和靈活性 2201次閱讀
- 淺談差分處理和信號分析 1967次閱讀
- 多傳感器信息融合技術(shù)的設(shè)計方法解析 1899次閱讀
- 無濾波器D類放大器為工程師在設(shè)計便攜產(chǎn)品時提供了更大的靈活性 1450次閱讀
- 多傳感器信息融合技術(shù)是什么有什么功能作用 1.6w次閱讀
- 以嵌入式DSP模塊和FPGA構(gòu)架為基礎(chǔ)的提高無線信號處理性能的子系統(tǒng)設(shè)計 795次閱讀
- LoRa終端通信設(shè)計中應(yīng)該考慮的協(xié)議靈活性 2400次閱讀
- 如何借助物聯(lián)網(wǎng)讓制造工廠提高生產(chǎn)力靈活性和質(zhì)量的概述 5963次閱讀
- 流體數(shù)據(jù)體系結(jié)構(gòu)解決數(shù)據(jù)的靈活性變化 1220次閱讀
- 基于多傳感器數(shù)據(jù)融合的漏磁信號采集與處理 5415次閱讀
- 深度解析多傳感器信息融合技術(shù) 4069次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 92次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7藍牙設(shè)備在嵌入式領(lǐng)域的廣泛應(yīng)用
- 0.63 MB | 3次下載 | 免費
- 89天練會電子電路識圖
- 5.91 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關(guān)電源設(shè)計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233045次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多