基于主題與概率模型的非合作深網(wǎng)數(shù)據(jù)源選擇
在深網(wǎng)數(shù)據(jù)集成過程中,用戶希望僅檢索少量數(shù)據(jù)源便能獲取高質(zhì)量的檢索結(jié)果,因而數(shù)據(jù)源選擇成為其核心技術(shù).為滿足基于相關(guān)性和多樣性的集成檢索需求,提出一種適合小規(guī)模抽樣文檔摘要的深網(wǎng)數(shù)據(jù)源選擇方法.該方法在數(shù)據(jù)源選擇過程中首先度量數(shù)據(jù)源與用戶查詢的相關(guān)性,然后進一步考慮候選數(shù)據(jù)源提供數(shù)據(jù)的多樣性.為提升數(shù)據(jù)源相關(guān)性判別的準(zhǔn)確性,構(gòu)建了基于層次主題的數(shù)據(jù)源摘要,并在其中引入了主題內(nèi)容相關(guān)性偏差概率模型,且給出了基于人工反饋的偏差概率模型構(gòu)建方法以及基于概率分析的數(shù)據(jù)源相關(guān)性度量方法,為提升數(shù)據(jù)源選擇結(jié)果的多樣性程度,在基于層次主題的數(shù)據(jù)源摘要中建立了多樣性鏈接有向邊,并給出了數(shù)據(jù)源多樣性的評價方法,最后,將基于相關(guān)性和多樣性的數(shù)據(jù)源選擇問題轉(zhuǎn)化為一個組合優(yōu)化問題,提出了基于優(yōu)化函數(shù)的數(shù)據(jù)源選擇策略.實驗結(jié)果表明:在基于少量抽樣文檔進行數(shù)據(jù)源選擇時,該方法具有較高的選擇準(zhǔn)確率.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于主題與概率模型的非合作深網(wǎng)數(shù)據(jù)源選擇下載
相關(guān)電子資料下載
- 大數(shù)據(jù)采集系統(tǒng)分為幾類 269
- 常見的數(shù)據(jù)采集工具的介紹 109
- 邊緣計算與晶振技術(shù):實現(xiàn)智能靠近數(shù)據(jù)源的新型計算范式 407
- 商湯科技攜手國內(nèi)頭部遙感數(shù)據(jù)平臺全面升級SenseEarth數(shù)據(jù)源 272
- 萬維網(wǎng)35周年之際,聯(lián)合創(chuàng)始人警告平臺沉迷和數(shù)據(jù)源控制兩大問題 445
- NBA比賽收視率的背后是什么? 213
- 開發(fā)RAG管道過程中的12個痛點 435
- 鴻蒙開發(fā)教學(xué)-圖片的引用 381
- 鴻蒙HarmonyOS引用圖片的方法 555
- 數(shù)據(jù)網(wǎng)關(guān)機干什么的 數(shù)據(jù)網(wǎng)關(guān)與數(shù)據(jù)采集器的區(qū)別 1096