基于聚類和Spark框架的加權(quán)Slope One算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評論(0)
針對傳統(tǒng)Slope One算法在相似性計(jì)算時(shí)未考慮項(xiàng)目屬性信息和時(shí)間因素對項(xiàng)目相似性計(jì)算的影響,以及推薦在當(dāng)前大數(shù)據(jù)背景下面臨的計(jì)算復(fù)雜度高、處理速度慢的問題,提出了一種基于聚類和Spark框架的加權(quán)Slope One算法。首先,將時(shí)間權(quán)重加入到傳統(tǒng)的項(xiàng)目評分相似性計(jì)算中,并引入項(xiàng)目屬性相似性生成項(xiàng)目綜合相似度;然后,結(jié)合Canopy-K-means聚類算法生成最近鄰居集;最后,利用Spark計(jì)算框架對數(shù)據(jù)進(jìn)行分區(qū)迭代計(jì)算,實(shí)現(xiàn)該算法的并行化。實(shí)驗(yàn)結(jié)果表明,基于Spark框架的改進(jìn)算法與傳統(tǒng)Slope One算法、基于用戶相似性的加權(quán)Slope One算法相比,評分預(yù)測準(zhǔn)確性更高,較Hadoop平臺(tái)下的運(yùn)行效率平均可提高3.5 -5倍,更適合應(yīng)用于大規(guī)模數(shù)據(jù)集的推薦。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于聚類和Spark框架的加權(quán)Slope One算法下載
相關(guān)電子資料下載
- 天數(shù)智芯主導(dǎo)的DeepSpark開源社區(qū)發(fā)布百大應(yīng)用開放平臺(tái)24.06版本 436
- spark運(yùn)行的基本流程 91
- Spark基于DPU的Native引擎算子卸載方案 180
- 百度前高管景鯤與朱凱華創(chuàng)立AI搜索公司,Genspark產(chǎn)品驚艷上線 458
- 關(guān)于Spark的從0實(shí)現(xiàn)30s內(nèi)實(shí)時(shí)監(jiān)控指標(biāo)計(jì)算 111
- “Spark+Hive”在DPU環(huán)境下的性能測評 | OLAP數(shù)據(jù)庫引擎選型白皮書(24版)DPU部分 212
- 芯科科技和Arduino合作創(chuàng)建SparkFun Thing Plus Matter板 234
- Sparkle撼與科技發(fā)布TBX-750FA-V2顯卡塢,支持3.5槽厚顯 243
- 如何注冊星閃Sparklink設(shè)備媒體接入層標(biāo)識(shí)、地址碼? 246
- 如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇 661