應(yīng)用Q-gram命中特征優(yōu)化的近似串匹配算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
近似串匹配( Approximate String Matching)是允許有“錯(cuò)誤”發(fā)生的字符串匹配,它在文本串中查找所有與模式串之間錯(cuò)誤數(shù)不大于一定閾值的所有匹配串。字符串間的錯(cuò)誤數(shù)可采用編輯距離、漢明距離、最長(zhǎng)公共子串等表示。編輯距離是指把一個(gè)字符串經(jīng)過插入、修改或刪除3種編輯操作轉(zhuǎn)變成字符串所要進(jìn)行的最小操作次數(shù),常用表示。近似串匹配技術(shù)在眾多研究領(lǐng)域都有廣泛的應(yīng)用,如文本檢索、生物信息學(xué)、信號(hào)處理和模式識(shí)別等。
基于Off-Iine模式的過濾算法是一種采用先過濾冉驗(yàn)證的二階段近似串匹配方法。過濾算法因采用過濾技術(shù)能在前期快速去除大量文本區(qū)域,適合Off-line模式下的大文本庫匹配。目前,過濾算法可歸為二類:精確匹配子串法和近似匹配子串法。精確匹配子串法通過定位無錯(cuò)誤的模式串子串進(jìn)行過濾。
本研究主要解決的是在大文本庫中快速查找與模式串間錯(cuò)誤率不大于的所有匹配串的問題。文中將結(jié)合KS算法和q-gram命中特征,設(shè)計(jì)一個(gè)新的無損過濾算法,擬通過犧牲一定過濾時(shí)間來換取較大過濾效率的提升,最終達(dá)到提高算法整體匹配速度的目的。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(1) 100%
下載地址
應(yīng)用Q-gram命中特征優(yōu)化的近似串匹配算法下載
相關(guān)電子資料下載
- 藍(lán)牙模塊功耗優(yōu)化技術(shù)研究 337
- 電網(wǎng)側(cè)儲(chǔ)能電站怎么優(yōu)化電網(wǎng) 201
- 智能化建筑集成管理系統(tǒng):實(shí)現(xiàn)建筑安全與節(jié)能雙重優(yōu)化 106
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化算法有哪些 70
- 使用泰克示波器精確診斷并優(yōu)化汽車電子系統(tǒng) 78
- 優(yōu)化耐腐蝕材料測(cè)試:美能鹽霧腐蝕試驗(yàn)箱的應(yīng)用 50
- 高實(shí)時(shí)性程序優(yōu)化設(shè)計(jì) 62
- 華秋DFM新版本 #持續(xù)優(yōu)化 #服務(wù)升級(jí) 42
- Cadence 擴(kuò)充系統(tǒng) IP 產(chǎn)品組合,推出 NoC 以優(yōu)化電子系統(tǒng)連接性 198
- Profibus轉(zhuǎn)Modbus網(wǎng)關(guān)在智能化水處理系統(tǒng)優(yōu)化改造的應(yīng)用 302