在自然語(yǔ)言處理界,模式匹配可以說(shuō)是最常用的技術(shù)。甚至可以說(shuō),將NLP技術(shù)作為真實(shí)生產(chǎn)力的項(xiàng)目都少不了 模式匹配 。
什么是模式匹配呢?在計(jì)算機(jī)科學(xué)中,往往是檢查給定的序列或字符串中是否有符合某種模式的片段。比如說(shuō):“啊,你的AK-47打得真準(zhǔn)”,如果我們將 “啊,你的 _____ 打得真準(zhǔn) ” 作為一種模式,則會(huì)將AK-47匹配出來(lái)。
實(shí)現(xiàn)模式匹配往往都是用正則表達(dá)式,但是如果你想識(shí)別特別復(fù)雜的模式,編寫(xiě)正則表達(dá)式就會(huì)變得非常非常麻煩。而Pampy這個(gè)項(xiàng)目能解決你不少的煩惱。https://github.com/santinic/pampy
下面是一個(gè)使用例子:
1.準(zhǔn)備
開(kāi)始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒(méi)有,可以訪(fǎng)問(wèn)這篇文章:超詳細(xì)Python安裝指南 進(jìn)行安裝。
**(可選1) **如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda:Python數(shù)據(jù)分析與挖掘好幫手—Anaconda,它內(nèi)置了Python和pip.
**(可選2) **此外,推薦大家用VSCode編輯器,它有許多的優(yōu)點(diǎn):Python 編程的最好搭檔—VSCode 詳細(xì)指南。
請(qǐng)選擇以下任一種方式輸入命令安裝依賴(lài) :
- Windows 環(huán)境 打開(kāi) Cmd (開(kāi)始-運(yùn)行-CMD)。
- MacOS 環(huán)境 打開(kāi) Terminal (command+空格輸入Terminal)。
- 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install pampy
看到 Successfully installed pampy-0.3.0 則說(shuō)明安裝成功。
2.使用
HEAD和TAIL能代表某個(gè)模式的前面部分或后面部分。
比如將特定模式后的元素都變成元組:
from pampy import match, HEAD, TAIL, _
x = [-1, -2, -3, 0, 1, 2, 3]
print(match(x, [-1, TAIL], lambda t: [-1, tuple(t)]))
# = > [-1, (-2, -3, 0, 1, 2, 3)]
將特定模式前的元素設(shè)為集合,后面的元素設(shè)為元組:
from pampy import match, HEAD, TAIL, _
x = [-1, -2, -3, 0, 1, 2, 3]
print(match(x, [HEAD, _, _, 0, TAIL], lambda h, a, b, t: (set([h, a, b]), tuple(t))))
# = > ({-3, -1, -2}, (1, 2, 3))
特性2:甚至能匹配字典中的鍵
在你不知道哪個(gè)鍵下有某個(gè)值的時(shí)候,這招非常好用:
from pampy import match, HEAD, TAIL, _
my_dict = {
'global_setting': [1, 3, 3],
'user_setting': {
'face': ['beautiful', 'ugly'],
'mind': ['smart', 'stupid']
}
}
result = match(my_dict, { _: {'face': _}}, lambda key, son_value: (key, son_value))
print(result)
# = > ('user_setting', ['beautiful', 'ugly'])
特性3: 搭配正則
不僅如此,它還能搭配正則一起使用哦:
import re
from pampy import match, HEAD, TAIL, _
def what_is(pet):
return match(
pet, re.compile('(w+),(w)w+鱈魚(yú)$'), lambda mygod, you: you + "像鱈魚(yú)"
)
print(what_is('我的天,你長(zhǎng)得真像鱈魚(yú)'))
# = > '你像鱈魚(yú)'
-
字符串
+關(guān)注
關(guān)注
1文章
579瀏覽量
20546 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1451瀏覽量
34071 -
模式匹配
+關(guān)注
關(guān)注
0文章
9瀏覽量
5857 -
自然語(yǔ)言
+關(guān)注
關(guān)注
1文章
288瀏覽量
13357
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論