在自然语言处理界,「 模式匹配 」可以说是最常用的技术;甚至可以说,将 NLP 技术作为真实生产力的项目都少不了 模式匹配

什么是模式匹配呢?

在计算机科学中,往往是检查给定的序列或字符串中是否有符合 某种模式 的片段,比如说:“啊,你的 AK-47 打得真准”,如果我们将 “啊,你的 _ 打得真准 ” 作为一种模式,则会将 AK-47 匹配出来

实现模式匹配往往都是用正则表达式,但是如果你想识别特别复杂的模式,编写正则表达式就会变得非常非常麻烦

而 Pampy 这个项目能解决你不少的烦恼

项目地址:

https://github.com/santinic/pampy

下面是一个使用例子:

1. 安装

赶紧让我们来试一下,安装 Pampy 前,你要确保 Python 和 pip 已经成功安装在电脑上噢

使用命令安装 Pampy

$ pip install pampy
 

看到 Successfully installed pampy-0.3.0 则说明安装成功

2. 使用

特性1:HEAD 和 TAIL

HEAD 和 TAIL 能代表某个模式的前面部分或后面部分。

比如:将特定模式后的元素都变成元组:

from pampy import match, HEAD, TAIL, _
x = [-1, -2, -3, 0, 1, 2, 3]
print(match(x, [-1, TAIL], lambda t: [-1, tuple(t)]))
# => [-1, (-2, -3, 0, 1, 2, 3)]
 

将特定模式前的元素设为集合,后面的元素设为元组:

from pampy import match, HEAD, TAIL, _
x = [-1, -2, -3, 0, 1, 2, 3]
print(match(x, [HEAD, _, _, 0, TAIL], lambda h, a, b, t: (set([h, a, b]), tuple(t))))
# => ({-3, -1, -2}, (1, 2, 3))
 

特性2:甚至能匹配字典中的键

在你不知道哪个键下有某个值的时候,这招非常好用:

from pampy import match, HEAD, TAIL, _
my_dict = {
    'global_setting': [1, 3, 3],
    'user_setting': {
        'face': ['beautiful', 'ugly'],
        'mind': ['smart', 'stupid']
result = match(my_dict, { _: {'face': _}}, lambda key, son_value: (key, son_value))
print(result)
# => ('user_setting', ['beautiful', 'ugly'])
 

特性3: 搭配正则

不仅如此,它还能搭配正则一起使用哦:

import re
from pampy import match, HEAD, TAIL, _
def what_is(pet):
    return match(
        pet, re.compile('(\w+),(\w)\w+鳕鱼$'), lambda mygod, you: you + "像鳕鱼"
print(what_is('我的天,你长得真像鳕鱼'))
# => '你像鳕鱼'
 

好了,以上就是今天的文章。如果对你有帮助,麻烦在下面点一个赞/在看,有任何问题都可以在下方留言,我会耐心解答的!

推荐阅读:
入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |
趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
 

年度爆款文案

点这里,直达菜鸟学PythonB站!!
                    在自然语言处理界,「模式匹配」可以说是最常用的技术;甚至可以说,将 NLP 技术作为真实生产力的项目都少不了模式匹配什么是模式匹配呢?在计算机科学中,往往是检查给定的序列或字符串中是否有符...
				
PEP 634:结构化模式匹配¶ 增加了采用模式加上相应动作的match 语句和case 语句的形式的结构化模式匹配。 模式由序列、映射、基本数据类型以及类实例构成。 模式匹配使得程序能够从复杂的数据类型中提取信息、根据数据结构实现分支,并基于不同的数据形式应用特定的动作。 语法与操作 模式匹配的通用语法如下: match subject: case <pattern_1>: <action_1> case <pattern_2...
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d') Python所有正则表达式均在re模块中,complie将会返回一个Regex模式对象。 接下来需要匹配Regex对象 可以使用search()方法来寻找字符串,寻找所有匹配对象,如果找到了该模式对象,就会返还一个Match对象,再使用g
你有两个字符串,即pattern和value。 pattern字符串由字母"a"和"b"组成,用于描述字符串中的模式。例如,字符串"catcatgocatgo"匹配模式"aabab"(其中"cat"是"a","go"是"b"),该字符串也匹配像"a"、"ab"和"b"这样的模式。但需注意"a"和"b"不能同时表示相同的字符串。编写一个方法判断value字符串是否匹配pattern字符串。 示例 1: 输入: pattern = "abba", value = "dogcatcatdog" 输出: tru
TheFuzz库对应的源码链接为https://github.com/seatgeek/thefuzz。需要说明的是,TheFuzz是FuzzyWuzzy的升级版本,后者在2020年后已经不再进行更新,所以请及时切换到TheFuzz库。 1. 安装方法 2. 两大模块fuzz和process 2.1 模块一:fuzz 2.2 模块二:process 2.2.1 process.extractOne(提取出相似度最高的选择) 2.2.2 process.extract(提取出相似度高的多个选择) 3.实战案例
什么是模式匹配呢? 在计算机科学中,往往是检查给定的序列或字符串中是否有符合某种模式的片段,比如说:“啊,你的AK-47打得真准”,如果我们将 “啊,你的_打得真准 ” 作为一种模式,则会将 AK-47 匹配出来 实现模式匹配往往都是用正则表达式,但是如果你想识别特别复杂的模式,编写正则表达式就会变得非常非常麻烦 而 Pampy 这个项目能解决你不少的烦恼 项目地址: https://github.com/santinic/pampy 下面是一个使用例子: 1. 安装 赶紧让我们来试..