python干货｜正则表达式

DCXabc

2018-07-01

正则表达式的简单介绍

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式，只需要简单看一看就可以上手了。

简单来说：正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本。—— [ 维基百科 ]

正则表达式的大致匹配过程是：依次拿出表达式和文本中的字符比较，如果每一个字符都能匹配，则匹配成功；一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界，这个过程会稍微有一些不同，但也是很好理解的，看下图中的示例以及自己多使用几次就能明白。

python干货｜正则表达式

下面列出了Python支持的正则表达式元字符和语法：

（1）预定义字符集

python干货｜正则表达式

（2）数量词

python干货｜正则表达式

（3）边界匹配

python干货｜正则表达式

（4）逻辑，分组

python干货｜正则表达式

（5）特殊构造

python干货｜正则表达式

(?iLmsux)为分组设置模式

这里的”i”, “L”, “m”, “s”, “u”, “x”，它们不匹配任何字串，而是表示对应python中re模块当中的(re.I, re.L, re.M, re.S, re.U, re.X)的6种选项。

可以在python源码中看到：

python干货｜正则表达式

反斜杠的使用

在一般的编程语言当中，反斜杠“\”代表反转义字符，在反斜杠后面加一个字符可以表示一种特定的意思，接下来列举几个常见的转义字符：

python干货｜正则表达式

re模块

（1）compile

在模式发生匹配之前，正则表达式模式必须编译成正则表达式对象。因此如果在比较之前提前对正则表达式模式进行编译（预编译过程），可以提高程序的运行效率，re模块的compile函数提供了对正则表达式进行编译的功能，编译后，返回一个正则表达式对象，这也是为什么一开始就介绍compile函数的意图。

python干货｜正则表达式

（2）match和search比较

match和search最大的区别在于search在任意位置进行搜索匹配，而match必须从开头进行匹配。

python干货｜正则表达式

（3）findall 、finditer和sub 使用

findall 和 finditer的区别在于返回对象不同，findall 返回一个列表；finditer返回一个迭代器对象。

python干货｜正则表达式

（4）分组及group、 groups比较使用

使用（）可以用来保存分组，以便于后续处理，使用group方法访问每个独立的子组以及groups（）方法获取一个包含所有匹配子组的元组

python干货｜正则表达式

（5）split

re模块的split（）方法和string自带的split方法是类似的，但更为强大和灵活。下面是一个较为复杂的例子，一个用于web站点的简单解释器，用户输入城市名和州名，或者城市名加上ZIP码（5个数字），三者不一定全部都有。

python干货｜正则表达式

最后

python干货｜正则表达式

前几天有私信小编要Python的学习资料，小编整理了一些有深度的Python教程和参考资料，从入门到高级的都有，文件已经打包好了，正在学习Python的同学可以下载学习学习。文件下载方式：点击小编头像，关注后私信回复“python”即可下载。首先把代码撸起来！首先把代码撸起来！首先把代码撸起来！重要的事说三遍，哈哈。“编程是门手艺活”。什么意思？得练啊。

正则表达式编程语言 python

安科网

python干货｜正则表达式

DCXabc

正则表达式的简单介绍

(?iLmsux)为分组设置模式

反斜杠的使用

re模块

最后

DCXabc

相关推荐

shell模糊匹配与正则详解

正则表达式中两个反斜杠的匹配规则详解

正则表达式解决input框固定输入值得格式(金额,特殊字符)

浅析golang 正则表达式

Oracle数据库正则表达式使用场景代码实例

Shell—正则表达式（grep命令、sed工具）

【教程】图文解读正则表达式的使用技巧

如何掌握正则表达式这一开发利器，看这篇就够了

基于xpath选择器、PyQuery、正则表达式的格式清理工具详解

3个助你玩转正则表达式的利器

如何使用Grep命令查找多个字符串

C# 正则表达式

正则表达式常用通配符

正则表达式在NLP中应用

正则表达式匹配样例

正则表达式常用的字符类

用正则表达式验证表格的格式

SHELL正则表达式

02-re模块使用

正则表达式 I

DCXabc