【python】步骤四 第一课、初始正则表达式
第一课、初始正则表达式
一、课程介绍
1.1 课程概要
步骤介绍
- 正则表达式入门及应用
- 正则的进阶
- 案例
- 综合项目实战
二、正则表达式的基本操作(多敲代码多做练习)
2.1 什么是正则表达式
什么是正则表达式
- 正则表达式(简称为regex)是一些有字符和特殊符号组成的字符串
- 能按照某种模式匹配一系列有相似特征的字符串 例如:[a-z]表示26个小写英文字母
正则表达式中的符号
符号 | 描述 | 示例 |
literal | 匹配文本字符串的字面值literal | foo |
re1|re2 | 匹配正则表达式re1或者re2 | foo|bar |
. | 匹配任何字符(除了\n之外) | b.b |
^ | 匹配字符串起始部分 | ^Dear |
$ | 匹配字符串终止部分 | /bin/*sh$ |
* | 匹配0次或者多次前面出现的正则表达式 | [A-Za-z0-9]* |
+ | 匹配1次或者多次前面出现的正则表达式 | [a-z]+\.com |
? | 匹配0次或者1次前面出现的正则表达式 | goo? |
{N} | 匹配N次前面出现的正则表达式 | [0-9]{3} |
{M,N} | 匹配M~N次前面出现的正则表达式 | [0-9]{5,9} |
[...] | 匹配来自字符集的任意单一字符 | [aeiou] |
[..x-y..] | 匹配x~y范围中的任意单一字符 | [0-9][A-Za-z] |
[^...] | 不匹配此字符集中出现的任何一个字符,包括某一范围的字符(如果在此字符集中出现) | [^aeiou],[^A-Za-z0-9] |
(*|+|?|{})? | 用于匹配上面频繁出现/重复出现符号的非贪婪版本(*、+、?、{}) | *?[a-z] |
(...) | 匹配封闭的正则表达式,然后另存为子组 | ([0-9]{3})?,f(oo|u)bar |
正则表达式中的特殊字符
特殊字符 | 描述 | 示例 |
\d | 匹配任何十进制数字,与[0-9]一致(\D与\d相反,不匹配任何非数值型的数字) | |
\w | 匹配任何字母数字字符,与[A-Za-z0-9]相同(\W与之相反) | |
\s | 匹配任何空格字符,与[\n\t\r\v\f]相同(\S与之相反) | |
\b | 匹配任何单词边界(\B与之相反) | |
\N | 匹配已保存的子组N(参见上面的(...)) | |
\c | 逐字匹配任何特殊字符c(即,) | |
\A(\Z) |