PHP-正则表达式

jianxm

2020-03-28

正则表达式

正则表达式被用来检索或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如：JavaScript、PHP、ASP、JAVA、Perl、C#、.NET、ColdFusion、Python、Visual Basic、MYSQL、LINUX、VI编辑器等等语言都支持正则表达式。

简单来说正则表达式就是完成字符串的增、删、改、查。

定界符

正则表达式语句需要由分隔符（定界符）闭合包裹，分隔符可以使任意非字母数字, 非反斜线, 非空白字符

经常使用的分隔符是正斜线(/), hash符号(#) 以及取反符号(~)。

建议使用//做为定界符,因为与js一致。

$status =  preg_match(‘/houdunren/‘, ‘houdunren.com‘);
var_dump($status);

元字符

元字符是正则表达式中的最小元素，只代表单一（一个）字符。下面是元字符列表

元字符	说明	范围
\d	匹配任意一个数字	[0-9]
\D	与除了数字以外的任何一个字符匹配	[^0-9]
\w	与任意一个英文字母,数字或下划线匹配	[a-zA-Z_0-9]
\W	除了字母,数字或下划线外与任何字符匹配	[^a-zA-Z_0-9]
\s	与任意一个空白字符匹配	[\n\f\r\t\v]
\S	与除了空白符外任意一个字符匹配	[^\n\f\r\t\v]
\n	换行字符
\t	制表符

var_dump(preg_match(‘/\d/‘, ‘1‘));
var_dump(preg_match(‘/\D/‘, ‘h‘));
var_dump(preg_match(‘/\w/‘, ‘_‘));
var_dump(preg_match(‘/\W/‘, ‘@‘));
var_dump(preg_match(‘/\s/‘, ‘ ‘));
var_dump(preg_match(‘/\S/‘, ‘h‘));
var_dump(preg_match(‘/\n/‘, "\n"));
var_dump(preg_match(‘/\n/‘, ‘
‘));
var_dump(preg_match(‘/\t/‘, "\t"));

元字符表（原子表）

在一组字符中匹配某个元字符，在正则表达式中通过元字符表来完成，就是放到方括号中。

原子表	说明
[]	只匹配其中的一个原子
[^]	只匹配"除了"其中字符的任意一个原子
[0-9]	匹配0-9任何一个数字
[a-z]	匹配小写a-z任何一个字母
[A-Z]	匹配大写A-Z任何一个字母
.	点在正则中表示除换行符外的任意字符

匹配聊了 678外的任何字符

$status = preg_match(‘/[^678]/‘, 678);
var_dump($status);

匹配大小写字母

$status = preg_match(‘/[a-zA-Z]/‘, ‘a‘);
var_dump($status);

用. 匹配字符

$status = preg_match(‘/./‘, ‘houdunren‘);
var_dump($status);

下面是通过原子表拆分字符串

$str ="@3.jpg#4.jpg";
$arr = preg_split(‘/[@#]/‘,$str); //按正则表达式拆分字符串
print_r($arr); //输出结果 Array ( [0] => 1.jpg [1] => 2.jpg [2] => 3.jpg [3] => 4.jpg )

原子组

如果一次要匹配多个元子，可以通过元子组完成
原子组与原子表的差别在于原子组一次匹配多个元子，而原子表则是匹配成功表中的一个元字符就可以
元字符组用（）表示

下面是使用正则表达式将houdunwang 字符中的 houdun 描红。

$str = "官网www.houdunwang.com 论坛http://bbs.houdunwang.com，我在网名叫houdun";
$preg = "/(houdun)wang/is";
$newStr= preg_replace($preg, ‘<span style="color:#f00">\1</span>wang‘, $str);
echo $newStr;

匹配字符边界

如果想匹配字符的边界，边界包括空格、标点符号、换行等，可以使用正则表达式的匹配字符边界修饰符如下。

符号	说明
^	匹配字符串的开始
$	匹配字符串的结束，忽略换行符

$status = preg_match(‘/^houdunren$/‘, ‘houdunren‘);
var_dump($status); //返回真

选择修释符

| 这个符号带表选择修释符，也就是 | 左右两侧有一个匹配到就可以。

下面是通过选择修释符将域名修改为 houdunren

$str = "http://www.baidu.com与新浪网http://www.sina.com";
$preg = "/\.(baidu|sina)\./is";
echo preg_replace($preg, ‘.houdunren.‘, $str);

匹配域名后缀

$str = ‘来了，老弟！有问题就上 houdunren.com 或 houdunwang.com 我们在那里等你‘;
$preg = ‘/(houdunren|houdunwang)\.com/‘;
$replace = ‘<a href="http://www.\1.com">\1.com</a>‘;
echo preg_replace($preg, $replace, $str);

重复匹配

如果要重复匹配一些内容时我们要使用重复匹配修饰符，包括以下几种。

因为正则最小单位是元字符，而我们很少只匹配一个元字符如a、b所以基本上重复匹配在每条正则语句中都是必用到的内容

符号	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

var_dump(preg_match(‘/^.*$/‘, ‘‘)); //* 零个及空字符串也是可以的
var_dump(preg_match(‘/^[0-9]+$/‘, ‘1976‘)); // 返回真
var_dump(preg_match(‘/^9?$/‘, ‘99‘)); // 返回假
var_dump(preg_match(‘/^9{2}$/‘, ‘99‘)); // 返回真
var_dump(preg_match(‘/^[0-9]{2,}$/‘, ‘123‘)); //返回真
var_dump(preg_match(‘/^[0-9]{2,3}$/‘, ‘1234‘)); // 返回假，只能2~3位

下面匹配域名操作

$web = ‘sina.com‘;
var_dump(preg_match(‘/^[a-z-0-9-]+\.(com|net|com\.cn|org|cn)$/‘, $web));

下面是把 h1标签内容加上超链接

$str = <<<html
<h1>hello houdunren</h1>
html;
echo preg_replace(‘/<h1>(.+)<\/h1>/‘, ‘<a href="http://www.houdunren.com">\1</a>‘, $str);

禁止重复匹配

正则表达式在进行重复匹配时，默认是贪婪匹配模式，也就是说会尽量匹配更多内容，但是有的时候我们并不希望他匹配更多内容，这时可以通过?进行修饰来禁止重复匹配。

符号	说明
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复

$str = ‘123456‘;
preg_match(‘/\d+?/‘,$str,$matches);
print_r($matches);

因为增加了 ? 所以只匹配数字1

下面是使用禁止贪婪符替换将h1标签内容倾斜处理

$str = "<h1>你好</h1><h1>向军大叔</h1>";
$preg = ‘/<h1>(.*?)<\/h1>/‘;
$replace = ‘<h1><em>\1</em></h1>‘;
echo preg_replace($preg,$replace,$str);

下面是替换h1-h6标签内容，就不需要使用禁止贪婪符了

$str = "<h1>你好</h1><h2>向军大叔</h2>";
$preg = ‘/<h([1-6])>(.*)<\/h\1>/‘;
$replace = ‘<h\1><em>\2</em></h\1>‘;
echo preg_replace($preg,$replace,$str);

模式修正符

正则表达式在执行时会按他们的默认执行方式进行，但有时候默认的处理方式总不能满足我们的需求，所以可以使用模式修正符更改默认方式。

符号	说明
i	不区分大小写字母的匹配
s	将字符串视为单行，换行符做普通字符看待，使“.” 匹配任何字符
x	忽略空白及#符号，根据此特性可以添加正则注释
m	^与$符匹配按行匹配
A	强制从字符串开始匹配（多行时默认以每行开始设置）
D	以$结尾时不允许后面有换行（使用\m时无效）

\i修正符不匹分大小示例

$str = ‘https://www.HoudunREN.com 后盾人‘;
$preg = ‘/https:\/\/www.houdunren.com/i‘;
$replace= ‘<a href="\0">\0</a>‘;
echo preg_replace($preg,$replace,$str);

\s 将字符串示为单行操作

$preg = ‘#(<h1>)(.*?)(</h1>)#s‘;
preg_match_all($preg,$str,$matches);
//print_r($matches);

$replace = ‘\1<span style="color:red">\2\3‘;
echo preg_replace($preg,$replace,$str);

\m 使用 ^ 与 $ 按单行操作文本

$str = <<<php
#1 2022-02-12
后盾人
@#100
雅虎网
#2 2033-09-11
向军大叔
php;
$preg = ‘/^#\d+.*[\r|\n]$/m‘;
preg_match_all($preg, $str, $matches);
print_r($matches);

\x字符忽略空白和添加正则注释

添加注释

$str=‘houdunren.com‘;
$preg = ‘/^h
   # 这是匹配以 h 开始的内容
/x‘;
echo preg_replace($preg,‘‘,$str);

当设置了\x后# 会被忽略，如果正则中使用#需要转义处理

$str=<<<php
#1
后盾人#1
#2
向军大叔#2
php;
$preg = ‘/^
\#\d  #匹配以数字开始
+.* $ #后跟任何字符
/mx‘;
echo preg_replace($preg,‘‘,$str);

\U 与?功能相似意为禁止贪婪匹配

$str = <<<php
<h1>后盾人</h1>
<h1>向军大叔</h1>
php;
;
$preg = ‘#<h1>.*</h1>#sU‘;
preg_match_all($preg,$str,$matches);
print_r($mat
ches);

\A 与 ^限定符使用效果相似，必须以目标字符串开始。下面是验证邮箱例子

$str = ‘‘;
$preg = ‘/\[\w\.]+/A‘;
preg_match_all($preg,$str,$matches);
print_r($matches);

\D 修正符使用不允许以换行结束

$str = <<<php
3a\n
php;
$preg = ‘/\d+a$/D‘;
preg_match_all($preg,$str,$matches);
print_r($matches);

常用函数

preg_match

获取第一个匹配的内容

$str= ‘@3‘;
preg_match(‘/\d+/‘,$str,$matches);
print_r($matches);

preg_match_all

获取所有匹配的内容

$str= ‘@3‘;
preg_match(‘/\d+/‘,$str,$matches);
print_r($matches);

preg_split

通过正则表达式拆分字符串

$str= ‘#3‘;
$arr = preg_split(‘/@|#/‘,$str);
print_r($arr);

preg_replace

通过正则表达式替换

$str= ‘#3‘;
echo preg_replace(‘/@|#/‘,‘-‘,$str);

preg_replace_callback

使用回调函数进行替换操作

$str = ‘@3‘;
echo preg_replace_callback(‘/\d+/‘,function ($matches) {
	return $matches[0]+100;
}, $str);

正则表达式 td preg_match 字符 match

jianxm

0 关注 0 粉丝 0 动态

关注关注

C# 正则表达式

.Net 框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成。正则表达式中的反斜杠字符（\）指示其后跟的字符是特殊字符，或应按原义解释该字符。与报警符 \u0007 匹配。" + ‘\u0007‘ 中的 "

MaggieRose 2020-08-19

SHELL正则表达式

完成日常工作中我们需要得特定字符串匹配，或者从输出内容中匹配出符合我们需要得内容。1丶匹配标点符号[ ~]# grep ‘[[:punct:]]‘ /etc/fstab2丶匹配任意字母或者数字[ ~]# echo "I m Love ZhongG

山水沐光 2020-08-03

shell模糊匹配与正则详解

正则可以实现一些简单的功能，并用在脚本中，如检测ip地址是否符合规范，检测文件名是否符合规范等等。正则表达式主要是用来描述一个句法规则的模式。其实说的通俗一点，就是利用字符和元字符的组合，对一些符合既定句法的模式进行模糊匹配。它的主要功能是文本查询和字符串

wangzhaotongalex 2020-10-20

Shell—正则表达式（grep命令、sed工具）

正则表达式对于系统管理员来说是非常重要的，熟练运用正则表达式可使工作变得更加简单、方便。简单来说，是一种匹配字符串的方法，通过一些特殊符号，实现快速查找、删除、替换某个特定字符串。正则表达式对于系统管理员来说是非常重要的，系统运行过程中会产生大量的信息，这

rechanel 2020-11-16

【教程】图文解读正则表达式的使用技巧

一个好的正则表达式看起来像魔法，但请记住：任何足够先进的技术都无法与魔法区分开来。所以，就让我们揭开正则表达式的神秘面纱！如果你理解正则表达式，它会突然变成一个超快速和强大的工具……让我们从基础开始。它们的用途是什么？正则表达式通常用于 grep 等工具中

cshanzhizi 9评论 2020-10-16

如何掌握正则表达式这一开发利器，看这篇就够了

正则表达式具有伟大技术发明的一切特点，它简单、优美、功能强大、妙用无穷。对于很多实际工作来讲，正则表达式简直是灵丹妙药，能够成百倍地提高开发效率和程序质量。表示数字、大小写字母和下划线。表示空白符，包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。

luofuIT成长记录 2020-09-22

如何使用Grep命令查找多个字符串

大家好，我是良许!今天向大家介绍一个非常有用的技巧，那就是使用 grep 命令查找多个字符串。简单介绍一下，grep 命令可以理解为是一个功能强大的命令行工具，可以用它在一个或多个输入文件中搜索与正则表达式相匹配的文本，然后再将每个匹配的文本用标准输出的

taomengxing 2020-09-07

正则表达式常用的字符类

=\") \"表示转义，即双引号"其中(?=)为正向预搜索，表示要匹配的字符串后面必须是".*?表示要匹配的部分比如：正式表达式：(?美国邮编的规则是5位数字，或者用连字号间隔的9位数字。之所以要给出这个例子是因为它

jyj00 2020-08-15

正则表达式

# Thompson将正则表达式引入到Unix中文本编辑器ed和grep命令中，由此正则表达式普# 及开来。# # 二.分类# # # BRE# 　　基本正则表达式，grep、sed、vi等软件支持。# # ERE# 　　扩展正则表达式，egrep、sed

MaggieRose 2020-07-04

正则表达式基础

[xyz]匹配字符x，y或z.如果中括号内包含元字符，则元字符降级为普通字符，即[+.?]匹配加号，点号或问号。通常 \ * + | { [ ( ) ] } ^ $ . # 和空白这些字符都需要转义，使用\进行标识转义

modaiairen 2020-06-28

小智最近在学习正则，学习过程中发现这 6 个方便的正则表达式

几乎所有流行的编程语言都支持正则表达式，因为正则实在是太强大了，它能让我们原本需要数十行代码才能完成的，正则大哥一行就能搞定了。在本文中，我们将研究前端开发人员经常必须处理的6个文本处理和操作，并了解正则表达式是如何简化这个过程的。假设我们想要匹配文本中包

ziggurat 2020-06-28

【python----发轫之始】【正则表达式总结】

能够按照某种模式匹配一系列具有相似特征的字符串。：作用是代表前面的字符出现0次或1次，即前面的字符可有可无。如遇到. $ ^ 等特殊字符，我们就得用“\”进行转义。返回指定组别中的元素。以字典的形式返回组名和对应的信息。将pattern中的repl 替换成

JnX 2020-06-27

第一章—正则表达式

是一些由字符和特殊符号组成的字符串，它们描述了模式的重复或者表述多个字符，于是正则表达式能按照某种模式匹配一系列有相似特征的字符串。搜索和匹配的比较匹配：用于严格讨论与字符串中模式相关的正则表达式时，指的是“模式匹配”。而用于python术语中，代表完成模

jyj00 2020-06-26

python——RE模块的基础应用及正则表达式的使用

re模块是python独有的匹配字符串的模块，该模块中提供的很多功能是基于正则表达式实现的，而正则表达式是对字符串进行模糊匹配，提取自己需要的字符串部分，他对所有的语言都通用。反斜杠不会被任何特殊方式处理。元字符就是指那些在正则表达式中具有特殊意义的专用字

山水沐光 2020-06-25

在 JavaScript 中替换所有指定字符 3 种方法

在 JS 没有提供一种简便的方法来替换所有指定字符。在 Java 中有一个 replaceAll() ，replaceAll)方法使用给定的参数 replacement 替换字符串所有匹配给定的正则表达式的子字符串。在该提案还没出来之前，我们来看看在 JS

shqhope 2020-06-23

10. 正则表达式匹配

给你一个字符串?和一个字符规律?p，请你来实现一个支持 ‘.‘?和?‘*‘?的正则表达式匹配。所谓匹配，是要涵盖?可能为空，且只包含从?因为 ‘‘ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a‘。因此，字符串 "aa&qu

eroshn 2020-06-21

leetcode之正则表达式匹配Golang

正则表达式这道题对我来说是真的难，花了两天的时间才做出来。做这道题首先需要注意的是点号`.`可以匹配任何字符，字符加星号`*`表示零个或者多个该字符，例如a*表示零个或者多个a，所以对于正则表达式中，后面不跟*的字符，在字符串s中必须找到对应的字符，对于正

码墨 2020-06-16

正则表达式中两个反斜杠的匹配规则详解

于是乎我就在思考，为什么会匹配不到，假设\t被转义成一个\t，那么也应该匹配到\tsanle,而不是none。而需要匹配的字符串\\\t -->两个反斜杠会变成一个反斜杠。然后就变成\\t了，然后就变成直接的一个tab键，他们就匹配上了。这就是我所理

wyq 2020-11-11

正则表达式解决input框固定输入值得格式(金额,特殊字符)

栗子：只能输入金额，只能输入小数且最多保留2位不能输入某。//这里我使用的是input，每输入一次就会检查，也可以使用change改变时检查或blur失去焦点时检查。message: "请输入小于1的数!&*――――\-+={}|《》？m

TLROJE 2020-10-26

浅析golang 正则表达式

Go是 Google 的 Robert Griesemer，Rob Pike 及 Ken Thompson 开发的一种静态强类型、编译型语言。Go 语言语法与 C 相近，但功能上有：内存安全，GC，结构形态及 CSP-style 并发计算。罗伯特格瑞史莫，

风雨断肠人 2020-10-13

PHP-正则表达式

正则表达式

定界符

元字符

元字符表（原子表）

原子组

匹配字符边界

选择修释符

重复匹配

禁止重复匹配

模式修正符

常用函数

preg_match

preg_match_all

preg_split

preg_replace

preg_replace_callback

相关推荐