正则表达式解析嵌套HTML元素

正则表达式解析HTML中元素:

regExp:

<(?i)div[^>]*(?i)id=["']?You_Name["']?[\s\S]*>[^<>]*(((?'Open'<(?i)div[^>]*>)[^<>]*)+((?'-Open'</(?i)div>)[^<>]*)+)*(?(Open)(?!))</(?i)div>

example:

1.<divid="test"><Divbackgroup="abc"id="You_Name"><div>tewt</div></div></div>

2.<divid="test"><Divbackgroup="abc"id=You_Name><div>tewt</div></div></div>

3.<divid="test"><Divid="You_Name"backgroup="abc"><div>tewt</div></div></div>

4.<divid="test"><DiviD=You_Namebackgroup="abc"><div>tewt</div></div></div>

result:

1.<Divbackgroup="abc"id="You_Name"><div>tewt</div></div>

2.<Divbackgroup="abc"id=You_Name><div>tewt</div></div></div>

3.<Divid="You_Name"backgroup="abc"><div>tewt</div></div></div>

4.<DiviD=You_Namebackgroup="abc"><div>tewt</div></div></div>

说明,标签大小写不敏感,标签的属性名"id"大小写不敏感。

这里是解析嵌套的<div>,如果是解析其他标签,只要把regExp中的div改成相应的标签名即可。

相关推荐