正则表达式解析嵌套HTML元素
正则表达式解析HTML中元素:
regExp:
<(?i)div[^>]*(?i)id=["']?You_Name["']?[\s\S]*>[^<>]*(((?'Open'<(?i)div[^>]*>)[^<>]*)+((?'-Open'</(?i)div>)[^<>]*)+)*(?(Open)(?!))</(?i)div>
example:
1.<divid="test"><Divbackgroup="abc"id="You_Name"><div>tewt</div></div></div>
2.<divid="test"><Divbackgroup="abc"id=You_Name><div>tewt</div></div></div>
3.<divid="test"><Divid="You_Name"backgroup="abc"><div>tewt</div></div></div>
4.<divid="test"><DiviD=You_Namebackgroup="abc"><div>tewt</div></div></div>
result:
1.<Divbackgroup="abc"id="You_Name"><div>tewt</div></div>
2.<Divbackgroup="abc"id=You_Name><div>tewt</div></div></div>
3.<Divid="You_Name"backgroup="abc"><div>tewt</div></div></div>
4.<DiviD=You_Namebackgroup="abc"><div>tewt</div></div></div>
说明,标签大小写不敏感,标签的属性名"id"大小写不敏感。
这里是解析嵌套的<div>,如果是解析其他标签,只要把regExp中的div改成相应的标签名即可。