HTML 的格式化正则

下面的这些正则是用来格式化HTML的,记录一下,以后用的时候会有帮助的。

//string regexstr = @"<[^>]*>"; //去除所有的标签

//@"<script[^>]*?>.*?</script>" //去除所有脚本,中间部分也删除 // string regexstr = @"<img[^>]*>"; //去除图片的正则

// string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br

// string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容

string regexstr = @"<(?!img br p /p).*?>"; //去除所有标签,只剩img,br,p

相关推荐