asp 使用正则表达式替换word中的标签,转为纯文本
公司客户在使用网站后台编辑添加修改内容时,经常是直接从word文档里复制内容到编辑器里后就提交。结果是在内容显示页面上是五花八门的样式,有时也需要部分纯文本内容作为摘录使用,这些都需要清除word格式。改变客户的习惯要客户先复制到记事本里再粘贴到编辑器里编辑是很难的,所以从我们自己改变起。从网上百度了若干清除word格式的正则,使用效果不甚理想,所以自己写了清除word格式的asp函数,能满足我们自己的使用需求。函数如下:
代码如下:
function cleanWord(html) dim regEx set regEx=New RegExp regEx.IgnoreCase=True regEx.Global=True regEx.Pattern="<[^>]*>" '清除所有<>之间的内容 html = regEx.replace(html,"" ) regEx.Pattern="{[^}]*}" '清除所有{}之间的内容 html = regEx.replace(html,"" ) regEx.Pattern="/[^/]*/" '清除所有/**/之间的注释 html = regEx.replace(html,"" ) html =Replace(html,"table.MsoNormalTable","") '替换掉漏网的单词 cleanWord= html set regEx=nothing end function
相关推荐
shqhope 2020-06-23
wangzhaotongalex 2020-10-20
wyq 2020-11-11
TLROJE 2020-10-26
风雨断肠人 2020-10-13
duanqingfeng 2020-09-29
rechanel 2020-11-16
cshanzhizi 2020-10-16
luofuIT成长记录 2020-09-22
phphub 2020-09-10
taomengxing 2020-09-07
MaggieRose 2020-08-19
flyingssky 2020-08-18
山水沐光 2020-08-18
jyj00 2020-08-15
AHuqihua 2020-08-09
山水沐光 2020-08-03