欢迎来到福编程网,本站提供各种互联网专业知识!

asp只采集网站可见文本的正则

发布时间:2008-08-15 作者: 来源:转载
它可以过虑Js可以过滤CSS过滤HTML标识,只采集页面的可见文本。

我写的是这样:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "()"
originCode= reg.Replace(originCode, "")
reg.Pattern = "()"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]*>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function

不过有一些过滤不了!而且速度太慢!

相关推荐