ASP取出HTML里面的图片地址的函数
点击次数:38 次 发布日期:2008-11-22 11:29:24 作者:源代码网
|
源代码网推荐
以下是取出HTML里面的图片地址的函数:
主要原理就是用正则判断 <img> 的<src>属性。这在采集程序中将非常有用。
函数如下:
以下是引用片段: Function ShowPic(str) Set objRegExp = New Regexp"设置配置对象 objRegExp.IgnoreCase = True"忽略大小写 objRegExp.Global = True"设置为全文搜索 objRegExp.Pattern = "<img.+?>" "为了确保能准确地取出图片地址所以分为两层配置:首先找到里面的<img>标签,然后再取出里面的图片地址后面的getimgs函数就是实现后一个功能的。 strs=trim(str) Set Matches =objRegExp.Execute(strs)"开始执行配置 For Each Match in Matches RetStr = RetStr &getimgs( Match.Value )"执行第二轮的匹配 Next ShowPic = RetStr End Function Function getimgs(str) getimgs="" Set objRegExp1 = New Regexp objRegExp1.IgnoreCase = True objRegExp1.Global = True objRegExp1.Pattern = "http://.+?""""取出里面的地址 set mm=objRegExp1.Execute(str) For Each Match1 in mm getimgs=getimgs&left(Match1.Value,len(Match1.Value)-1)&"||""把里面的地址串起来备用 next End Function "取得图片内容 function getHTTPPage(url) on error resume next dim http set http=server.createobject("MSXML2.XMLHTTP")"使用xmlhttp的方法来获得图片的内容 Http.open "GET",url,false Http.send() if Http.readystate<>4 then exit function end if getHTTPPage=Http.responseBody set http=nothing if err.number<>0 then err.Clear end function "保存图片 function saveimage(from,tofile) dim geturl,objStream,imgs geturl=trim(from) imgs=gethttppage(geturl)"取得图片的具休内容的过程 Set objStream = Server.CreateObject("ADODB.Stream")"建立ADODB.Stream对象,必须要ADO 2.5以上版本 objStream.Type =1"以二进制模式打开 objStream.Open objstream.write imgs"将字符串内容写入缓冲 objstream.SaveToFile server.mappath(tofile),2"-将缓冲的内容写入文件 objstream.Close()"关闭对象 set objstream=nothing end function
"调用实例 Dim strpic,i,fname strpic = ShowPic("<DIV align=center><IMG src=""http://img.knowsky.com/img/knowskylogo.gif"" border=0></DIV>") strpic = Split(strpic,"||") If UBound(strpic) > 0 Then For i = 0 To UBound(strpic) - 1 "保存图片 fname=cstr(i&mid(strpic(i),instrrev(strpic(i),"."))) saveimage(strpic(i),fname) Next Else End If
源代码网供稿. |