下面是内存溢出 jb51.cc 通过网络收集整理的代码片段。
内存溢出小编现在分享给大家,也给大家做个参考。
@Grab(group='org.ccil.cowan.Tagsoup',module='Tagsoup',version='1.2' )def TagsoupParser = new org.ccil.cowan.Tagsoup.Parser() def slurper = new XmlSlurper(TagsoupParser) def start=System.currentTimeMillis()def storePath = "/tmp/mm/"def urlPrefix = "http://me2-sex.lofter.com"def HTMLParser = slurper.parse("http://me2-sex.lofter.com/tag/%E7%BE%8E%E5%A5%B3%E6%91%84%E5%BD%B1")println "开始抓取高清图片,存储路径为:${storePath}"def pageslink = []def mmlink = []HTMLParser.'**'.findAll{ [email protected] == 'num'}.each {//抓取分页地址 pageslink.add(it.'@href'.text())}pageslink.each{//抓取每个分页mm图片链接 HTMLParser = slurper.parse(urlPrefix+it) HTMLParser.'**'.findAll{ [email protected] == 'img'}.each { mmlink.add(it.'@href'.text()) }}def count = 0long fileSize = 0mmlink.each{//抓取mm页面图片文件,并且存储到本地 slurper.parse(it).'**'.findAll{[email protected] == 'img imgclasstag'}.each { def address = it.'@bigimgsrc'.text() def file = new file(storePath+address.tokenize("/")[-1]) def fileOut = new fileOutputStream(file) def out = new bufferedoutputstream(fileOut) out << new URL(address).openStream() out.close() fileSize = file.length() + fileSize println "下载第"+ (count++) +"图片完成" + "大小 " +file.length()/1024 +"kb 地址:"+address } }def end = System.currentTimeMillis()println "mm数量${mmlink.size()},共抓取到${count}张图片,"+"用时:"+(end - start)/1000/60 + "分钟,下载总大小为:${fileSize/1024/1024}M"
以上是内存溢出(jb51.cc)为你收集整理的全部代码内容,希望文章能够帮你解决所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
总结以上是内存溢出为你收集整理的哦,妹子图,高清大图流量爆棚-Groovy全部内容,希望文章能够帮你解决哦,妹子图,高清大图流量爆棚-Groovy所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)