java爬虫读取某一张指定图片的url,求解答

java爬虫读取某一张指定图片的url,求解答,第1张

使用jsoup解析到这个url就行,dom结构如下:

look-inside-cover类只有一个,所以直接找到这个img元素,获取src属性,就可以获取到路径。

代码实现如下:

Document doc = Jsoupconnect("");

jsoup的jar包分享给你:

总结一下Jsoup提供的方法:

获取元素的有:

getElementById(String id)

getElementsByTag(String tag)

getElementsByClass(String className)

getElementsByAttribute(String key)

siblingElements(), firstElementSibling(), lastElementSibling(); nextElementSibling(), previousElementSibling()

parent(), children(), child(int index)

获取元素数据:

attr(String key) 获取属性

attr(String key, String value) 设置属性

attributes() 获取所有属性

id(), className() and classNames()

text() 获取文字内容

text(String value) 设置文字内容

html() 获取html内容

html(String value) 设置html内容

outerHtml()

data() 获取类似script,style的数据内容

tag() and tagName()

*** 作HTML内容:

append(String html), prepend(String html)

appendText(String text), prependText(String text)

appendElement(String tagName), prependElement(String tagName)

html(String value)

第一种方式:1、用>

怎样批量获取网页中的所有地址?求大神帮助

你可以用探嗅软体,影音神探,探嗅,可以批量获取网页中的所有地址, :crsky/soft/3520 这里可以下载。

如何批量下载一个网页的所有?急!

:jingyanbaidu/article/8275fc869e170f46a03cf6e4

首先开启你的浏览器,然后在浏览器介面上方右击滑鼠,选择选单栏,如果你的浏览器已经有选单栏了,这一步可以省略~

然后,点选档案——储存网页

在选择储存格式的时候,一定要选择网页,全部,不然储存下来的是没有图的哦~

接着点选储存按钮,将整个网页都储存下来~

储存下来的有一个资料夹和一个网页档案,双击开启那个资料夹~

里面全是网页上的了,但是尺寸只是你看到的尺寸哦,如果嫌这些尺寸太小,不合用,比如桌布,建议还是直接在网页上点选下载,这样可以下载高清的哦,直接批量储存网页有利有弊啦

求助怎么获取exe程式的所有

这是pdf加密档案,可以直接破解出原来的不加密档案,破解后任何电脑都能看,也可以复制和列印的。

怎样一键提取网页里的所有?

简单,你点网页另存为:网页,全部(htm;),储存到桌面上,储存完以后,桌面上会出现一个新资料夹里边装了所有。

java获取某个网页所有并下载到电脑

我不晓得你的指的是背景图还是只包含img标签内的,其实区别不大

1、首先 一个urlConnection,连结到你想要的网址,得到response的inputStream,

2、把返回的response当做一个xml解析(推荐使用jsoup,更方便一些),得到所有的img标签,遍历标签的src,下载得到所有的,这边需要注意下 有些网站可能会使用防盗链,低阶的你完全可以用cookie糊弄过去,高阶的就不太好搞了。需要你改一些request中的属性例如Referer之类的,再蛋疼的就需要拿到返回的二级制档案,然后本地重绘了。。。。

3、如果背景图什么的也要的话 ,拿到页面中的css档案,得到所有的连结,重复第二部的 *** 作。。。。

如何全选网页中的所有 将之复制呢

你把网页整个储存 储存的档案中就有一个资料夹是所有的 自己复制就好了

怎样在chrome中批量获取网页中所需媒体的连结地址

chrome浏览器用小乐图客扩充套件,可以批量获取连结地址,具体步骤:

:jingyanbaidu/article/63acb44ada434a61f17ee4

如何通过js获取网页中所有并加入点选事件,实现

在网页载入完成时,通过js获取和新增点选的识别方式

- (void)webViewDidFinishLoad:(UIWebView )webView {

[IDProgressHUD IDPlaceViewHideDirect:selfview];

这里是js,主要目的实现对url的获取

static NSString const jsGetImages =

@"function getImages(){\

var objs = documentgetElementsByTagName(\"img\");\

var imgScr = '';\

for(var i=0;i<objslength;i++){\

imgScr = imgScr + objs[i]src + '+';\

};\

return imgScr;\

};";

[webView stringByEvaluatingJavaScriptFromString:jsGetImages];注入js方法

NSString urlResurlt = [webView stringByEvaluatingJavaScriptFromString:@"getImages()"];

mUrlArray = [NSMutableArray arrayWithArray:[urlResurlt ponentsSeparatedByString:@"+"]];

if (mUrlArraycount >= 2) {

[mUrlArray removeLastObject];

}

urlResurlt 就是获取到得所有的url的拼接;mUrlArray就是所有Url的阵列

新增可点选js

[mWebView stringByEvaluatingJavaScriptFromString:@"function registerImageClickAction(){\

var imgs=documentgetElementsByTagName('img');\

var length=imgslength;\

for(var i=0;i<length;i++){\

img=imgs[i];\

imgonclick=function(){\

windowlocationhref='image-preview:'+thissrc}\

}\

}"];

[mWebView stringByEvaluatingJavaScriptFromString:@"registerImageClickAction();"];

}

在这个方法中捕获到的点选事件和被点选的url

- (BOOL)webView:(UIWebView )webView shouldStartLoadWithRequest:(NSURLRequest )request navigationType:(UIWebViewNavigationType)navigationType {

预览

if ([requestURLscheme isEqualToString:@"image-preview"]) {

NSString path = [requestURLabsoluteString substringFromIndex:[@"image-preview:" length]];

path = [path stringByAddingPercentEscapesUsingEncoding:NSUTF8StringEncoding];

path 就是被点选的url

return NO;

}

return YES;

}

android如何获取相簿所有

从本地选择(比如按钮触发该事件,调取系统相簿)

if (EnvironmentgetExternalStorageState()equals(

EnvironmentMEDIA_MOUNTED)) {

Intent getImageIntent = new Intent(IntentACTION_GET_CONTENT);

getImageIntentaddCategory(IntentCATEGORY_OPENABLE);

getImageIntentsetType("image/jpeg");

startActivityForResult(getImageIntent, 4);

} else {

ToastmakeText(getApplicationContext(), "SD卡不可用", 0)show();

}

本地选择 结果

在activity的onactivityresult()中写:

if (data != null) {判空

Uri uri = datagetData();

urigetPath()toString();

ContentResolver cr = thisgetContentResolver();

try {

Bitmap bmp;压缩

BitmapFactoryOptions option = new BitmapFactoryOptions();

optioninJustDecodeBounds = true;

optioninPurgeable = true;

optioninInputShareable = true;

optioninSampleSize = 2;

optioninJustDecodeBounds = false;

bmp = BitmapFactorydecodeStream(cropenInputStream(uri),

null, option);

imageView_userLogo(view控制元件设定背景)

imageView_userLogosetImageBitmap(BmpToRound

toRoundBitmap(bmp));

File file = SaveBitmapToSdCardsaveMyBitmap(

getApplicationContext(),

"" + SystemcurrentTimeMillis(), bmp);

startUpLoad(file);

} catch (FileNotFoundException e) {

eprintStackTrace();

}

}

如何获取一个网页内的所有邮箱地址求大神帮助

我告诉你,你去下载一个MAILGHOST的软体。输入网址他就全部给你抓下来。

记得采纳啊

1你贴的python代码,缩进有问题。

请自己重新确定代码缩进是正常的,且贴出来正常的代码给我们看。

2请确保:

你代码中所处理的内容,的确是你所截图贴出来的内容 -> 程序抓取出来的内容,有时候未必和你查看网页源码看到的内容是一样的。

3你的beautifulSoup使用的方式,就不太对。

以上就是关于java爬虫读取某一张指定图片的url,求解答全部的内容,包括:java爬虫读取某一张指定图片的url,求解答、用jsoup解析网页,取到class标签内容后、怎么用java代码爬取网页中视频的源地址,不等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9589479.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存