python获取网页信息

python获取网页信息,第1张

首先你这个代码在我这里运行是ok的。

Expires: Tue, 27 Jan 2015 03:56:41 GMT

Date: Tue, 27 Jan 2015 03:55:21 GMT

Server: nginx

Content-Type: text/html; charset=GBK

Vary: Accept-Encoding,User-Agent,Accept

Cache-Control: max-age=80

X-Via: 11 czdx88:8105 (Cdn Cache Server V20), 11 dagang20:0 (Cdn Cache Server V20)

Connection: close

这个应该是请求错误,有多个可能:

1。你没有连接到网络上,无法访问这个地址

2。你使用了代理

3 你一段时间内访问的太频繁,被对方的服务器拉入了黑名单。

你可以按照自己的情况排查一下。

如果解决了您的问题请采纳!

如果未解决请继续追问!

获取A标签的内容。

监听,当A标签点击的时候,执行函数。

index1html  网页

<!DOCTYPE html>

<html>

<head>

<meta charset="UTF-8">

<title>Document</title>

</head>

<body>

<a id="one">跳转设置abc</a>

<script>

var btn = documentquerySelector('#one');

var text = documentquerySelector('#one')innerHTML;

consolelog(window);

btnaddEventListener('click', function(){

windowlocation = 'index2html#'+text;

})

</script>

</body>

</html>

index2html  网页

<!DOCTYPE html>

<html>

<head>

<meta charset="UTF-8">

<title>Document</title>

</head>

<body>

<div id="two"  style="padding: 50px;background: #f80;font-size: 30px;"></div>

<script>

var div = documentquerySelector('#two');

var bl = windowlocationhashslice(1);

var atest = decodeURI(bl);

divinnerHTML=atest; //把获取到的内容放到 DIV里面

</script>

</body>

</html>

// 添加

HtmlMeta desc = new HtmlMeta();

descName = "description";

descContent = page_desc;

PageHeaderControlsAdd(desc);

// 删除

foreach(Control ctrl in pageHeaderControls)

{

if(ctrl is HtmlMeta) pageHeaderControlsRemove(ctrl);

}

首先确定这个动态页面的数据是用:

1、ajax类似的重新请求网络获取数据?

2、还是html中已经存在这些数据?

3、还是通过js读取内存中的数据?

确定好这些,你才能知道如何下手。第一、二种方式是可以模拟的,如果是第三种,建议你放弃。

以上就是关于python获取网页信息全部的内容,包括:python获取网页信息、springboot怎么获取网页某些信息、C#如何获取页面meta信息(加分)等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9647312.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存