python获取网页信息_框架

首先你这个代码在我这里运行是ok的。

Expires: Tue, 27 Jan 2015 03:56:41 GMT

Date: Tue, 27 Jan 2015 03:55:21 GMT

Server: nginx

Content-Type: text/html; charset=GBK

Vary: Accept-Encoding,User-Agent,Accept

Cache-Control: max-age=80

X-Via: 11 czdx88:8105 (Cdn Cache Server V20), 11 dagang20:0 (Cdn Cache Server V20)

Connection: close

这个应该是请求错误，有多个可能：

1。你没有连接到网络上，无法访问这个地址

2。你使用了代理

3 你一段时间内访问的太频繁，被对方的服务器拉入了黑名单。

你可以按照自己的情况排查一下。

如果解决了您的问题请采纳！

如果未解决请继续追问！

获取A标签的内容。

监听，当A标签点击的时候，执行函数。

index1html 网页

<!DOCTYPE html>

<html>

<head>

<title>Document</title>

</head>

<body>

<a id="one">跳转设置abc</a>

var btn = documentquerySelector('#one');

var text = documentquerySelector('#one')innerHTML;

consolelog(window);

btnaddEventListener('click', function(){

windowlocation = 'index2html#'+text;

})

</script>

</body>

</html>

index2html 网页

<!DOCTYPE html>

<html>

<head>

<title>Document</title>

</head>

<body>

var div = documentquerySelector('#two');

var bl = windowlocationhashslice(1);

var atest = decodeURI(bl);

divinnerHTML=atest; //把获取到的内容放到 DIV里面

</script>

</body>

</html>

// 添加

HtmlMeta desc = new HtmlMeta();

descName = "description";

descContent = page_desc;

PageHeaderControlsAdd(desc);

// 删除

foreach(Control ctrl in pageHeaderControls)

{

if(ctrl is HtmlMeta) pageHeaderControlsRemove(ctrl);

}

首先确定这个动态页面的数据是用：

1、ajax类似的重新请求网络获取数据？

2、还是html中已经存在这些数据？

3、还是通过js读取内存中的数据？

确定好这些，你才能知道如何下手。第一、二种方式是可以模拟的，如果是第三种，建议你放弃。

以上就是关于python获取网页信息全部的内容，包括:python获取网页信息、springboot怎么获取网页某些信息、C#如何获取页面meta信息（加分）等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/web/9647312.html

python获取网页信息

发表评论

评论列表（0条）