查看“页面源”显示的不同于cURL的HTML

查看“页面源”显示的不同于cURL的HTML,第1张

概述首先,我的问题与此不同: Difference between cURL and web browser? 我使用我的Chrome浏览器访问:http://www.walmart.com/search/browse-ng.do?cat_id=1115193_1071967然后,我查看页面源代码: < a class =“js-product-title”href =“/ ip / Tide-Sim @H_502_1@ 首先,我的问题与此不同: Difference between cURL and web browser?

我使用我的Chrome浏览器访问:http://www.walmart.com/search/browse-ng.do?cat_id=1115193_1071967然后,我查看页面源代码:

< a class =“Js-product-Title”href =“/ ip / TIDe-Simply-Clean-Fresh-Refreshing-Breeze-liquID-Laundry-Detergent-138-fl-oz / 33963161”>

但是,我没有从命令行找到这种信息:

curl "http://www.walmart.com/search/browse-ng.do?cat_ID=1115193_1071967">local.HTML

有谁知道为什么会造成这种差异?我正在使用Python scrapy选择器来解析网页.

解决方法 您的浏览器可以执行JavaScript,而JavaScript又可以更改文档. Curl只会为您提供简单的原始输出,而不是其他内容.

如果您在浏览器中关闭JavaScript并刷新页面,您将看到它的外观不同.

总结

以上是内存溢出为你收集整理的查看“页面源”显示不同于cURL的HTML全部内容,希望文章能够帮你解决查看“页面源”显示的不同于cURL的HTML所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/1027944.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-23
下一篇 2022-05-23

发表评论

登录后才能评论

评论列表(0条)

保存