我使用我的Chrome浏览器访问:http://www.walmart.com/search/browse-ng.do?cat_id=1115193_1071967然后,我查看页面源代码:
< a class =“Js-product-Title”href =“/ ip / TIDe-Simply-Clean-Fresh-Refreshing-Breeze-liquID-Laundry-Detergent-138-fl-oz / 33963161”>
但是,我没有从命令行找到这种信息:
curl "http://www.walmart.com/search/browse-ng.do?cat_ID=1115193_1071967">local.HTML
有谁知道为什么会造成这种差异?我正在使用Python scrapy选择器来解析网页.
解决方法 您的浏览器可以执行JavaScript,而JavaScript又可以更改文档. Curl只会为您提供简单的原始输出,而不是其他内容.如果您在浏览器中关闭JavaScript并刷新页面,您将看到它的外观不同.
总结以上是内存溢出为你收集整理的查看“页面源”显示的不同于cURL的HTML全部内容,希望文章能够帮你解决查看“页面源”显示的不同于cURL的HTML所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)