造成此问题的原因有几方面。首先,它希望日期的日期和月份部分用两位数表示,并且还期望某些流行浏览器的用户代理字符串。以下代码应该工作:
import requests, bs4headers = { "User-Agent": "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36"}payload = {'as_epq': 'James Clark', 'tbs':'cdr:1,cd_min:01/01/2015,cd_max:01/01/2015', 'tbm':'nws'}r = requests.get("https://www.google.com/search", params=payload, headers=headers)soup = bs4.BeautifulSoup(r.content, 'html5lib')print soup.find(id='resultStats').text
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)