在爬取某招聘网站的时候,试图用request获得url的文本,然后用正则表达式匹配相关信息,但是!人家变成动态页面,无法再用普通的静态页面的方法去获取。
>>没有,是我错了,之前我没有用cookie登录,所以返回的是无关信息。只要登录了,把cookie写进去,就可以用requests获得实际的数据了。
01.报错问题02.报错原因File "D:/Python_Project/XXX.py", line 16, in
name = re.findall(r'"matchInfo":.*?"name":"(.*?)"', response)[i] #工作名称
IndexError: list index out of range
搜索网上,出现这种报错一般是两种原因:
1.下标超出范围
>>这种情况一般前面是可以跑上几个轮次再报错的,我用debug测试, 第一遍就跪了,所以pass
2.list是一个空列表,里面没有任何元素,所以list[0]就会出现错误
>>这个靠谱,我之后把整个文本拿出来搜索了一番也没有找到匹配项,所以列表为空。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)