源代码在我github仓库:https://github.com/xzajyjs/Python_FilmInfo_reptile
爬取豆瓣上2009-2021年共13年的年度电影排行榜数据,可全自动爬取,爬取内容如下:- 电影名称
- 电影分类
- 电影上映日期
- 电影票房
已知问题:部分年份的个别电影的票房信息可能会有少许错误
解决方案:手动修复或修改obj规则
源码中默认是爬取2009-2021所有年份的信息,如只需要部分年份,只需注释掉 line 42-47,将line 50-62中需要的年份取消注释即可。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)