Scrapy 是一个Web-spider或 Web scraper框架
,为Scrapy提供一个根URL以开始爬网,然后可以指定要爬网和获取的URL数量的限制。它是用于 爬网 或 爬网 的完整框架。
而
BeautifulSoup 是一个 解析库
,它在从URL提取内容方面也做得很好,并允许您轻松解析其中的某些部分。它只会获取您提供的URL的内容,然后停止。除非您使用某些条件将其手动放入无限循环内,否则它不会爬网。
简而言之,使用Beautiful Soup,您可以构建类似于Scrapy的东西。美丽的汤是一个 库, 而Scrapy是一个 完整的框架 。
资源
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)