网页爬虫抓回的信息，是怎样存放在数据库里

older4me • 2023-3-28 • sql • 阅读 8

1、抓取、下载网页；

2、分析网页、找出自己想要的信息；

3、入库

举例：一个网页抓取十个字段，先分别做上标记放入缓存，然后执行sql插库

二营长SEO

这种是工作上的问题把。

没给点好处很难做。

需要一个定时任务。不断去扫这个页面。一有更新马上获取。

获取需要用到解析html标签的jar包。

很简单。但是不想在这浪费时间给你写。

一般抓数据的话可以学习Python，但是这个需要代码的知识。

如果是没有代码知识的小白可以试试用成熟的采集器。

目前市面比较成熟的有八爪鱼，后羿等等，但是我个人习惯八爪鱼的界面，用起来也好上手，主要是他家的教程容易看懂。可以试试。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6769632.html

网页后羿的话但是成熟

打赏

微信扫一扫

支付宝扫一扫

older4me 一级用户组

sql的delete怎样同时删除多个表中的记录？

上一篇 2023-03-28

tp5查询卡死

下一篇 2023-03-28

发表评论

登录后才能评论

评论列表（0条）