2、分析网页、找出自己想要的信息;
3、入库
举例:一个网页抓取十个字段,先分别做上标记放入缓存,然后执行sql插库
二营长SEO
这种是工作上的问题把。没给点好处很难做。
需要一个定时任务。不断去扫这个页面。一有更新马上获取。
获取需要用到解析html标签的jar包。
很简单。但是不想在这浪费时间给你写。
一般抓数据的话可以学习Python,但是这个需要代码的知识。如果是没有代码知识的小白可以试试用成熟的采集器。
目前市面比较成熟的有八爪鱼,后羿等等,但是我个人习惯八爪鱼的界面,用起来也好上手,主要是他家的教程容易看懂。可以试试。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)