如何用Java实现数据采集?

如何用Java实现数据采集?,第1张

Java网页数据采集器例子如下:

import java.util.regex.Matcher

import java.util.regex.Pattern

/**

* Group 类 用于匹配和抓取 html页面的数据

*/

public class Group {

public static void main(String[] args) {

// Pattern 用于编译正则 这里用到了3个正则 分别用括号()包住

// 第1个正则用于匹配URL 当然这里的正则不一定准确 这个匹配URL的正则就是错误的 只是在这里刚好能匹配出来

// 第2个正则是用于匹配标题 SoFlash的

// 第3个正则用于匹配日期

/* 这里只用了一条语句便把url,标题和日期全部给匹配出来了 */

Pattern p = Pattern

.compile("='(\\w.+)'>(\\w.+[a-zA-Z])-(\\d{1,2}\\.\\d{1,2}\\.\\d{4})")

String s = "<a href='http://www.cnblogs.com/longwu'>SoFlash-12.22.2011</a>"

Matcher m = p.matcher(s)

while (m.find()) {

// 通过调用group()方法里的索引 将url,标题和日期全部给打印出来

System.out.println("打印出url链接:" + m.group(1))

System.out.println("打印出标题:" + m.group(2))

System.out.println("打印出日期:" + m.group(3))

System.out.println()

}

System.out.println("group方法捕获的数据个数:" + m.groupCount() + "个")

}

}

下输出结果:

打印出url链接:http://www.cnblogs.com/longwu

打印出标题:SoFlash

打印出日期:12.22.2011

group方法捕获的数据个数:3个

1、h2数据库你写一个dao类(例如:insert方法),mysql也写一个mydao类(例如:insertmysql()),

当往h2数据库执行插入的时候 new dao().inser(sql)

new mydao().insertmysql(sql)

2、也可以直接到数据库 *** 作写存储过程和游标自动同步。

3、使用第三方插件。有很多这样子的平台做企业数据一体化的


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9821812.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存