怎么把网页中数据提取到数据库中a!~

怎么把网页中数据提取到数据库中a!~,第1张

下面是截取字符串的字符,你要读取网页中的数据可以读取网页HTML源码,然后按照下面的方法读取需要的内容

假设我们有个字符串(我乱打几个字符):fafdhfjhsjkhfeuhuihf ahhasj ahhdfha 5464 64 afjke12.36wjkjeopq附件二即可 恐龙世界了

而我们只要读取这个字符中的12.36这个数值,就可以这么做 :

string content="fafdhfjhsjkhfeuhuihf ahhasj ahhdfha 5464 64 afjke12.36wjkjeopq附件二即可 恐龙世界了"

int start//开始位置

int end//结束位置

string temp="ahhdfha 5464 64 afjke"//这是你需要取的数值前一段字符串,取多长随便,但必须是唯一

start = content.IndexOf(temp)

string yaoquzhi=content.Substring(start+temp.Length)

end = yaoquzhi.IndexOf("36wjkjeopq附件二即可 恐")

if(start>-1)

{

yaoquzhi=yaoquzhi.Substring(0,end)

}

用PHP自带函数就可以实现,首先要过去对方的网页信息,用

file_get_contents()参数是对方的URL地址,这个函数返回是一个字符串你想要的东西就在这个字符串中了

接下来就可以针对这个字符串做处理了,说下思路,正如你这个问题想获取到航班号起飞时间,在这个网页中应该有很多相同的标签元素,它们都有共同点,用

用正则表达式preg_match()或者是

preg_match_all()这两个函数它们都返回一个数组,这个数组存的就是你要的航班号和起飞时间,那么相同信息的数组就会出现了,然后在对这个数组进行分析找到你要的某个值或全部的值

获取信息要用到的3个函数是:

file_get_contents()

preg_match()

preg_match_all()

早期的网站模版都是在数据库中的

现在的网站 模版都定义到目录模式了

如果是采集的话 是可以连某些特定代码一起采集到数据库的

网页输出的时候 对读取的数据 进行接口 就可以连样式一起输出了


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9775375.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存