如何 用Java语言获得网页数据

如何 用Java语言获得网页数据,第1张

你这个是不是A系统想了解B系统的页面信息?

如果是这样存在一个问题比较难解决,就是数据源问题,你A系统并不知道B系统的数据。

如果要获取招聘信息的公司名称,有几个思路

1、A系统做一个iframe,这个iframe里面嵌入你要访问的URL,然后你通过JS,获取这个iframe标签里面的所有内容,这样数据源就解决了

2、你可以做一个浏览器插件,这个插件的功能就是获取当前访问页面的所有字符数据,获取到数据后将数据发送到A系统

3、对网页进行截图,然后通过OCR软件获取中的文字,并将文字保存成文本,A系统读取这个文本信息,数据源问题也可以解决

以上上个只是我临时想到的,可能还可以运用JAVA的全文检索框架试试看,因为没有用过这个框架所以不知道是否能够实现

获取到数据源后,接下来就是业务处理了,业务处理就看具体业务进行处理就行了,技术方面就是一个文字处理的功能,技术好实现,业务比较复杂

工具/原料

Excel(以2003版为例)

方法/步骤

比如我们把搜狐中超积分榜作为Excel网页外部数据(如下图)。

打开Excel,定位要获取数据的单元格位置(如A1),然后依次点击“数据”-“导入外部数据”-“新建Web查询”。

在打开的对话框中,将网址粘贴到地址栏中,然后点击“转到”,再点击要选择表格旁边的箭头。

点击后变成了对号(表示选中该表格),然后单击“导入”。

打开下图所示对话框,点击“确定”。

获取好的数据如下图所示。

如果网络中的数据更新了,可以右击选择“刷新数据”即可获得最新的数据。

第一种:把$user的值赋值给全局数组。

第二种:header("Location: indexhtml"); 在这个代码传参数到indexhtml页面,index页面改成indexphp

这个连接介绍的方法在实践中并不经常使用,因为很原始。它适合 *** 作本地文件。 1如若你是获取xml,那应该使用 simplexml_load_file('url')这个函数,他返回一个xml的DOM模型对象,这个模块是专门针对xml应用设计的。具体可以查找php的simpleXML相关应用。 2如果你是获取html。那么,php中几乎所有的目录函数都支持远程 *** 作,即文件参数可以是网址。最适合的函数是file_get_contents('url'),他返回文件内容。 但是大部分免费空间禁止远程调用,如果是这样,fopen()或者其他函数都是不行的。那就只能在网页中用javascript获取然后处理或者送回网站处理,此方面内容属于ajax技术,你可以搜索一下。 3你如果要用到比较复杂一点的功能,比如要打开的页面 需要登陆,或者需要模拟cookie,就要用php的cURL库扩展,你可以找一下相关资料 我不能用一篇短文使你学会这几个模块的具体应用。

你是想做到JSP页面不加入<%%>这种小脚本吧,那可以采用EL表达式,或者一些框架的输出方式,通常用EL就可以了,因为EL就是用来运算和表达的。后台获取数据以后,这个数据可以是一个简单类型,也可以是一个对象,如果是同一个请求下的,也就是request对象没有变,那么可以用这个存储,否则要用session存储,存储数据的对象是JSP内置的对象,有page,request,session,application等,每个对象都能存储数据,但是作用于不同,page针对当前页面,request针对一个请求,session针对一个会话,application针对整个应用程序。 通常session就可以了。 比如后台获取一个String的name值,那么你可以sessionsetAttribute("name",name); 那么JSP直接可以EL这样写:${sessionScopename} 获取这个值,这里的name是后台封装的键的名,不是后面变量name的名。

以上就是关于如何 用Java语言获得网页数据全部的内容,包括:如何 用Java语言获得网页数据、如何读取网页内表格数据如何读取网页内表格数据、html页面获取php页面的数据等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9308776.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存