怎么批量提取网页内的字符串

怎么批量提取网页内的字符串,第1张

你说的php,批处理、vbs、css选择符、jquery、xPath。。什么的都不会

我就是会java的,说个思路吧

将输入的网址存放在一个txt中

一行一行读文件

读一条数据,可以访问这个url,并解析出网页的源代码

将得到的源代码存在字符串中,通过正则表达式来提取

比如你说的这种<class name="inf" ><table><td></td></table></class>

正则表达式就是<table><td></td></table>(具体的肯定是不一样的写法)

然后就可以匹配到想要的字符串,将这个输出到输出文件中就可以了

要是java的方法我能实现,别的就不会了

易语言如何取网页源码

1、首先,运行“易语言”主程序,d出“新建工程对话框”选择“Windows窗口程序”然后点击“确定”按钮,进入“Windows窗口程序设计界面”。如下图:

2、接下来,拖放标签组件一个、编辑框组件两个、按钮组件一个及分组框组件一个。将他们放置到合适的位置并将窗口的宽高设置到适当的大小。以确保窗口的简洁美观。如下图:

3、待界面调整完毕之后,将窗口标题、标签标题、分组框标题及按钮标题修改成相应内容,并且将编辑框、按钮组件规范命名。为编写程序代码做准备。

4、接下来就是编写代码了,在“_按钮_获取源码_被单击”事件子程序下,编写如下代码 编辑框_网页源码内容 = 到文本 (>

5、待代码编写无误后,进入调试阶段。按下“F5”快捷键运行程序,网址以百度经验的网址为例,然后点击“获取源码”按钮,等待程序执行。如图:

6、从网页源码编辑框得到的反馈结果分析,如果源码中出现乱码通常是编码方式的问题。这个时候,需要进行转码,就能看到正常的代码了。那么,代码也需要做小的改动。如图:

7、重新测试程序,从网页源码编辑框的反馈结果可以看出,这次读取的网页源码是正确的。

以上就是关于怎么批量提取网页内的字符串全部的内容,包括:怎么批量提取网页内的字符串、易语言怎么获取网页源代码、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9337280.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存