你说的php,批处理、vbs、css选择符、jquery、xPath。。什么的都不会
我就是会java的,说个思路吧
将输入的网址存放在一个txt中
一行一行读文件
读一条数据,可以访问这个url,并解析出网页的源代码
将得到的源代码存在字符串中,通过正则表达式来提取
比如你说的这种<class name="inf" ><table><td></td></table></class>
正则表达式就是<table><td></td></table>(具体的肯定是不一样的写法)
然后就可以匹配到想要的字符串,将这个输出到输出文件中就可以了
要是java的方法我能实现,别的就不会了
易语言如何取网页源码:
1、首先,运行“易语言”主程序,d出“新建工程对话框”选择“Windows窗口程序”然后点击“确定”按钮,进入“Windows窗口程序设计界面”。如下图:
2、接下来,拖放标签组件一个、编辑框组件两个、按钮组件一个及分组框组件一个。将他们放置到合适的位置并将窗口的宽高设置到适当的大小。以确保窗口的简洁美观。如下图:
3、待界面调整完毕之后,将窗口标题、标签标题、分组框标题及按钮标题修改成相应内容,并且将编辑框、按钮组件规范命名。为编写程序代码做准备。
4、接下来就是编写代码了,在“_按钮_获取源码_被单击”事件子程序下,编写如下代码 编辑框_网页源码内容 = 到文本 (>
5、待代码编写无误后,进入调试阶段。按下“F5”快捷键运行程序,网址以百度经验的网址为例,然后点击“获取源码”按钮,等待程序执行。如图:
6、从网页源码编辑框得到的反馈结果分析,如果源码中出现乱码通常是编码方式的问题。这个时候,需要进行转码,就能看到正常的代码了。那么,代码也需要做小的改动。如图:
7、重新测试程序,从网页源码编辑框的反馈结果可以看出,这次读取的网页源码是正确的。
以上就是关于怎么批量提取网页内的字符串全部的内容,包括:怎么批量提取网页内的字符串、易语言怎么获取网页源代码、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)