如何用正则表达式提取一个Html文件中的所有超链接

如何用正则表达式提取一个Html文件中的所有超链接,第1张

就是找到并提取像<a href=test.asp>is test link</a>的字符串...

使用asp

链接从字符串中提出来,并且将每一个超链接做为一个数组元素存储...

我尝试使用正则表达式,但是由于我对正则表达式了解不深,始终不能达到好的效果,最大的成功也就局限于提取了html文件中的部分链接

html源文件里超文本引用(hypertext reference)也叫超链接都是有特殊的标签的有不有。

举个例子:href="http://zhidao.baidu.com/question/158971081.html" 格式都是这样的有木有。

你可以在网页空白处右击选择 查看源文件 然后自己看看每个超链接都是上面的格式有木有。

如果要自己写java程序的话,建议

1.先读取一个html的源文件

2.然后用上面朋友的建议,用正规表达式来识别。

也可以自己找专门的html分析工具哦。

a和href属性\x0d\x0aHTML用来表示超链接,英文叫anchor。\x0d\x0a可以指向任何一个文件源:一个HTML网页,一个图片,一个影视文件等。用法如下:\x0d\x0a链接的显示文字 \x0d\x0a点击当中的内容,即可打开一个链接文件,href属性则表示这个链接文件的路径。\x0d\x0a比如链接到127.0.0.1/html站点首页,就可以这样表示:\x0d\x0a127.0.0.1/html首页 \x0d\x0a你问题的解决方法:\x0d\x0a点击新窗口打开\x0d\x0ahref="相对路径/绝对路径"建议这位朋友多学习基础HTML,网上搜索有很多相关资料教程的。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7212940.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-03
下一篇 2023-04-03

发表评论

登录后才能评论

评论列表(0条)

保存