如何获取目录URL的文件目录列表?

如何获取目录URL的文件目录列表?,第1张

如何获取目录URL的文件/目录列表

有一些条件:

  1. 服务器必须已启用目录列表,以便您查看其内容。
  2. 我没有办法(没有API或HTTP动词)来检索列表,因此该列表通常显示为普通HTML页面
  3. 您将必须解析此HTML页面才能找到条目。

使用JSoup这样的库可以轻松完成解析。

例如,使用JSoup,您可以

http://howto.unixdev.net/
像这样在url处获取文档:

import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.document;import org.jsoup.nodes.Element;public class Sample {    public static void main(String[] args) throws IOException {        document doc = Jsoup.connect("http://howto.unixdev.net").get();        for (Element file : doc.select("td.right td a")) { System.out.println(file.attr("href"));        }    }}

将输出:

beignets.htmlbeignets.pdfbsd-pam-ldap.htmlddns-updates.htmlDebian_on_HP_dv6z.htmldextop-slackware.htmldirlist.htmldownloads/ldif/Linux-SharePoint.htmlrhfc3-apt.htmlrhfc3-apt.tar.bz2SUNWdsee-Debian.htmlSUNWdtdte-b69.htmlSUNWdtdte-b69.tar.bz2tcshrc.htmlTest_LVM_Trim_Ext4.htmlTru64-CS20-HOWTO.html

至于您的示例网址,

http://java.sun.com/j2se/1.5/pdf
这是找不到页面,所以我认为您很不走运。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5020661.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-15
下一篇 2022-11-15

发表评论

登录后才能评论

评论列表(0条)

保存