有一些条件:
- 服务器必须已启用目录列表,以便您查看其内容。
- 我没有办法(没有API或HTTP动词)来检索列表,因此该列表通常显示为普通HTML页面
- 您将必须解析此HTML页面才能找到条目。
使用JSoup这样的库可以轻松完成解析。
例如,使用JSoup,您可以
http://howto.unixdev.net/像这样在url处获取文档:
import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.document;import org.jsoup.nodes.Element;public class Sample { public static void main(String[] args) throws IOException { document doc = Jsoup.connect("http://howto.unixdev.net").get(); for (Element file : doc.select("td.right td a")) { System.out.println(file.attr("href")); } }}
将输出:
beignets.htmlbeignets.pdfbsd-pam-ldap.htmlddns-updates.htmlDebian_on_HP_dv6z.htmldextop-slackware.htmldirlist.htmldownloads/ldif/Linux-SharePoint.htmlrhfc3-apt.htmlrhfc3-apt.tar.bz2SUNWdsee-Debian.htmlSUNWdtdte-b69.htmlSUNWdtdte-b69.tar.bz2tcshrc.htmlTest_LVM_Trim_Ext4.htmlTru64-CS20-HOWTO.html
至于您的示例网址,
http://java.sun.com/j2se/1.5/pdf这是找不到页面,所以我认为您很不走运。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)