我们在项目开发中,经常会使用sftp链接方式对远程文件进行下载。一般是先判断远程服务器上是否有该文件,若有,则下载;若没有,则不做处理。
在一次项目开发中使用com.jcraft.jsch.ChannelSftp.ls(String path)方法判断文件是否存在,一开始项目正常运行,但是运行一段时间后ls()性能特别缓慢, 由此引发了对ls方法的研究。
问题定位经过问题排查后,发现ls()方法调用一次花费了40秒,之前每次都是零点几秒的。再次深入排查,发现随着时间增加,该目录下的文件会越来越多,但是文件也才一千多个,总占用空间400M,这点容量不应该这么慢才对。继续排查发现远程服务器是window系统,多次测试后发现ls方法在window系统下随着文件增多性能特别慢。
问题代码这是之前性能缓慢的代码,若ls(String path)下面有文件,会返回内容,若没有该文件,会抛出异常,所以需要用try…catch捕获异常。
public boolean sftpFilesExist(String directory, String fileName,ChannelSftp sftp){ boolean result = true; try { sftp.cd(directory); sftp.ls(fileName); //底层还是先ls目录下的文件,然后一个个去找的,效率受文件数量和文件大小影响 linux影响不太明显,window下差别会挺大,所以不要用ls方法 } catch (Exception e) { logger.info("sftp {}目录下不存在该文件{}",directory,fileName+e.getMessage()); logout();//关闭sftp链接方法 result = false; } return result; }
ChannelSftp.ls(String path)方法说明:
- ls(String path) 底层会先ls出该目录下的所有文件,然后一个一个去找,效率受文件数量和文件大小影响,linux影响不太明显,window下差别会挺大
- ChannelSftp.ls(String path):
循环匹配目录下的所有文件,直到找到目标文件后返回文件信息。 - ChannelSftp.stat(String path):
直接定位到文件所在位置。若文件存在,返回文件信息。例-rwxrwxrwx 0 0 182000000 Wed Sep 23 14:44:49 CST 2020。
说明:
Ls与stat底层查找文件的方法相同,都是调用SftpATTRS getATTR(Buffer buf)方法返回文件信息。不同的是由于ls()方法是循环扫描目录下的所有文件,直到找到文件为止,
所以ls()比stat()花费时间更长,ls()受文件总数的影响。另文件的大小会占用空间大小,导致ls()运行缓慢,所以ls()也受文件大小影响。
Ls()与stat()在window系统与linux系统下效率的对比:(下列数据均为平均值)
数据对比结论:
-
ls方法在windows系统下效率低下,并且受文件大小和文件数量的影响。
-
Ls方法在linux下效率较高,虽然也受文件大小和文件数量的影响,但是耗时相对较少。
-
Stat方法在windows与linux上效率比较稳定,且耗时少。
下面为修改后代码,无论window下还是linux下,stat()方法的效率都会比ls()方法效率高。
public boolean sftpFilesExist(String directory, String fileName,ChannelSftp sftp){ boolean result = true; try { sftp.cd(directory); // sftp.ls(fileName); 底层还是先ls目录下的文件,然后一个个去找的,效率受文件数量和文件大小影响 linux影响不太明显,window下差别会挺大 sftp.stat(fileName); //返回文件信息 -rwxrwxrwx 0 0 182000000 Wed Sep 23 14:44:49 CST 2020 } catch (Exception e) { logger.info("sftp {}目录下不存在该文件{}",directory,fileName+e.getMessage()); logout();//关闭sftp链接方法 retult = false; } return result; }
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)