工具 | Linux 下PDF批量全文搜索工具:Recoll

工具 | Linux 下PDF批量全文搜索工具:Recoll,第1张

Recoll 是一款桌面全文搜索工具。

Recoll根据 文件 内容 及文件名 查找 文档 。

在 Ubuntu-Linux 上安装Recoll非常简单,命令如下:

一.为什么要有文件查找

  因为资料有很多,会忘记放在了什么位置,所以需要通过查找的方式进行搜索。(相当于windows查找文件  计算机--->搜索框)

二.Linux中怎么查找文件查找

因为linux中没有图形工具,所以只能使用命令工具--find--来搜索

三.find命令使用语法

命令(find)  路径(/etc/)  选项(要搜索什么)  表达式(名称,大小,文件类型,时间,组和用户)  动作(删除,-exec  \)

四.如何通过名称,大小,文件类型,时间,组和用户来搜索文件。

1.按名称查找 (-iname 不区分大小写)

[root@localhost ~]# find ./ -name "zy*"

(搜索当前目录下以zy开头的所有内容)

[root@localhost ~]# find ./ -name "*zy"

(搜索当前目录下以zy开头的所有内容)

[root@localhost ~]# find ./ -iname "zy*"

(搜索当前目录下不区分大小写zy开头的内容)

2.按文件大小查找(以/etc/目录为例)

[root@localhost ~]# find /etc/ -size +5M

(搜索/etc/目录中大于5MB的内容)

[root@localhost ~]# find /etc/ -size -5M

(搜索/etc/目录中小于5MB的内容)

[root@localhost ~]# find /etc/ -size 5M

(搜索/etc/目录中等于5MB的内容)

PS:M单位也可以是k,G。

3.按文件类型查找 (-type)

文件类型:

f    普通文件

d    目录

s    socket套接字文件

l    链接文件

c    字符设备

b    块设备

[root@localhost ~]# find ./ -type f -iname "zy*"

(搜索当前目录中所有以“zy”开头的文件并且不区分大小写)

[root@localhost ~]# find /etc/ -type f -size +5M -name "*.bin"

(搜索/etc/目录中以.bin结尾的并且文件大于5M的文件)

[root@localhost ~]# find /etc/ -type f -name "*.repo"

(搜索/etc/目录中名称以.repo结尾的文件)

[root@localhost ~]# find /dev/ -type b -name "sda*"

(搜索/dev/目录中名称以sda开头的块设备文件)

[root@localhost ~]# find /dev/ -type c -name "tty*"

(搜索/dev/目录中以tty开头的字符设备文件)

4.按时间查找(-mtime)

[root@localhost ~]# find ./ -type f -mtime 7

(查找出当前目录下第7天的文件)*例:今天是10号,我要查找第七天的内容,就是10号之前的7天就是3号。*

[root@localhost ~]# find ./ -type f -mtime +7

(查找出当前目录下7天之前的文件内容)

[root@localhost ~]# find ./ -type f -mtime -7

(查找出当前目录下最近七天的文件内容)

实际使用方案

find /backup/ -iname  “*.bak”  -mtime  +7  -delete

(保留最近七天的文件其他全部删除)

find /backup/ -iname  “*.bak”  -mtime  +90  -delete

(保留最近三个月的文件其他全部删除)

find /backup/ -iname  “*.bak”  -mtime  +180  -delete

(保留半年的文件其他全部删除)

5.按用户和组查找(-user  -group -nouser -nogroup)

[root@localhost ~]# find /home/ -user zhangyao

(查找属主是zhangyao的内容)

[root@localhost ~]# find /home/ -group zhangyao

(查找属组是zhangyao的内容)

[root@localhost ~]# find /home/ -type d -user root -group zhangyao

(查找属主是root,属组是zhangyao的目录)

[root@localhost ~]# find /home/ -nouser

(查找/home/目录下没有属主的内容)

[root@localhost ~]# find /home/ -nogroup

(查找/home/目录下没有属组的内容)

[root@localhost ~]# find /home/ -nouser  -nogroup

(查找/home/目录下没有属主或没有属组的内容)

四.查找到内容后的处理动作

find的默认动作是-print(打印)

-print      打印查找到的内容

-ls          以长格式显示的方式打印查找到的内容

-delete  删除查找到的文件 (删除目录,仅能删除空目录)

-ok        后面跟自定义命令(会提示是否 *** 作)

-exec    后面跟自定义命令(标准写法  -exec  \)

例:

[root@localhost ~]# find ./ -type d -name "find_*" -exec rm -rf {} \

(查找当前目录下以find_开头的目录然后删除)删除少量文件时用这个

[root@localhost ~]# find ./ -type d -name "find_*"  | xargs rm -f

(查找当前目录下以find_开头的目录然后删除)删除大量文件时候用这个

[root@localhost ~]# find /var/log/ -type f -name "*.log" -mtime +7 -exec rm -f {} \'

[root@localhost ~]# find /var/log/ -type f -name "*log" -mtime +7 | xargs rm -f

(两种方法都是删除七天之前日志文件)

五.查找只记得内容的文件

需要将find和grep组合起来用

例:

find  /etc/  -type  f  | xargs  grep “log_group” --color==auto(加颜色,可加可不加)

六.find逻辑运算符

例:

查找当前目录下属主不是root的所有文件,然后以长格式列出

find ./  -type  f  ! -user  root  -ls

查找当前目录下属主是zhangyao并且文件大小小于1k的所有文件

find ./ -type f -a -user  zhangyao -a -size 1k

查找当前目录下属主为root或者以xml结尾的文件

find ./ -type f -a -user root  -o -name "zy*"

转义

find ./ -type f -a  \(“空格” -user root  -o -name "zy*" “空格” \)

                                          等于

find ./ -type f -a  -user root + find ./ -type f -a  -name "zy*"

1. more指令 —— 分页显示文件内容

more指令会以一页一页的形式显示文件内容,按空白键(space)显示下一页内容,按Enter键会显示下一行内容,按 b 键就会往回(back)一页显示,其基本用法如下:

more    file1             查看文件file1的文件内容;

more   -num   file2    查看文件file2的内容,一次显示num行;

more   +num   file3   查看文件file3的内容,从第num行开始显示;

2. less指令 —— 可以向前或向后查看文件内容

less指令查看文件内容时可以向前或向后随意查看内容;

less指令的基本用法为:

less   file1    查看文件file1的内容;

less   -m    file2     查看文件file2的内容,并在屏幕底部显示已显示内容的百分比;

按空格键显示下一屏的内容,按回车键显示下一行的内容; 

按  U  向前滚动半页,按  Y   向前滚动一行;

按[PageDown]向下翻动一页,按[PageUp]向上翻动一页;

按   Q   退出less命令;

3. head指令 —— 查看文件开头的内容

head指令用于显示文件开头的内容,默认情况下,只显示文件的头10行内容;

head指令的基本用法:

head  -n  <行数>   filename      显示文件内容的前n行;

例如:head   -n   5   file1     显示文件file1的前5行内容

head   -c  <字节>    filename      显示文件内容的前n个字节;

例如:head  -c  20  file2      显示文件file2的前20个字节内容

4. tail指令 —— 显示文件尾部的内容

 tail指令用于显示文件尾部的内容,默认情况下只显示指定文件的末尾10行;

tail指令的基本用法:

tail    file1      显示文件file1的尾部10行内容;

tail  -n  <行数>  filename    显示文件尾部的n行内容;

例如:tail  -n  5   file1    显示文件file1的末尾5行内容

tail  -c  <字节数>   filename     显示文件尾部的n个字节内容;

例如:tail  -c  20   file2    显示文件file2的末尾20个字节

5. cat指令 —— 显示文件内容

使用cat命令时,如果文件内容过多,则只会显示最后一屏的内容;

cat指令的基本用法:

cat   file1        用于查看文件名为file1的文件内容;

cat   -n   file2       查看文件名为file2的文件内容,并从1开始对所有输出的行数(包括空行)进行编号;

cat   -b   file3      查看文件名为file3的文件内容,并从1开始对所有的非空行进行编号;


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7394860.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-05
下一篇 2023-04-05

发表评论

登录后才能评论

评论列表(0条)

保存