在 Linux、OSX、 *BSD 或者类 Unix 系统下你可以使用 while..do..done 的 bash 循环来逐行读取一个文件。下面跟着我一起来了解一下在 Linux 或类 UNIX 系统下如何使用 KSH 或 BASH shell 逐行读取一个文件吧。
Bash逐行读取一个文件 方法
对于 bash、ksh、 zsh 和其他的 shells 语法如下
while read -r linedo COMMANDdone <input.file
通过 -r 选项传递给 read 命令以防止阻止解释其中的反斜杠转义符。
在 read 命令之前添加 IFS= 选项,来防止首尾的空白字符被去掉。
while IFS= read -r linedo COMMAND_on $linedone <input.file
这是更适合人类阅读的语法:
#!/bin/bashinput="/path/to/txt/file"while IFS= read -r vardo echo "$var"done <"$input"
示例
下面是一些例子:
#!/bin/kshfile="/home/vivek/data.txt"while IFS= read linedo # display $line or do somthing with $line echo "$line"done <"$file"
在 bash shell 中相同的例子:
#!/bin/bashfile="/home/vivek/data.txt"while IFS= read -r linedo # display $line or do somthing with $line printf '%s\n' "$line"done <"$file"
你还可以看看这个更好的:
#!/bin/bashfile="/etc/passwd"while IFS=: read -r f1 f2 f3 f4 f5 f6 f7do # display fields using f1, f2,..,f7 printf 'Username: %s, Shell: %s, Home Dir: %s\n' "$f1" "$f7" "$f6"done <"$file"
示例输出:
图01:Bash 脚本:读取文件并逐行输出文件Bash 脚本:逐行读取文本文件并创建为 pdf 文件
我的输入文件如下(faq.txt):
我的 bash 脚本:
技巧:从 bash 变量中读取
让我们看看如何在 Debian 或者 Ubuntu Linux 下列出所有安装过的 php 包,请输入:
示例输出:
你现在可以从 $list 中看到它们,并安装这些包:
示例输出:
Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的方法,而且是效率最高,使用最多的方法。
为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率。
方法1:while循环中执行效率最高,最常用的方法。
代码如下:
function while_read_LINE_bottm(){
While read LINE
do
echo $LINE
done <$FILENAME
}
注释:我习惯把这种方式叫做read釜底抽薪,因为这种方式在结束的时候需要执行文件,就好像是执行完的时候再把文件读进去一样。
方法2 : 重定向法;管道法: cat $FILENAME | while read LINE
代码如下:
Function While_read_LINE(){
cat $FILENAME | while read LINE
do
echo $LINE
done
}
注释:我只所有把这种方式叫做管道法,相比大家应该可以看出来了吧。当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。
方法3: 文件描述符法
代码如下:
Function while_read_line_fd(){
Exec 3<&0
Exec 0<$FILENAME
While read LINE
Do
Echo $LINE
Exec 0<&<3
}
注释: 这种方法分2步骤,第一,通过将所有内容重定向到文件描述符3来关闭文件描述符0.为此我们用了语法Exec 3<&0 。第二部将输入文件放送到文件描述符0,即标准输入。
方法4for 循环。
代码如下:
function for_in_file(){
For i in `cat $FILENAME`
do
echo $i
done
}
注释:这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了,这里不多说。对各个方法进行测试,看那方法的执行效率最高。
首先我们用脚本(脚本见附件)生成一个70000行的文件,文件位置在/scripts/bigfile。然后通过下面的脚本来测试各个方法的执行效率,脚本很简单,不再解释。
代码如下:
#!/bin/bash
FILENAME="$1"
TIMEFILE="/tmp/loopfile.out" >$TIMEFILE
SCRIPT=$(basename $0)
function usage(){
echo -e "\nUSAGE: $SCRIPT file \n"
exit 1
}
function while_read_bottm(){
while read LINE
do
echo $LINE
done <$FILENAME
}
function while_read_line(){
cat $FILENAME | while read LINE
do
echo $LINE
done
}
function while_read_line_fd(){
exec 3<&0
exec 0<$FILENAME
while read LINE
do
echo $LINE
done
exec 0<&3
}
function for_in_file(){
for i in `cat $FILENAME`
do
echo $i
done
}
if [ $# -lt 1 ] then
usage
fi
echo -e " \n starting file processing of each method\n"
echo -e "method 1:"
echo -e "function while_read_bottm"
time while_read_bottm >>$TIMEFILE
echo -e "\n"
echo -e "method 2:"
echo -e "function while_read_line "
time while_read_line >>$TIMEFILE
echo -e "\n"
echo -e "method 3:"
echo "function while_read_line_fd"
time while_read_line_fd >>$TIMEFILE
echo -e "\n"
echo -e "method 4:"
echo -e "function for_in_file"
time for_in_file >>$TIMEFILE
执行脚本后: [root@localhost shell]# ./while /scripts/bigfile
脚本输出内容:
代码如下:
method 1:
function while_read_bottm
real0m5.689s
user0m3.399s
sys0m1.588s
method 2:
function while_read_line
real0m11.612s
user0m4.031s
sys0m4.956s
method 3:
function while_read_line_fd
real0m5.853s
user0m3.536s
sys0m1.469s
method 4:
function for_in_file
real0m5.153s
user0m3.335s
sys0m1.593s
下面我们对各个方法按照速度进行排序。
代码如下:
real0m5.153smethod 4 (for 循环法)
real0m5.689smethod 1 (while 釜底抽薪法)
real0m5.853smethod 3(标识符法)
real0m11.612s method 2(管道法)
由此可见在各个方法中,for语句效率最高,而在while循环中读写文件时,
代码如下:
while read LINE
do
echo $LINE
done <$FILENAME
方式执行效率最高。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)