* 匹配任何字符串,包括空
[!0-9] 匹配非0-9的字符
*[!0-9]* 匹配:任意两个字符串中夹了一个非数字的字符 的这么一个字符串
应该和python没关系,是要处理的文件的问题。有点麻烦要看是哪里出的问题,脚本有问题的可能性不大。如果确定只是换行符有问题,在linux下用dos2unix命令可以把要处理的文件从windows格式转成linux的换行格式。不过也就只能做这一件事而已,不确定其他地方有没有问题。不过如果你的脚本在windows能正常工作,那么linux也应该OK,脚本本身应该是没问题的。
yacc/lex在linux下的使用指南链接:http://blog.csdn.net/ruglcc/article/details/7817619
Lex 和 Yacc 是 Unix 和Linux 下词法和语法的分析,解析工具,有了这两个工具,你可以自己制作想要的编译器,也可以重新制作已有程序语言的解析器。需要注意的是linux下的这两个工具生成的程序源码只能是C和C++语言,当然现在早已有类似可以生成Java源码的语法分析器,如较常用的JavaCC(Java Compiler Compiler),相关内容可以去网上搜索。Lex和Yacc已被移植到windows下,现在常用的工具有Parser Generator。本文只介绍Linux 下Lex和Yacc的使用方法。
Lex介绍
Lex 通过对.lex或.l文件定义的格式生成一个C语言源码文件,通过编译这个源码,就生成了.lex文件或.l文件定义的编译器。.lex或.l文件的格式分三段:
1.全局变量声明部分
2.词法规则部分
3.函数定义部分
以下是一个简单的例子:lex_example.l文件
%{//全局声明部分
/*林木100 linux
www.linmu100.com
*/
#include <stdio.h>
extern char *yytext
extern FILE *yyin
int sem_count = 0
%}
//规则定义部分,
%%
[a-zA-Z][a-zA-Z0-9]*{printf("WORD[%s] ", yytext)}
[a-zA-Z0-9\/.-]+printf("FILENAME ")
\" printf("QUOTE ")
\{ printf("OBRACE ")
\} printf("EBRACE ")
{sem_count++printf("SEMICOLON ")}
\n printf("\n")
[ \t]+ /* ignore whitespace */
%%
//以下为函数定义部分
int main(int avgs, char *avgr[])
{
yyin = fopen(avgr[1], "r")
if (!yyin)
{
return 0
}
yylex()
printf("sem_count : %d\n", sem_count)
fclose(yyin)
return 1
}
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)