LEX是UNIX的工具,因此我們需要使用FLEX代替,使得在windows下使用;
配對:
LEX和YACC
FLEX和BISON
JFLEX和JavaCUP
LEX是詞法分析器,主要作用類似於掃描器,輸入為原始碼(當然我們現在寫的樣本不一定是原始碼),輸出為詞法單元(泛化的東西,比如1,2,3都可以被稱為NUM);
當然中間匹配的過程很複雜,比如匹配Regex,並輸出;使用LEX就不需要考慮這些,我們只需要定義以下幾點:
(1)Regex,怎麼樣才算匹配,比如我們定義的語言中INTEGER才是整數,則輸入為INTEGER時匹配Regex;
(2)返回的詞法單元,當匹配時要返回什麼需要自己定義;
:http://download.csdn.net/detail/loseblue/283175#comment
二、使用LEX下載的檔案如:我們寫一個統計文本單詞個數、空白個數、數字個數;步驟1:定義*.L檔案
一開始要定義一個*.L檔案,模板解釋如下:
%{//聲明一些變數或函數%}//定義Regex//比如://num ([0-9])+ //左邊為符號,右邊為Regex%%//定義一系列的動作,即如果匹配了上面定義的某個Regex之後的動作,此動作是C語言的語句//比如://{num} {printf("num");} //左邊為{模式},右邊為{C語句};%%void main() //執行主函數{yylex(); //開始解析語句,內建函數//定義C語言語句}int yywrap(){return 1;}
真實代碼如下:
%{int wordCount = 0;int whiteCount = 0;int numCount = 0;%}letter [a-zA-Z]letters {letter}+numbers ([0-9])+whitespaces ([\t\n ])+%%{letters} {wordCount++;} //當匹配letters的Regex時執行的動作,一般動作都是結合yacc並返回給文法分析器一個詞法單元和屬性值,此處把lex作為一個獨立的工具使用{numbers} {numCount++;}{whitespaces} {whiteCount++;}%%void main(){yylex(); //開始解析語句,內建函數printf("單詞數:%d\n",wordCount);printf("空白數:%d\n",whiteCount);printf("數字數:%d\n",numCount);}int yywrap(){return 1;}
步驟2:使用flex命令
輸入命令:flex 1.L
注意:此處的命令列為lexyacc.bat 開啟的命令列;
flex 1.L 產生 lex.yy.c,此時的C檔案可以被gcc編譯,並可以使用;
步驟3:使用gcc編譯C程式
Windows平台 的GCC主要是MinGW編譯器:http://www.mingw.org/
配置環境變數: path=mingw/bin;
輸入命令:gcc -o output.exe lex.yy.c
此時產生output.exe;
步驟4:在命令列中輸入output執行exe
此時簡單的lex 程式就完成了;
最後總共檔案如下: