bison进行语法分析学习记录
Bison采用LALR(1)文法:
參考:https://blog.csdn.net/sirouni2003/article/details/400672
在Bison中,終結(jié)符也被稱(chēng)為符號(hào)類(lèi)型(token type).
符號(hào)類(lèi)型也可以由類(lèi)似C語(yǔ)言標(biāo)識(shí)符來(lái)表示.
根據(jù)慣例,這些標(biāo)識(shí)符因改用大寫(xiě)子母表示以區(qū)分它和非終結(jié)符. 例如,INTEGER,INDENTIFIER,IF或者RETURN.
一個(gè)表示某語(yǔ)言的特定關(guān)鍵字的終結(jié)符應(yīng)該由緊隨該關(guān)鍵字之后的它的大寫(xiě)表示來(lái)命名. 終結(jié)符error保留用作錯(cuò)誤恢復(fù)之用.
語(yǔ)義值
包括了記號(hào)的所有剩余信息.例如整數(shù)的數(shù)值,標(biāo)識(shí)符的名稱(chēng). (一個(gè)如’,'的記號(hào)只是一個(gè)標(biāo)點(diǎn),并不需要語(yǔ)義值.)
例如,一個(gè)分類(lèi)為INTEGER的記號(hào)包含語(yǔ)義值4. 另一個(gè)也被分類(lèi)為INTEGER的記號(hào)的語(yǔ)義值卻是3989.
當(dāng)一個(gè)語(yǔ)法規(guī)則表明INTEGER是允許的,任意的這些記號(hào)都是可接受的,因?yàn)樗鼈兌际荌NTEGER.
當(dāng)一個(gè)分析器接受了記號(hào),它會(huì)跟蹤這個(gè)記號(hào)的語(yǔ)義值.
被存儲(chǔ)在全局變量yylval中
為了更加實(shí)用,一個(gè)程序不僅僅要分析輸入而且必須做的更多. 它應(yīng)該可以在輸入的基礎(chǔ)上產(chǎn)生一些輸出. 在Bison語(yǔ)法中,一個(gè)語(yǔ)法規(guī)則可以有一個(gè)包括多個(gè)C語(yǔ)句的動(dòng)作(action). 分析器每次識(shí)別一個(gè)規(guī)則的匹配,相應(yīng)的動(dòng)作就會(huì)被執(zhí)行. 獲取這方面的更多信息,參閱 動(dòng)作-Actions.
LALR(1)
在一些文法中,Bison標(biāo)準(zhǔn)的LALR(1)分析算法, 不能針對(duì)給定的輸入應(yīng)用一個(gè)確定的語(yǔ)法規(guī)則.
這就是說(shuō),Bison可能不能決定(在當(dāng)前輸入的基礎(chǔ)上)應(yīng)該使用兩個(gè)可能的歸約中的那一個(gè),
或者不能決定到底應(yīng)該應(yīng)用一個(gè)歸約還是先讀取一些輸入稍后再進(jìn)行歸約.
以上兩種沖突分別被稱(chēng)為歸約/歸約(reduce/reduce)沖突(參閱歸約/歸約-Reduce/Reduce一章)和
**移進(jìn)/歸約(shift/reduce)沖突(參閱移進(jìn)/歸約-Shift/Reduce一章).
GLR:
有些時(shí)候, 為了使用一個(gè)很難被修改成LALR(1)文法的文法做為Bison的輸入,
Bison需要使用通用的分析算法. 如果你在你的文件中加入了這樣的聲明%glr-parser(參閱語(yǔ)法大綱-Grammar Outline一章),
Bison會(huì)產(chǎn)通用的LR(GLR)分析器. 這些分析器(例如,在應(yīng)用了先前所述的聲明之后)
在處理那些不包含未解決的沖突的文法時(shí), 采用與LALR(1)分析器一樣的處理方式.
但是當(dāng)面臨未解決的移進(jìn)/歸約沖突和歸約/歸約沖突的時(shí)候, GLR分析器權(quán)宜地同時(shí)處理這兩個(gè)可能,
即有效地克隆分析器自己以便于追蹤這這兩種可能性. 每一個(gè)克隆出來(lái)的分析器還可以再次被克隆,
這就保證在任意給定的時(shí)間,可以處理任意個(gè)可能的分析. 分析器逐步地進(jìn)行分析,即所有的分析器它們進(jìn)入到下一個(gè)輸入之前,
都會(huì)消耗(歸約)給定的輸入符號(hào). 每一個(gè)被克隆的分析器最終只有兩個(gè)可能的歸宿: 或者這個(gè)分析器因進(jìn)入了一個(gè)分析錯(cuò)誤而最終被銷(xiāo)毀,
會(huì)這它和其它的分析器合并,因?yàn)樗鼈儼演斎霘w約到了一個(gè)相同的符號(hào)集.
在有多個(gè)分析器并存的時(shí)刻,Bison只記錄它們的語(yǔ)義動(dòng)作而不是執(zhí)行它們.
當(dāng)一個(gè)分析器消失的時(shí)候,相應(yīng)的語(yǔ)義動(dòng)作記錄也消失并且永遠(yuǎn)不會(huì)被執(zhí)行.
當(dāng)一個(gè)規(guī)約使得兩個(gè)分析器等價(jià)而合并的時(shí)候, Bison會(huì)記錄下它們兩個(gè)的語(yǔ)義動(dòng)作集.
每當(dāng)最后兩個(gè)分析器合并成為一個(gè)單獨(dú)的分析器的時(shí)候, Bison執(zhí)行所有未完成的動(dòng)作.
這些動(dòng)作既可能依靠語(yǔ)法規(guī)則的優(yōu)先級(jí)被執(zhí)行也可能均被Bison執(zhí)行.
在執(zhí)行完動(dòng)作之后,Bison調(diào)用指定的用戶定義求值函數(shù)來(lái)產(chǎn)生一個(gè)獨(dú)立的合并值.
當(dāng)使用平常的LALR(1)文法的時(shí)候,Bison會(huì)報(bào)告一個(gè)歸約/歸約沖突.
在沖突的時(shí)候,分析器在會(huì)眾多選擇中選取一個(gè)-隨意地選擇那個(gè)先聲明的. 所以下面的正確輸入不能被識(shí)別.
在Bison輸入文件中, 加入這兩個(gè)聲明(在第一個(gè)`%%'之前)分析器可以將分析器編成一個(gè)GLR分析器, 并且Bison不會(huì)報(bào)告一個(gè)歸約/歸約沖突.
%glr-parser %expect-rr 1并不需要對(duì)語(yǔ)法本身進(jìn)行修改. 分析器現(xiàn)通過(guò)上面的限制語(yǔ)法后,可以認(rèn)識(shí)所有有效的聲明. 用戶實(shí)際上并不能查覺(jué)分析器的拆分.
這就是我們使用GLR而幾乎沒(méi)有壞處的例子. 即使像這樣簡(jiǎn)單的例子,至少兩個(gè)潛在的問(wèn)題值得我們注意.
第一,我們總應(yīng)該分析Bison的沖突報(bào)告來(lái)確定GLR拆分總發(fā)生在我們想要的時(shí)候.
一個(gè)GLR分析器的拆分會(huì)不經(jīng)意地產(chǎn)生比LALR分析器在沖突中靜態(tài)的錯(cuò)誤選擇 更加不明顯的問(wèn)題.
第二,要仔細(xì)考慮與詞法分析器的互動(dòng)(參閱語(yǔ)義記號(hào)-Sematic Tokens一章).
由于在拆分期間的分析器消耗記號(hào)時(shí)并不產(chǎn)生任何動(dòng)作, 詞法分析器并不能通過(guò)分析動(dòng)作獲得信息.
一些與詞法分析器的互動(dòng)在使用GLR來(lái)消除從詞法分析器到語(yǔ)法分析器的復(fù)雜讀時(shí)可以忽略. 你必須監(jiān)察其余情況下時(shí)的正確性.
當(dāng)GLR處理兩條線都可以成功解釋的路線時(shí),要做的處理可能就不一樣了。
位置-Locations
許多應(yīng)用程序,如解釋器和編譯器,需要產(chǎn)生一些有用信息或者出錯(cuò)的信息.
為了達(dá)到這個(gè)目的,我們必須追蹤每個(gè)語(yǔ)法結(jié)構(gòu)的原文位置(textual location)或位置(location). Bison提供了追蹤這些位置的機(jī)制.
每一個(gè)記號(hào)有一個(gè)語(yǔ)義值.類(lèi)似地,每個(gè)記號(hào)也有一個(gè)位置, 對(duì)于所有記號(hào)和組來(lái)說(shuō),它們的位置的類(lèi)型是相同的.
此外,輸出的分析器也帶有默認(rèn)的存儲(chǔ)位置的數(shù)據(jù)結(jié)構(gòu) (獲取更多信息,參閱位置-Locations一章).
像語(yǔ)義值一樣,位置可以在動(dòng)作中使用特定的一套結(jié)構(gòu)來(lái)訪問(wèn). 在上面?zhèn)€的例子中,這個(gè)組的的位置是@$,而子表達(dá)式的位置是@1和@3.
當(dāng)一個(gè)規(guī)則被匹配,一個(gè)默認(rèn)的動(dòng)作用于計(jì)算左側(cè)的語(yǔ)義值(參閱動(dòng)作-Actions一章). 類(lèi)似地,另外一個(gè)默認(rèn)的動(dòng)作用于計(jì)算位置.
然而,這個(gè)默認(rèn)動(dòng)作對(duì)于對(duì)于大多數(shù)情況已經(jīng)足夠永, 即經(jīng)常沒(méi)有必要為每個(gè)規(guī)則描述@$應(yīng)該是如何形成的.
當(dāng)為一個(gè)給定的組建立一個(gè)新的位置的時(shí)候, 輸出的分析器的默認(rèn)行為是取第一個(gè)符號(hào)的開(kāi)頭和最后一個(gè)符號(hào)的末尾.
Bison的輸出:分析器文件
當(dāng)你運(yùn)行Bison的時(shí)候,你需要給Bison一個(gè)語(yǔ)法文件做為其輸入.
Bison的輸出是一個(gè)分析這個(gè)語(yǔ)法文件描述的語(yǔ)言的C源代碼文件.
這個(gè)文件叫做Bison分析器(Bison parse).
我們要記住Bison工具和Bison分析器是兩個(gè)明顯不同的程序:
Bison工具是一個(gè)以Bison分析器為輸出的程序. 這個(gè)Bison分析器應(yīng)是你程序的一部分.
Bison分析器的工作是依照語(yǔ)法規(guī)則組合記號(hào)–例如,
將標(biāo)識(shí)符和操作符構(gòu)建成表達(dá)式. 在組合的過(guò)程中它還要執(zhí)行相應(yīng)的語(yǔ)法規(guī)定的動(dòng)作.
記號(hào)是來(lái)源于稱(chēng)為詞法分析器(lexical analyzer)的程序.
你必須以某種形式提供詞法分析器(如用C編寫(xiě)).
Bison分析器每當(dāng)需要一個(gè)新的記號(hào)的時(shí)候就會(huì)調(diào)用詞法分析器.
Bison分析器并不之道記號(hào)"中"有什么東西(即使它們的語(yǔ)義值可能反映這個(gè)).
典型的詞法分析器靠分析字符來(lái)產(chǎn)生記號(hào),但是Bison并不依靠這個(gè).
獲取更多細(xì)節(jié),參閱 詞法分析函數(shù)yylex-The Lexical Analyzer Function yylex.
Bison分析器文件是定義了名為yyparse并且實(shí)現(xiàn)了那個(gè)語(yǔ)法的函數(shù)的C代碼.
這個(gè)函數(shù)并不能成為一個(gè)完成的C程序:你必須提供額外的一些函數(shù).
- 其中之一是詞法分析器.
- 另外的一個(gè)是一個(gè)分析器報(bào)告錯(cuò)誤時(shí)調(diào)用的錯(cuò)誤報(bào)告函數(shù).
-
另外,一個(gè)完整的C程序必須以名為main的函數(shù)開(kāi)頭; 你必須提供這個(gè)函數(shù).并且安排它調(diào)用yyparse.
否則分析器永遠(yuǎn)都不會(huì)運(yùn)行. 參閱 分析器C語(yǔ)言接口-Parser C-Language Interface.
除了你編寫(xiě)的動(dòng)作中的記號(hào)類(lèi)型名稱(chēng)和符號(hào)以外 ,所有Bison分析器文件自己定義的符號(hào)都以yy'或者YY’開(kāi)頭.
這些符號(hào)包括了接口函數(shù)例如詞法分析函數(shù)yylex,錯(cuò)誤報(bào)告函數(shù)yyerror 和分析器函數(shù)yyparse.
這些符號(hào)也包括了許多內(nèi)部目的的標(biāo)識(shí)符. 所以你要在Bison語(yǔ)法文件中避免使用除了本手冊(cè)定義的以外的以yy'或者YY’開(kāi)頭的C標(biāo)識(shí)符.
在一些情況下,Bison分析器文件包含系統(tǒng)頭文件. 在這中情況下,你的代碼注意被這些文件保留的標(biāo)識(shí)符. 在意些非GNU系統(tǒng),<alloca.h>,<stddef.h>以及<stdlib.h> 被包含在內(nèi)用于聲明內(nèi)存分配器及相關(guān)類(lèi)型. 如果你定義YYDEBUG為非零值,其它的系統(tǒng)頭文件也可能被包括進(jìn)內(nèi). (參閱跟蹤你的分析器-Tracing Your Parser一章)
使用Bison的流程-Stages in Using Bison
實(shí)際使用Bison設(shè)計(jì)語(yǔ)言的流程,從語(yǔ)法描述到編寫(xiě)一個(gè)編譯器或者解釋器,有5個(gè)步驟:
以Bison可識(shí)別的格式正式地描述語(yǔ)法.(參閱Bison語(yǔ)法文件一章) 對(duì)每一個(gè)語(yǔ)法規(guī)則,描述當(dāng)這個(gè)規(guī)則被識(shí)別時(shí)相應(yīng)的執(zhí)行動(dòng)作. 動(dòng)作由C語(yǔ)句序列描述.
編寫(xiě)一個(gè)詞法分析器處理輸入并將記號(hào)傳遞給語(yǔ)法分析器. 詞法分析器既可是手工編寫(xiě)的C代碼(參閱詞法分析函數(shù)yylex一章), 也可以由lex產(chǎn)生,但是lex的使用并未在這個(gè)手冊(cè)中討論.
編寫(xiě)一個(gè)調(diào)用Bison產(chǎn)生的分析器的控制函數(shù).
編寫(xiě)錯(cuò)誤報(bào)告函數(shù).
將這些源代碼轉(zhuǎn)換成可執(zhí)行程序,你需要按以下步驟進(jìn)行.
* 按語(yǔ)法運(yùn)行Bison產(chǎn)生分析器.* 同其它源代碼一樣編譯Bison輸出的代碼.* 鏈接目標(biāo)文件以產(chǎn)生最終的產(chǎn)品.Bison語(yǔ)法文件的整體布局
Bison工具的輸入文件是以個(gè)Bison語(yǔ)法文件(Bison grammar file). 通常的Bison語(yǔ)法文件格式如下:
%{ Prologue %}Bison declarations%% Grammar rules %% Epilogue `%%',`%{' 和`%}'是Bison在每個(gè)Bison語(yǔ)法文件中用于分隔部分的標(biāo)點(diǎn)符號(hào).prologue可用來(lái)定義在動(dòng)作中使用類(lèi)型和變量.
你可以使用預(yù)處理器命令在那里來(lái)定義宏, 或者使用#include包含干這些事情的頭文件.
你需要聲在那里與許多要在語(yǔ)法規(guī)則的動(dòng)總中使用的全局標(biāo)識(shí)符一起
聲明詞法分析器yylex和錯(cuò)誤打印程序yyerror.
Bison declarations聲明了終結(jié)符和非終結(jié)符以及操作符的優(yōu)先級(jí)和各種符號(hào)語(yǔ)義值的各種類(lèi)型.
Grammar rules定義了如何從每一個(gè)非終結(jié)符的部分構(gòu)建其整體的語(yǔ)法規(guī)則.
Epilogue可以包括任何你想使用的代碼. 在Prologue中聲明的函數(shù)經(jīng)常定義在這里.
在簡(jiǎn)單的程序里,剩余的所有程序可以放在這里.
demo1 簡(jiǎn)單double計(jì)算器
代碼:
/* Reverse polish notation calculator. */ /* 逆波蘭記號(hào)計(jì)算器 */%{#define YYSTYPE double#include <math.h>#include <ctype.h>#include <stdio.h>int yylex (void);void yyerror (char const *); %}%token NUM%% /* Grammar rules and actions follow. */input: /* empty */| input line ;line: '\n'| exp '\n' { printf ("\t%.10g\n", $1); } ;exp: NUM { $$ = $1; }| exp exp '+' { $$ = $1 + $2; }| exp exp '-' { $$ = $1 - $2; }| exp exp '*' { $$ = $1 * $2; }| exp exp '/' { $$ = $1 / $2; }/* Exponentiation */| exp exp '^' { $$ = pow ($1, $2); }/* Unary minus */| exp 'n' { $$ = -$1; } ; %%/* The lexical analyzer returns a double floating pointnumber on the stack and the token NUM, or the numeric codeof the character read if not a number. It skips all blanksand tabs, and returns 0 for end-of-input. */ /* 詞法分析起在棧上返回一個(gè)雙精度浮點(diǎn)數(shù)(注:指yylval)并且返回記號(hào)NUM,或者返回不是數(shù)字的字符的數(shù)字碼.它跳過(guò)所有的空白和制表符,并且返回0作為輸入的結(jié)束. */int yylex (void) {int c;/* Skip white space. *//* 處理空白. */while ((c = getchar ()) == ' ' || c == '\t');/* Process numbers. *//* 處理數(shù)字 */if (c == '.' || isdigit (c)){ungetc (c, stdin);scanf ("%lf", &yylval);return NUM;}/* Return end-of-input. *//* 返回輸入結(jié)束 */if (c == EOF)return 0;/* Return a single char. *//* 返回一個(gè)單一字符 */return c; }int main (void) {return yyparse (); }/* Called by yyparse on error. */ void yyerror (char const *s) {fprintf (stderr, "%s\n", s); }執(zhí)行:
bison recalc.y
gcc rpcalc.tab.c -lm
demo2
/* Infix notation calculator. */ /* 中綴符號(hào)計(jì)算器 */%{#define YYSTYPE double#include <math.h>#include <stdio.h>int yylex (void);void yyerror (char const *); %}/* Bison declarations. */ %token NUM %left '-' '+' %left '*' '/' %left NEG /* negation--unary minus */ /* 負(fù)號(hào) */ %right '^' /* exponentiation */ /* 冪運(yùn)算 */%% /* The grammar follows. */ /* 下面是語(yǔ)法 */ input: /* empty */| input line ;line: '\n'| exp '\n' { printf ("\t%.10g\n", $1); } ;exp: NUM { $$ = $1; }| exp '+' exp { $$ = $1 + $3; }| exp '-' exp { $$ = $1 - $3; }| exp '*' exp { $$ = $1 * $3; }| exp '/' exp { $$ = $1 / $3; }| '-' exp %prec NEG { $$ = -$2; }| exp '^' exp { $$ = pow ($1, $3); }| '(' exp ')' { $$ = $2; } ; %%int yylex (void) {int c;/* Skip white space. *//* 處理空白. */while ((c = getchar ()) == ' ' || c == '\t');/* Process numbers. *//* 處理數(shù)字 */if (c == '.' || isdigit (c)){ungetc (c, stdin);scanf ("%lf", &yylval);return NUM;}/* Return end-of-input. *//* 返回輸入結(jié)束 */if (c == EOF)return 0;/* Return a single char. *//* 返回一個(gè)單一字符 */return c; }int main (void) {return yyparse (); }/* Called by yyparse on error. */ void yyerror (char const *s) {fprintf (stderr, "%s\n", s); }執(zhí)行:
bison calc.y
gcc calc.tab.c -lm
重點(diǎn)注意:
這段代碼展示了兩個(gè)重要的新特征.
在第二部分中(Bison declarations), %left聲明了記號(hào)類(lèi)型并且指明它們是左結(jié)合操作符.
%left和%right(右結(jié)合)的聲明代替了%token.
%token是用來(lái)聲明沒(méi)有結(jié)合性的記號(hào)類(lèi)型的. (這些記號(hào)(注:是指'+'',‘-’‘,'*'',’/‘’,`‘NEG’') 是原本并不用聲明的單字符記號(hào).我們聲明它們的目的是指出它們的結(jié)合性.)
操作符優(yōu)先級(jí)是由聲明所在行的順序決定的, 行號(hào)越大的操作符(在一頁(yè)或者屏幕底端)具有越高的優(yōu)先級(jí). 因此,冪運(yùn)算具有最高優(yōu)先級(jí),負(fù)號(hào)(NEG)其次, 接這是*'和/'等等. 參閱 操作符優(yōu)先級(jí)-Operator Precedence.
另外一個(gè)重要的特征是在語(yǔ)法部分的負(fù)號(hào)操作符中使用了%prec. 語(yǔ)法中的%prec只是簡(jiǎn)單的告訴Bison規(guī)則`| ‘-’ exp’與NEG有相同的優(yōu)先級(jí)–在前述的優(yōu)先級(jí)規(guī)則中. 參閱 依賴上下文的優(yōu)先級(jí)-Context-Dependent Precedence.
這個(gè)是要重點(diǎn)注意的,因?yàn)?prec是單獨(dú)給某條規(guī)則進(jìn)行賦值的!而不是僅僅用普通的依賴聲明的符號(hào)優(yōu)先級(jí)來(lái)執(zhí)行
簡(jiǎn)單的錯(cuò)誤恢復(fù)
修改為:
line: '/n'| exp '/n' { printf ("/t%.10g/n", $1); }| error '/n' { yyerrok; } ;這個(gè)添加的規(guī)則允許在語(yǔ)法錯(cuò)誤發(fā)生的時(shí)候有簡(jiǎn)單的錯(cuò)誤恢復(fù)動(dòng)作. 如果一個(gè)讀入一個(gè)無(wú)法求值的表達(dá)式, 這個(gè)錯(cuò)誤會(huì)被識(shí)別成line的第三個(gè)規(guī)則并且分析會(huì)繼續(xù)執(zhí)行. (yyerror函數(shù)仍會(huì)被調(diào)用來(lái)打印它的信息).
執(zhí)行這個(gè)動(dòng)作的語(yǔ)句yyerrok是一個(gè)被Bison自動(dòng)定義的宏. 它的含義是錯(cuò)誤恢復(fù)已經(jīng)完成(參閱錯(cuò)誤恢復(fù)-Error Recovery一章).
我們應(yīng)當(dāng)注意到y(tǒng)yerror和yyerrok的區(qū)別, 它們的印刷都沒(méi)有錯(cuò)誤.
這種形式的錯(cuò)誤恢復(fù)用于處理語(yǔ)法錯(cuò)誤. 還有很多其它形式的錯(cuò)誤;
例如,除數(shù)為0,這會(huì)產(chǎn)生一個(gè)通常致命的異常信號(hào)(an exception signal).
一個(gè)真正的計(jì)算器必須處理這種信號(hào)并且使用longjmp返回到main并且繼續(xù)分析輸入行;
它(注:真正的計(jì)算器)也可以丟棄剩余的輸入行. 我們并不深入地討論這個(gè)問(wèn)題, 因?yàn)檫@與Bison程序無(wú)關(guān).
demo3 帶有位置追蹤的計(jì)算器
/* Location tracking calculator. */ /* 位置追蹤計(jì)算器 */%{#define YYSTYPE int#include <math.h>#include <stdio.h>int yylex (void);void yyerror (char const *); %}/* Bison declarations. */ /* Bison 聲明 */ %token NUM%left '-' '+' %left '*' '/' %left NEG %right '^'%% /* The grammar follows. */ /* 下面是語(yǔ)法 */ input : /* empty */| input line ;line : '\n'| exp '\n' { printf ("%d\n", $1); } ;exp : NUM { $$ = $1; }| exp '+' exp { $$ = $1 + $3; }| exp '-' exp { $$ = $1 - $3; }| exp '*' exp { $$ = $1 * $3; }| exp '/' exp{if ($3)$$ = $1 / $3;else{$$ = 1;fprintf (stderr, "%d.%d-%d.%d: division by zero",@3.first_line, @3.first_column,@3.last_line, @3.last_column);}}| '-' exp %prec NEG { $$ = -$2; }| exp '^' exp { $$ = pow ($1, $3); }| '(' exp ')' { $$ = $2; } ;%% /* 這里詞法分析要記錄位置信息!*/ int yylex (void) {int c;/* Skip white space. *//* 跳過(guò)空白 */while ((c = getchar ()) == ' ' || c == '\t')++yylloc.last_column;/* Step. */yylloc.first_line = yylloc.last_line;yylloc.first_column = yylloc.last_column;/* Process numbers. *//* 處理數(shù)字 */if (isdigit (c)){yylval = c - '0';++yylloc.last_column;while (isdigit (c = getchar ())){++yylloc.last_column;yylval = yylval * 10 + c - '0';}ungetc (c, stdin);return NUM;}/* Return end-of-input. *//* 返回輸入結(jié)束 */if (c == EOF)return 0;/* Return a single char, and update location. *//* 返回一個(gè)單字符,并且更新位置 */if (c == '\n'){++yylloc.last_line;yylloc.last_column = 0;}else++yylloc.last_column;return c; }int main (void) {yylloc.first_line = yylloc.last_line = 1;yylloc.first_column = yylloc.last_column = 0;return yyparse (); } /* Called by yyparse on error. */ void yyerror (char const *s) {fprintf (stderr, "%s\n", s); }重點(diǎn):
demo 4 多功能計(jì)算器
calc.h
/* Function type. */ /* 函數(shù)類(lèi)型 */ typedef double (*func_t) (double);/* Data type for links in the chain of symbols. */ /* 鏈表節(jié)點(diǎn)的數(shù)據(jù)類(lèi)型 */ struct symrec {char *name; /* name of symbol */ /* 符號(hào)的名稱(chēng) */int type; /* type of symbol: either VAR or FNCT */ /* 符號(hào)的類(lèi)型: VAR 或 FNCT */union{double var; /* value of a VAR */ /* VAR 的值 */func_t fnctptr; /* value of a FNCT */ /* FNCT 的值 */} value;struct symrec *next; /* link field */ /* 指針域 */ };typedef struct symrec symrec;/* The symbol table: a chain of `struct symrec'. */ /* 符號(hào)表: `struct symrec'的鏈表 */ extern symrec *sym_table;symrec *putsym (char const *, int); symrec *getsym (char const *);symrec * putsym (char const *sym_name, int sym_type) {symrec *ptr;ptr = (symrec *) malloc (sizeof (symrec));ptr->name = (char *) malloc (strlen (sym_name) + 1);strcpy (ptr->name,sym_name);ptr->type = sym_type;ptr->value.var = 0; /* Set value to 0 even if fctn. */ /* 置0即是fctn */ptr->next = (struct symrec *)sym_table;sym_table = ptr;return ptr; }symrec * getsym (char const *sym_name) {symrec *ptr;for (ptr = sym_table; ptr != (symrec *) 0;ptr = (symrec *)ptr->next)if (strcmp (ptr->name,sym_name) == 0)return ptr;return 0; }mfcalc.y
%{#include <math.h> /* For math functions, cos(), sin(), etc. */ /* 為了使用數(shù)學(xué)函數(shù), cos(), sin(), 等等 */#include <stdio.h>#include "calc.h" /* Contains definition of `symrec'. */ /* 包含了 `symrec'的定義 */int yylex (void);void yyerror (char const *); %}/*%union聲明了所有可能類(lèi)型清單; 這是用來(lái)取代YYSTYPE的. 現(xiàn)在允許的類(lèi)型是雙精度(為了exp和NUM)和指向符號(hào)表目錄項(xiàng)的指針. */ %union {double val; /* For returning numbers. */ /* 返回的數(shù)值 */symrec *tptr; /* For returning symbol-table pointers. */ /* 返回的符號(hào)表指針 */ } %token <val> NUM /* Simple double precision number. */ /* 簡(jiǎn)單的雙精度數(shù)值 */ %token <tptr> VAR FNCT /* Variable and Function. */ /* 變量和函數(shù) */ %type <val> exp%right '=' %left '-' '+' %left '*' '/' %left NEG /* negation--unary minus */ /* 負(fù)號(hào) */ %right '^' /* exponentiation */ /* 冪 */ %% /* The grammar follows. */ input: /* empty */| input line ;line:'\n'| exp '\n' { printf ("\t%.10g\n", $1); }| error '\n' { yyerrok; } ;exp: NUM { $$ = $1; }| VAR { $$ = $1->value.var; }| VAR '=' exp { $$ = $3; $1->value.var = $3; }| FNCT '(' exp ')' { $$ = (*($1->value.fnctptr))($3); }| exp '+' exp { $$ = $1 + $3; }| exp '-' exp { $$ = $1 - $3; }| exp '*' exp { $$ = $1 * $3; }| exp '/' exp { $$ = $1 / $3; }| '-' exp %prec NEG { $$ = -$2; }| exp '^' exp { $$ = pow ($1, $3); }| '(' exp ')' { $$ = $2; } ; /* End of grammar. */ %% #include <ctype.h>int yylex (void) {int c;/* Ignore white space, get first nonwhite character. *//* 忽略空白,獲取第一個(gè)非空白的字符 */while ((c = getchar ()) == ' ' || c == '\t');if (c == EOF)return 0;/* Char starts a number => parse the number. *//* 以數(shù)字開(kāi)頭 => 分析數(shù)字 */if (c == '.' || isdigit (c)){ungetc (c, stdin);scanf ("%lf", &yylval.val);return NUM;}/* Char starts an identifier => read the name. *//* 以標(biāo)識(shí)符開(kāi)頭 => 讀取名稱(chēng) */if (isalpha (c)){symrec *s;static char *symbuf = 0;static int length = 0;int i;/* Initially make the buffer long enoughfor a 40-character symbol name. *//* 在開(kāi)始的時(shí)候使緩沖區(qū)足夠容納40字符長(zhǎng)的符號(hào)名稱(chēng)*/if (length == 0)length = 40, symbuf = (char *)malloc (length + 1);i = 0;do{/* If buffer is full, make it bigger. *//* 如果緩沖區(qū)已滿,使它大一點(diǎn) */if (i == length){length *= 2;symbuf = (char *) realloc (symbuf, length + 1);}/* Add this character to the buffer. *//* 將這個(gè)字符加入緩沖區(qū) */symbuf[i++] = c;/* Get another character. *//* 獲取另外一個(gè)字符 */c = getchar ();}while (isalnum (c));ungetc (c, stdin);symbuf[i] = '\0';s = getsym (symbuf);if (s == 0)s = putsym (symbuf, VAR);yylval.tptr = s;return s->type;}/* Any other character is a token by itself. *//* 其余的字符是自己為記號(hào)的字符 */return c; } /* Called by yyparse on error. */ /* 出錯(cuò)時(shí)被yyparse調(diào)用 */ void yyerror (char const *s) {printf ("%s\n", s); }struct init {char const *fname;double (*fnct) (double); };struct init const arith_fncts[] = {"sin", sin,"cos", cos,"atan", atan,"ln", log,"exp", exp,"sqrt", sqrt,0, 0 };/* The symbol table: a chain of `struct symrec'. */ /* 符號(hào)表: `struct symrec'鏈表 */ symrec *sym_table;/* Put arithmetic functions in table. */ /* 將數(shù)學(xué)函數(shù)放入符號(hào)表(注:保留字的實(shí)現(xiàn)方式) */ void init_table (void) {int i;symrec *ptr;for (i = 0; arith_fncts[i].fname != 0; i++){ptr = putsym (arith_fncts[i].fname, FNCT);ptr->value.fnctptr = arith_fncts[i].fnct;} }int main (void) {init_table ();return yyparse (); }執(zhí)行:
$ mfcalc pi = 3.1415926535893.1415926536 sin(pi) 0.0000000000 alpha = beta1 = 2.3 2.3000000000 alpha 2.3000000000 ln(alpha) 0.8329091229 exp(ln(beta1)) 2.3000000000重點(diǎn):
優(yōu)化:
未定義的變量報(bào)錯(cuò):
由于簡(jiǎn)單使用任何字符串都會(huì)自動(dòng)創(chuàng)建一個(gè)VAR類(lèi)型的變量,依據(jù)現(xiàn)在的邏輯添加思路:
步驟:
其他的方案目前還想不到。但是這個(gè)方案感覺(jué)是改動(dòng)最小的。
注意這里使用了:
YYERROR的宏,可以在語(yǔ)義工作的文檔中查看。
總結(jié)
以上是生活随笔為你收集整理的bison进行语法分析学习记录的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。