-
Notifications
You must be signed in to change notification settings - Fork 1
/
cap07-lex-enum.c
282 lines (234 loc) · 5.09 KB
/
cap07-lex-enum.c
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
/*
Análise Léxica (usando enums)
O código abaixo foi escrito por Felipo Soranz e é uma adaptação
do código original em Pascal escrito por Jack W. Crenshaw em sua
série "Let's Build a Compiler".
Este código é de livre distribuição e uso.
*/
#include <stdio.h>
#include <stdlib.h>
#include <stdarg.h>
#include <ctype.h>
#include <string.h>
#define MAXNAME 30
#define MAXNUM 5
#define MAXOP 2
#define MAXTOKEN 30
/* Tabela de definições de símbolos */
#define SYMBOLTABLE_SIZE 1000
char *SymbolTable[SYMBOLTABLE_SIZE];
/* Definição de palavras-chave e tipos de token */
#define KEYWORDLIST_SIZE 4
char *KeywordList[KEYWORDLIST_SIZE] = {"IF", "ELSE", "ENDIF", "END"};
/* A ordem deve obedecer a lista de palavras-chave */
enum {
KW_IF, KW_ELSE, KW_ENDIF, KW_END,
TK_IDENT, TK_NUMBER, TK_OPERATOR
};
int Token;
char TokenText[MAXTOKEN+1];
char Look; /* O caractere lido "antecipadamente" (lookahead) */
/* Protótipos */
void Init();
void NextChar();
void Error(char *fmt, ...);
void Abort(char *fmt, ...);
void Expected(char *fmt, ...);
void SkipWhite();
void SkipComma();
void NewLine();
void Match(char c);
int IsOp(char c);
void EmitLn(char *fmt, ...);
void GetName();
void GetNum();
void GetOp();
void Scan();
int Lookup(char *s, char *list[], int size);
/* Programa principal */
int main()
{
Init();
do {
Scan();
switch (Token) {
case TK_IDENT:
printf("Ident: ");
break;
case TK_NUMBER:
printf("Number: ");
break;
case TK_OPERATOR:
printf("Operator: ");
break;
case KW_IF:
case KW_ELSE:
case KW_ENDIF:
case KW_END:
printf("Keyword: ");
break;
}
printf("%s\n", TokenText);
if (TokenText[0] == '\n')
NewLine();
} while (Token != KW_END);
return 0;
}
/* Inicialização do compilador */
void Init()
{
NextChar();
}
/* Lê próximo caractere da entrada */
void NextChar()
{
Look = getchar();
}
/* Exibe uma mensagem de erro formatada */
void Error(char *fmt, ...)
{
va_list args;
fputs("Error: ", stderr);
va_start(args, fmt);
vfprintf(stderr, fmt, args);
va_end(args);
fputc('\n', stderr);
}
/* Exibe uma mensagem de erro formatada e sai */
void Abort(char *fmt, ...)
{
va_list args;
fputs("Error: ", stderr);
va_start(args, fmt);
vfprintf(stderr, fmt, args);
va_end(args);
fputc('\n', stderr);
exit(1);
}
/* Alerta sobre alguma entrada esperada */
void Expected(char *fmt, ...)
{
va_list args;
fputs("Error: ", stderr);
va_start(args, fmt);
vfprintf(stderr, fmt, args);
va_end(args);
fputs(" expected!\n", stderr);
exit(1);
}
/* Pula caracteres de espaço */
void SkipWhite()
{
while (Look == ' ' || Look == '\t')
NextChar();
}
/* Pular uma vírgula */
void SkipComma()
{
SkipWhite();
if (Look == ',') {
NextChar();
SkipWhite();
}
}
/* Reconhece uma linha em branco */
void NewLine()
{
if (Look == '\n')
NextChar();
}
/* Verifica se entrada combina com o esperado */
void Match(char c)
{
if (Look != c)
Expected("'%c'", c);
NextChar();
}
/* Testa se caractere é um operador */
int IsOp(char c)
{
return (strchr("+-*/<>:=", c) != NULL);
}
/* Emite uma instrução seguida por uma nova linha */
void EmitLn(char *fmt, ...)
{
va_list args;
putchar('\t');
va_start(args, fmt);
vprintf(fmt, args);
va_end(args);
putchar('\n');
}
/* Recebe o nome de um identificador */
void GetName()
{
int i, kw;
if (!isalpha(Look))
Expected("Name");
for (i = 0; isalnum(Look) && i < MAXNAME; i++) {
TokenText[i] = toupper(Look);
NextChar();
}
TokenText[i] = '\0';
kw = Lookup(TokenText, KeywordList, KEYWORDLIST_SIZE);
if (kw == -1)
Token = TK_IDENT;
else
Token = kw;
}
/* Recebe um número inteiro */
void GetNum()
{
int i;
if (!isdigit(Look))
Expected("Integer");
for (i = 0; isdigit(Look) && i < MAXNUM; i++) {
TokenText[i] = Look;
NextChar();
}
TokenText[i] = '\0';
Token = TK_NUMBER;
}
/* Recebe um operador */
void GetOp()
{
int i;
if (!IsOp(Look))
Expected("Operator");
for (i = 0; IsOp(Look) && i < MAXOP; i++) {
TokenText[i] = Look;
NextChar();
}
TokenText[i] = '\0';
Token = TK_OPERATOR;
}
/* Analisador léxico */
void Scan()
{
int kw;
while (Look == '\n')
NewLine();
if (isalpha(Look))
GetName();
else if (isdigit(Look))
GetNum();
else if (IsOp(Look))
GetOp();
else {
TokenText[0] = Look;
TokenText[1] = '\0';
Token = TK_OPERATOR;
NextChar();
}
SkipWhite();
}
/* Se a string de entrada estiver na tabela, devolve a posição ou -1 se não estiver */
int Lookup(char *s, char *list[], int size)
{
int i;
for (i = 0; i < size; i++) {
if (strcmp(list[i], s) == 0)
return i;
}
return -1;
}