OS: Implemented parser/lexer of shell.

parent 1b3c650c
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
<title>Extra opgave 1</title>
</head>
<body>
<h2>Extra Opgave 1 - eeen eenvoudige command shell</h2>
<h3>Leerdoelen: </h3>
<ol>
<li>Het opstarten van nieuwe processen onder UNIX </li>
<li>Het gebruik van pipes </li>
<li>Inzicht in de werking van command shells </li>
</ol>
Het is bij deze opgave de bedoeling dat je een eenvoudige shell
schrijft. Zo'n shell moet via een fork andere processen kunnen
opstarten. Soms moeten er ook meerdere processen achter&shy;elkaar
kunnen worden opgestart, die onderling verbonden zijn door een pipe. De
beste procedure in dat geval blijkt te zijn, eerst de pipe door de
shell te laten aanmaken en op de gewenste manier met stdout te
verbinden. Daarna wordt het eerste kind afgesplitst en wordt de pipe op
de juiste manier met stdin verbonden. Daarna wordt het tweede kind
afgevorkt. Als er meer dan twee processen in de pijplijn zitten, dan
moet bij de middelste processen netjes een verbinding met de voorganger
en met de opvolger worden gemaakt.
<h4>Het ouderproces </h4>
De acties van deze shell zijn de volgende:
<ol>
<li>Druk een prompt af en lees een opdrachtregel van de terminal. Bij
een EOF stopt de shell. </li>
<li>Haal het eerste ``woord'' op uit de opdrachtregel. Controleer of
dit
een ``builtin'' opdracht betreft. Zo ja, voer die uit en ga terug naar
1. </li>
<li>Lees de eerste opdracht. Opdrachten bestaan uit een
programmanaam,
gevolgd door nul of meer parameters, net als bij iedere andere shell.
Ze eindigen met een ``new&shy;line'' of een ``pipe&shy;symbool'' `<span
style="font-family: monospace;">|</span>'. <br>
</li>
<li>Eindigt de opdracht met een `<span style="font-family: monospace;">|</span>',
dan
moet
je
eerst
een pipe
aanmaken. Ga anders naar 6. Nu zijn er meerdere mogelijkheden:
<ul>
<li>De ouder doet het nodige loodgieterswerk met stdin/stdout en
de
aan&shy;gemaakte pipes alvorens een nieuw proces af te splitsen. </li>
<li>De ouder vorkt een kindproces af en laat het loodgieterswerk
daar
aan over (maar wel voordat het exec-commando wordt uitgevoerd). </li>
</ul>
</li>
<li>Doe de nodige administratie zodat het volgende proces zijn invoer
uit de pijp kan lezen en lees de volgende opdracht na de `<span
style="font-family: monospace;">|</span>'. Ga naar
4. </li>
<li>Fork een nieuwe shell af voor het laatste kind in de rij; de
parent
shell wacht op het eindigen van alle kinderen en gaat daarna terug naar
1.</li>
</ol>
<h4>De kindprocessen</h4>
De kindprocessen doen het volgende:
<ol>
<li>Ze zorgen dat alle verbindingen met de nul, &eacute;&eacute;n of
twee pipes
correct zijn verbonden en sluiten alle niet&shy;gebruikte verbindingen
(functies dup2
en close). </li>
<li>Het kind voert vervolgens een ``execv'' uit, waarbij het eerste
woord van de opdracht wordt opgevat als een programma uit ``/bin'', en
de rest
van de opdracht als de parameters. Bestaat het gevraagde programma
niet, of geeft execv een andere fout terug, dan eindigt het kindproces
met
een toepasselijke foutboodschap, b.v. middels ``perror''.</li>
</ol>
Afgezien van de `<span style="font-family: monospace;">|</span>' kent
deze shell geen redirection en geen
achtergrondprocessen.<br>
<h4>Builtin opdrachten </h4>
De shell moet de volgende ``builtin'' opdrachten direct zelf uitvoeren:
<br>
<ul>
<li>Verplicht: </li>
<ul>
<li><span style="font-family: monospace;">exit</span> -
be&euml;indig de shell. </li>
<li><span style="font-family: monospace;">cd </span>- change
directory (kan alleen als een builtin). De opdracht <span
style="font-family: monospace;">cd </span>heeft precies
&eacute;&eacute;n parameter nodig. </li>
</ul>
<li>Optioneel:
<ul>
<li> . of source - lees opdrachten uit een file (een parameter).
Splits
daarvoor geen nieuwe shell af. Keer na het einde van de file terug naar
de vorige input-file. <br>
Dit soort opdrachten kunnen genest zijn. </li>
<li> <span style="font-family: monospace;">!!</span> - herhaal
vorige opdracht (is eigenlijk geen builtin,
maar een
soort editor commando). </li>
<li> <span style="font-family: monospace;">!n</span> - herhaal
de n<sup>&shy;de</sup> opdracht. (b.v. <span
style="font-family: monospace;">!3</span>). </li>
</ul>
</li>
</ul>
Na de `<span style="font-family: monospace;">|</span>' wordt niet naar
builtins gezocht. Deze shell kan dus iets als <span
style="font-family: monospace;">!1 | !2</span> niet uitvoeren.<br>
<h4>En verder </h4>
Vang de ^C [CTRL-C] af in de parent shell middels een geschikte
aanroep van <span style="font-family: monospace;">sigaction()</span>,
maar niet in de nakomelingen. Dit kan
betekenen dat je bij
een kindproces de oorspronkelijke handler juist moet terugzetten. <br>
Om redenen van veiligheid mag je shell alleen programma's uit ``<span
style="font-family: monospace;">/bin</span>''
uitvoe&shy;ren; andere paden zijn taboe. Het pad naar het programma mag
dus geen
`/' bevatten, omdat je b.v. via ``<span style="font-family: monospace;">/bin/../</span>''
overal
kan
komen.
<br>
Zorg ervoor dat je eerst een duidelijk schema hebt van hoe de in&shy;
en uitvoer doorverbonden moet worden bij opdrachten als: <br>
<span style="font-family: monospace;">ls -&shy;alit | grep opsys | sed
''s/ .*199[0-&shy;9]//'' | cat </span><br>
<h4>Relevante manual pages: </h4>
<ul>
<li><span style="font-family: monospace;">fork</span> </li>
<li><span style="font-family: monospace;">s2 wait</span> </li>
<li style="font-family: monospace;">exec </li>
<li style="font-family: monospace;">dup2 </li>
<li style="font-family: monospace;">pipe </li>
<li style="font-family: monospace;">fgets </li>
<li><span style="font-family: monospace;">string </span>(o.a. <span
style="font-family: monospace;">strcat</span>, <span
style="font-family: monospace;">strchr</span>, <span
style="font-family: monospace;">strcpy</span>, <span
style="font-family: monospace;">strtok</span>).</li>
</ul>
<a href="scanner.c" target="_code">Dit is een skelet van een mogelijke
implementatie van deze shell</a>. (Gebruik niet verplicht).
</body>
</html>
...@@ -15,9 +15,17 @@ all: shell ...@@ -15,9 +15,17 @@ all: shell
clean: clean:
$(RM) shell *.o input.lex.* input.yacc.* $(RM) shell *.o input.lex.* input.yacc.*
shell: input.yacc.o input.lex.o shell.o shell: input.yacc.o input.lex.o main.o
$(CC) $(CFLAGS) $(LFLAGS) -o $@ $^ $(CC) $(CFLAGS) $(LFLAGS) -o $@ $^
test: shell
echo -n 'exit' | ./shell
echo -n 'cd ../' | ./shell
echo -n 'cat input.l' | ./shell
echo -n 'cat input.l | grep "id"' | ./shell
echo -n '!!' | ./shell
echo -n '!2' | ./shell
input.yacc.c: input.y input.yacc.c: input.y
bison --debug --verbose -d -o $@ $< bison --debug --verbose -d -o $@ $<
......
...@@ -9,8 +9,6 @@ ...@@ -9,8 +9,6 @@
// To get rid of the error "‘input’ defined but not used". // To get rid of the error "‘input’ defined but not used".
#define YY_NO_INPUT #define YY_NO_INPUT
//#define YY_USER_INIT yyset_debug(0);
#include <stdio.h> #include <stdio.h>
#include "input.l.h" #include "input.l.h"
#include "input.yacc.h" #include "input.yacc.h"
...@@ -31,7 +29,7 @@ extern void reset_column(void){ column_no = 0; } ...@@ -31,7 +29,7 @@ extern void reset_column(void){ column_no = 0; }
%x id %x id
%x num %x num
id [a-zA-Z_][[:alnum:]_.]* id [a-zA-Z_][[:alnum:]_.-]*
num [0-9]+ num [0-9]+
wsp [\r\t ] wsp [\r\t ]
...@@ -40,7 +38,7 @@ wsp [\r\t ] ...@@ -40,7 +38,7 @@ wsp [\r\t ]
/* Strings, like "abc" */ /* Strings, like "abc" */
\"([^\\"]|\\.)*\" { \"([^\\"]|\\.)*\" {
column_no += yyleng; column_no += yyleng;
//yylval.sval = yytext; yylval.str = strdup(yytext);
return STRING; return STRING;
} }
...@@ -49,27 +47,65 @@ wsp [\r\t ] ...@@ -49,27 +47,65 @@ wsp [\r\t ]
/* Numbers 0, 42, 9001 etc. */ /* Numbers 0, 42, 9001 etc. */
0x[0-9a-f]+|{num} { 0x[0-9a-f]+|{num} {
column_no += yyleng; column_no += yyleng;
//yylval.sval = yytext; yylval.str = strdup(yytext);
return INTEGER; return INTEGER;
} }
/* Identifiers */ /* Exit shell builtin */
exit {
column_no += 4;
return EXIT;
}
/* Change directory builtin */
cd {
column_no += 2;
return CD;
}
/* Identifiers: source */
{id} { {id} {
//yylval.sval_annot.str = yytext;
//yylval.sval_annot.line = current_line();
//yylval.sval_annot.column = current_column();
column_no += yyleng; column_no += yyleng;
yylval.str = strdup(yytext);
return IDENTIFIER; return IDENTIFIER;
} }
/* Math operators */ /* Pipe operator */
[-+,()] { \| {
column_no++; column_no++;
return *yytext; return *yytext;
} }
/* Repeat operator */
! {
column_no++;
return *yytext;
}
/* Path or path with filename: ./a/, ../, config/, /tmp/, /tmp/file */
[^ ]*\/[^ ]* {
column_no += yyleng;
yylval.str = strdup(yytext);
return PATH;
}
/* Argument (filenames and such): hello.txt, .config */
[\/{id}][^ ]+ {
column_no += yyleng;
yylval.str = strdup(yytext);
return ARGUMENT;
}
#[^\n]+ { /* ignore comments */ } #[^\n]+ { /* ignore comments */ }
/* End of file is a separator */
\0 {
line_no++;
reset_column();
return EOS;
}
/* White space */
\n { \n {
line_no++; line_no++;
reset_column(); reset_column();
...@@ -81,7 +117,7 @@ wsp [\r\t ] ...@@ -81,7 +117,7 @@ wsp [\r\t ]
. { . {
column_no++; column_no++;
fprintf(stderr, "error: illegal character '%c' (0%o)" fprintf(stderr, "error: lexer found illegal character '%c' (0%o)"
" at line %d, column %d\n", yytext[0], yytext[0], " at line %d, column %d\n", yytext[0], yytext[0],
line_no, column_no); line_no, column_no);
exit(EXIT_FAILURE); exit(EXIT_FAILURE);
......
...@@ -5,3 +5,6 @@ extern int yyparse(); ...@@ -5,3 +5,6 @@ extern int yyparse();
extern void reset_line(); extern void reset_line();
extern void reset_column(); extern void reset_column();
void start_shell_entry();
void start_shell_pipe();
...@@ -11,11 +11,10 @@ ...@@ -11,11 +11,10 @@
#include "input.lex.h" #include "input.lex.h"
#include "input.l.h" #include "input.l.h"
void yyerror(const char *str) void yyerror(const char *str) {
{
fflush(stdout); fflush(stdout);
fflush(stderr); fflush(stderr);
fprintf(stderr, "error: %s (line %d, column %d)\n", str, fprintf(stderr, "error: parser reported \"%s\" (line %d, column %d)\n", str,
current_line(), current_column()); current_line(), current_column());
exit(EXIT_FAILURE); exit(EXIT_FAILURE);
...@@ -24,23 +23,48 @@ void yyerror(const char *str) ...@@ -24,23 +23,48 @@ void yyerror(const char *str)
%} %}
%token COMMENT IDENTIFIER ARGUMENT STRING INTEGER %token COMMENT IDENTIFIER ARGUMENT STRING INTEGER
%token EOL %token EOL EOS CD EXIT PATH
%type <str> PATH INTEGER
%union {
char * str;
}
%left '-' '+' %left '-' '+'
%% %%
Start: /* empty */ Start: /* empty */
| Command EOL | Commands
;
Commands: Command
/* | Command EOS*/
| Commands EOL { start_shell_entry(); } Command
| Commands '|' { start_shell_pipe(); } Command
; ;
Command: Command: Builtin
| IDENTIFIER | IDENTIFIER
| IDENTIFIER Arguments | IDENTIFIER Arguments
; ;
Arguments: ARGUMENT Builtin: EXIT { puts("Exit shell"); }
| Arguments ' ' ARGUMENT | CD PATH { printf("CD %s\n", $2); }
| '!' '!' { puts("Repeat last"); }
| '!' INTEGER { printf("Repeat %d\n", atoi($2)); }
;
Arguments: Argument
| Arguments ' ' Argument
;
Argument: STRING
| ARGUMENT
| IDENTIFIER
| INTEGER
| PATH
; ;
%% %%
...@@ -10,8 +10,16 @@ ...@@ -10,8 +10,16 @@
#include "input.lex.h" #include "input.lex.h"
#include "input.l.h" #include "input.l.h"
void start_shell_pipe() {
printf("start pipe");
}
void start_shell_entry() {
printf(">>> ");
}
int main(void) { int main(void) {
yyset_debug(1); yyset_debug(0);
if( yyparse() ) { if( yyparse() ) {
fprintf(stderr, "Error: Parsing failed\n"); fprintf(stderr, "Error: Parsing failed\n");
......
Markdown is supported
0%
or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment