-
Notifications
You must be signed in to change notification settings - Fork 2
/
Chapter2_german.tex
1228 lines (1003 loc) · 43 KB
/
Chapter2_german.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
%!TEX root = Main_german.tex
% LaTeX source for textbook ``How to think like a computer scientist''
% Copyright (C) 1999 Allen B. Downey
% This LaTeX source is free software; you can redistribute it and/or
% modify it under the terms of the GNU General Public License as
% published by the Free Software Foundation (version 2).
% This LaTeX source is distributed in the hope that it will be useful,
% but WITHOUT ANY WARRANTY; without even the implied warranty of
% MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
% General Public License for more details.
% Compiling this LaTeX source has the effect of generating
% a device-independent representation of a textbook, which
% can be converted to other formats and printed. All intermediate
% representations (including DVI and Postscript), and all printed
% copies of the textbook are also covered by the GNU General
% Public License.
% This distribution includes a file named COPYING that contains the text
% of the GNU General Public License. If it is missing, you can obtain
% it from www.gnu.org or by writing to the Free Software Foundation,
% Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.
\setcounter{chapter}{1}
\chapter{Variablen und Typen}
\section{Noch mehr Bildschirmausgaben}
\index{Ausgabe}
\index{Anweisung!Ausgabe}
Wie ich bereits im letzten Kapitel erwähnte, können wir so viele
Anweisungen in {\tt main()} aufnehmen, wie wir wollen.
So können wir zum Beispiel in unserem Programm auch mehr als
eine Zeile ausgeben lassen:
\begin{verbatim}
#include <stdio.h>
#include <stdlib.h>
/* main: generate some simple output */
int main (void)
{
printf ("Hello World!\n"); /* output one line */
printf ("How are you?\n"); /* output another line */
return EXIT_SUCCESS;
}
\end{verbatim}
%
Wie man sehen kann, ist es erlaubt, Kommentare auch
direkt in eine Programmzeile
zu schreiben und nicht nur in eine separate Zeile.
\index{String}
\index{Zeichenketten|see{String}}
\index{Typ!String}
Die Ausdrücke innerhalb der Anführungszeichen werden {\bf Strings}
oder {\bf Zeichenketten} genannt, weil sie aus einer Folge von Buchstaben
bestehen. Strings können jede beliebige Kombination von Buchstaben,
Ziffern, Satzzeichen und anderen speziellen Zeichen enthalten. Probleme
bereiten uns nur die deutschen Umlaute und das 'ß'.
\index{newline}
Manchmal ist es sinnvoll, den Text mehrerer Ausgabeanweisungen
zusammen in einer Bildschirmzeile anzuzeigen.
Wir können das ganz einfach umsetzen, in dem wir das {\tt $\backslash$n}
Zeichen aus der ersten {\tt printf()} Anweisung entfernen:
\begin{verbatim}
int main (void)
{
printf ("Goodbye, ");
printf ("cruel world!\n");
return EXIT_SUCCESS;
}
\end{verbatim}
%
In diesen Fall erscheint die Ausgabe auf einer
einzelnen Zeile wie folgt:
\begin{verbatim}
Goodbye, cruel world!
\end{verbatim}
Im Programm fällt auf, dass sich zwischen
dem \texttt{Goodbye,} und dem
Anführungszeichen noch ein Leerzeichen befindet.
Dieses Leerzeichen finden wir auch
in dem angezeigten Text auf dem Bildschirm wieder,
das heißt es beeinflusst das
Verhalten unseres Programms.
Leerzeichen ausserhalb von Anführungszeichen, irgendwo
im Quelltext des Programms, haben üblicherweise
keinen Einfluss auf das Verhalten unseres Programms.
Ich hätte den Quelltext auch in der folgenden Form aufschreiben können:
\begin{verbatim}
int main(void)
{
printf("Goodbye, ");
printf("cruel world!\n");
return EXIT_SUCCESS;
}
\end{verbatim}
%
Dieses Programm ist genauso gut kompilier- und ausführbar wie das
Original. Ebenso haben die Zeilenumbrüche an den Zeilenenden
keine Bedeutung. Ich hätte also schreiben können:
\begin{verbatim}
int main(void){printf("Goodbye, ");printf("cruel world!\n");
return EXIT_SUCCESS;}
\end{verbatim}
%
Das funktioniert auch! Allerdings fällt auf, dass es
schwerer und schwerer wird das Programm zu lesen.
Zeilenumbrüche und Leerzeichen im Quelltext
sind ein sinnvolles Mittel um ein Programm visuell zu strukturieren.
Es wird dadurch für uns einfacher das Programm zu lesen und
mögliche Fehler im Programm zu finden, beziehungsweise das
Programm später zu ändern und anzupassen.
Moderne Entwicklungsumgebungen können dabei die
Arbeit erleichtern. Sie bieten die Möglichkeit den
Quelltext automatisch formatieren zu lassen.
\section{Bits und Bytes}
\index{Bit}
\index{Byte}
\index{Computerspeicher}
\index{Digitale Daten}
Computer sind digital, das weiß heute jedes Kind.
Was aber genau bedeutet das eigentlich?
Mein Computer, auf dem ich dieses Buch tippe, kann
Töne, Bilder, Texte und Videos erzeugen, abspielen und
verändern. Wie können so unterschiedliche Aufgaben von einer
Maschine geleistet werden?
Das Rätsels Lösung ist darin zu finden wie diese Sachen
gespeichert werden: als \textbf{digitale Daten}!
Computer speichern Daten in Form von Bits.
Ein Bit ist die kleinste vorstellbare Informationsmenge.
Es kennt nur 2 Zustände: \emph{an} oder \emph{aus}, \emph{0} oder \emph{1}, \emph{high} oder \emph{low}.
Das ist scheinbar wenig, aber trotzdem schon recht nützlich: leuchtet die Fahrradlampe oder leuchtet sie nicht?
Diese Tatsache lässt sich mit einem einzelnen Bit beschreiben.
Für das Speichern von Fotos, Musik und Abschlussarbeiten benötigen wir natürlich sehr viel mehr Bits,
aber das ist für moderne Computer schon lange kein Problem mehr. Das Grundprinzip jedenfalls ist immer
noch gültig.
Da es sehr unhandlich ist, mit einzelnen Bits zu hantieren, speichern Computer ihre Daten in
Gruppen von Bits.
Wie wir gesehen haben, trifft ein einzelnes Bit eine einfache Fallunterscheidung: \emph{0} oder \emph{1}, \emph{an} oder \emph{aus}. Gruppieren wir die Bits, so lassen sich mehr Fälle unterscheiden.
Mit 8 Bit können wir bereits 256 Fälle unterscheiden -- mehr als genug für die Zeichen des lateinischen
Alphabets, der Ziffern und Satzzeichen.
%Für die Speicherung von \emph{Zeichen} reichen also üblicherweise 7 oder 8 Bit.
Eine Gruppe von 8 Bit nennt man Byte und jedes Byte hat im Computer eine
eindeutige Adresse. Diese ist nötig, damit keine Daten verloren gehen und unser Programm immer ganz
genau weiß, wo sich welche Daten befinden.
\index{Byte}
\index{Adresse}
Abbildung \ref{Chapt2_Memory} zeigt uns einen Ausschnitt aus dem Speicher eines
Computers. Wir sehen eine Matrix von Bits, die entweder den Wert 0 oder 1 besitzen und
sind erst einmal verwirrt. Wie gelingt es hier die Übersicht zu behalten?
Für die Interpretation der Bitfolgen kommen üblicherweise Codes zum Einsatz, wie zum Beispiel der
im Anhang \ref{ASCII-Table} beschriebene ASCII Code. Dort ist festgelegt, dass die Bitfolge \texttt{00110101}
das \textbf{Zeichen} \emph{5} beschreibt. Nicht zu verwechseln mit dem \textbf{Dezimalwert} \emph{5}, welche durch
die Bitfolge \texttt{00000101} dargestellt wird.
\index{ASCII}
\def\bitfeldIntern(#1,#2,#3,#4,#5,#6,#7,#8) {
\setcounter{collumn}{25}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#1}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#2}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#3}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#4}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#5}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#6}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#7}}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\therow){\framebox(\theboxsize,\theboxsize){\textbf{\textsf{#8}}}}
}
\def\bitfeld#1{\bitfeldIntern(#1)}
\newcommand{\initBitArray}[1]{
% Counter for drawing the bit-boxes
\newcounter{boxsize}
\setcounter{boxsize}{#1}
\newcounter{row}
\setcounter{row}{0}
\newcounter{collumn}
% Counter for drawing left and right annotations
\newlength{\txtoffset} %vertikaler Offset für Beschriftung (mittig zur Box)
\setlength{\txtoffset}{0.25cm}
\newlength{\yspace}
\yspace=\theboxsize cm
\divide\yspace by 10
\newcounter{before}
\setcounter{before}{0}
\newcounter{after}
\setcounter{after}{85}
}
\newcommand{\addRow}{
\addtocounter{row}{\theboxsize}
}
\def\bitHeaderIntern(#1,#2,#3,#4,#5,#6,#7,#8) {
\setcounter{collumn}{25}
\addtocounter{collumn}{3} % zentrieren
\addtocounter{row}{\theboxsize}
\newlength{\mylen}
%\setlength{\mylen}{36.5cm}
\mylen=\therow cm
\divide\mylen by 10
\addtolength{\mylen}{0.15cm}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#8$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#7$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#6$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#5$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#4$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#3$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#2$}}}
\addtocounter{collumn}{\theboxsize}
\put(\thecollumn,\LenToUnit{\mylen}){{\scriptsize \texttt{$#1$}}}
}
\def\bitHeader#1{\bitHeaderIntern(#1)}
\unitlength0.1cm
\begin{figure}[H]
\centering
\begin{picture}(120,45)%(0,-40)%shift origin eg: (0,-40)
\initBitArray{7} %7 is the size of the box in mm
\bitfeld{0,1,0,1,0,1,0,1} \addRow % wir zeichnen von unten nach oben
\bitfeld{0,1,0,1,0,1,0,1} \addRow % ToDo: kann man das ändern?
\bitfeld{0,1,0,1,0,1,0,1} \addRow
\bitfeld{0,0,1,1,0,1,0,1} \addRow
\bitfeld{0,0,0,0,0,1,0,1}
\bitHeader{2^0,2^1,2^2,2^3,2^4,2^5,2^6,2^7}
\put(0,\LenToUnit{\txtoffset}){{\large \texttt{Byte \textbf{...}}}}
\addtolength{\txtoffset}{\yspace}
\put(0,\LenToUnit{\txtoffset}){{\large \texttt{Byte \textbf{6683}}}}
\addtolength{\txtoffset}{\yspace}
\put(0,\LenToUnit{\txtoffset}){{\large \texttt{Byte \textbf{6682}}}}
\addtolength{\txtoffset}{\yspace}
\put(0,\LenToUnit{\txtoffset}){{\large \texttt{Byte \textbf{6681}}}}
\put(\theafter,\LenToUnit{\txtoffset}){{\large \texttt{\textbf{ASCII-Zeichen '5'}}}}
\addtolength{\txtoffset}{\yspace}
\put(\thebefore,\LenToUnit{\txtoffset}){{\large \texttt{Byte \textbf{6680}}}}
\put(\theafter,\LenToUnit{\txtoffset}){{\large \texttt{\textbf{Dezimalwert 5}}}}
\end{picture}
\caption{Ein hypothetischer Ausschnitt aus dem Speicher eines Computers}
\label{Chapt2_Memory}
\end{figure}
Als Programmierer einer Hochsprache müssen sie die genaue numerische Adresse
der Daten sowie die verwendete Code-Tabelle nicht auswendig lernen.
Da wir uns als Menschen besser Namen
als lange Zahlenfolgen merken, werden wir in den nächsten Abschnitten kennenlernen, wie
wir \emph{Datentypen} und \emph{Variablen} benutzen um Daten zu speichern und zu
bearbeiten. Die Übersetzung in die richtige Bitfolge übernimmt dann der Compiler für uns.
\section{Werte und Datentypen}
\index{Wert}
\index{Daten}
\index{Datentyp}
\index{Typ|see{Datentyp}}
Computerprogramme arbeiten mit Daten, die im
Speicher des Computers abgelegt sind.
Daten besitzen einen \textbf{Wert} -- das heißt sie repräsentieren eine konkrete Zahl oder einen Buchstaben --
und sind eines der fundamentalen Dinge mit denen ein Computerprogramm
arbeiten kann.
%
%\begin{center}
%\newcommand{\bitlabel}[2]{%
% \bitbox[]{#1}{%
% %\raisebox{0pt}[0pt][0pt]{%
% \fontsize{7}{7}\selectfont#2}}%
%
%%}
%
%\begin{bytefield}{8}
% \bitlabel{1}{$2^7$} & \bitlabel{1}{$2^6$} &
% \bitlabel{1}{$2^5$} & \bitlabel{1}{$2^4$} &
% \bitlabel{1}{$2^3$} & \bitlabel{1}{$2^2$}
% \bitlabel{1}{$2^1$} & \bitlabel{1}{$2^0$} \\
%%\bitheader{2,7} \\
%\bitbox[]{1}{\texttt{0x003FFFFF}0} &
%\bitbox{1}{0} &
%\bitbox{1}{0} &
%\bitbox{1}{0} &
%\bitbox{1}{0} &
%\bitbox{1}{1} &
%\bitbox{1}{0} &
%\bitbox{1}{1} \\
%\end{bytefield}
%\end{center}
Daten repräsentieren so unterschiedliche Dinge wie die
ganzen Zahlen, die reellen Zahlen und Buchstaben. Man sagt die Daten
haben einen bestimmten \textbf{Typ}.
Es ist wichtig, dass ein Programm ganz genau weiß, um welche Art von
Daten es sich handelt, da unterschiedlichen Anforderungen für die Speicherung der Daten
im Computer existieren.
Wie wir gesehen haben, werden Daten als Bitfolgen gespeichert.
Für die Speicherung von \emph{Buchstaben} des lateinischen Alphabets reichen üblicherweise 7 oder 8 Bit.
Für die Speicherung von \emph{Zahlen} werden dagegen wesentlich mehr Bit benötigt. Wir wollen ja nicht nur
von 0 bis 255 zählen können.
Es macht für den Computer also einen Unterschied, ob wir den Zahlenraum der \emph{ganzen Zahlen} oder der \emph{reelle Zahlen}
nutzen. Denn obwohl Computer mit hoher Geschwindigkeit rechnen
gibt es ein Problem: Zahlenbereiche in der Mathematik sind unendlich. Unser Computerspeicher
aber ist es nicht. Daher müssen wir uns bewusst machen, dass es zu Einschränkungen
im Wertebereich und der Genauigkeit kommen kann.
Ein weiterer Grund für die Unterscheidung der Datentypen liegt darin begründet, dass
nicht alle Operationen für jeden Datentyp sinnvoll sind.
Wir können zwei Zahlen addieren, aber die Addition von Buchstaben \texttt{'a' + 'b'}
ist nicht definiert.
Der Datentyp legt daher fest, welche Bedeutung die Bitfolgen im Speicher des Computers haben: \emph{Buchstabe}, \emph{ganze Zahlen}, usw.
%Deshalb spricht man von elektronischer Datenverarbeitung
Die einzigen Daten, mit denen wir bisher gearbeitet haben, waren
Folgen von Buchstaben, auch Zeichenketten oder Strings genannt.
\index{String}
Wir haben zum Beispiel {\tt ''Hello, world!''} auf dem Bildschirm ausgegeben.
Wir (und der Compiler) können diese Zeichenketten
anhand der umschließenden Anführungszeichen erkennen.
%constant values
Die \emph{ganzen Zahlen} (beispielsweise 1 oder 17) werden in C als \emph{integer}
bezeichnet.
Unser Programm kann nicht nur Zeichenketten, sondern auch
ganze Zahlen auf dem Bildschirm ausgeben:
\index{int|see{Ganze Zahlen}}
\index{integer|see{Ganze Zahlen}}
\index{Ganze Zahlen}
\vskip 0.7em
\begin{verbatim}
printf("%i\n", 16);
\end{verbatim}
\vskip 0.5em
Die Ausgabe sieht auf den ersten Blick auch nicht anders aus, als wenn wir uns
eine Zeichenkette ausgeben lassen:
% Aufgabe: Vergleichen Sie die Ausgaben von
\vskip 0.7em
\begin{verbatim}
printf("16\n");
\end{verbatim}
\vskip 0.5em
Zahlen werden vom Computer aber anders behandelt als Zeichenketten, so kann man
zum Beispiel mit Zahlen rechnen:
\vskip 0.7em
\begin{verbatim}
printf("%i\n", 16 + 1);
\end{verbatim}
\vskip 0.5em
Schauen wir uns die \texttt{printf()} Anweisung genau an, so fällt
ein \texttt{\%i} zwischen den Anführungszeichen auf. Dabei handelt es sich um ein
Platzhalterzeichen, welches angibt das eine ganze Zahl ausgegeben werden
soll. Die auszugebene Zahl folgt erst hinter den Ausführungszeichen, durch Komma getrennt.
Es gibt eine Reihe solcher Platzhalter für unterschiedliche Datentypen.
Den Nächsten werden wir gleich kennenlernen.
Der Datentyp \emph{character} repräsentiert einen Buchstaben, eine Ziffer
oder ein Satzzeichen.
C benutzt für die Speicherung der Werte vom Typ \emph{character} den
ASCII-Code (siehe Anhang \ref{ASCII-Table}). In diesem Code ist leider nur
das englische Alphabet definiert. Landestypische Erweiterungen des
Zeichensatzes werden nicht berücksichtigt. Aus diesem Grund
ist es am Anfang einfacher erst einmal komplett auf \textit{ä},
\textit{ö}, \textit{ü} und \textit{ß} zu verzichten
und statt dessen \textit{ae}, \textit{oe}, \textit{ue} und \textit{ss} zu schreiben.
Ein \emph{character}-Wert in unserem Programm wird durch einfache
Anführungsstriche kenntlich gemacht, wie zum Beispiel {\tt 'a'} oder {\tt '5'}:
\vskip 0.7em
\begin{verbatim}
printf("%c\n", '$');
\end{verbatim}
\vskip 0.5em
%
Für die Ausgabe von Daten vom Typ \emph{character} benötigen wir das Platzhalterzeichen \texttt{\%c}.
Unser Beispiel gibt ein einzelnes Dollarzeichen in einer eigenen
Bildschirmzeile aus.
%\index{{\tt char}|see{Zeichen}}
\index{char|see{Zeichen}}
\index{character|see{Zeichen}}
\index{Zeichen}
Am Anfang ist es schwer, die einzelnen Typen der Werte {\tt ''5''}, {\tt
'5'} und {\tt 5} zu unterscheiden. Man muss sehr genau auf die
Zeichensetzung achten, dann wird klar, dass der erste Wert
ein String, der zweite Wert ein Buchstabe und der dritte eine
ganze Zahl darstellt.
Der Grund für diese Unterscheidung wird uns im Laufe des Kurses
noch klarer werden.
\section {Variablen}
\index{Variablen}
\index{Wert}
Eine der mächtigsten Fähigkeiten einer Programmiersprache
ist die Möglichkeit digitale Daten zu speichern, wieder abzurufen und zu
verändern.
In unseren bisherigen Versuchen waren alle verwendeten Werte
durch die Angaben im Quelltext des Programms statisch festgelegt.
Ab jetzt werden wir oft \textbf{Variablen} benutzen um Werte dynamisch zu speichern und zu
verändern. Variablen können wir uns wie die Memory-Taste an
einem Taschenrechner vorstellen, nur etwa 1000x flexibler und mächtiger, weil unser
Programm beliebig viele Variablen nutzen und nicht nur Zahlen speichern kann.
Eine Variable ist aber gar nichts sonderlich Geheimnisvolles. Ich hatte
ja bereits erwähnt, dass die Bytes im Speicher unseres Computers Adressen
besitzen. Da wir als Menschen nicht sehr gut darin sind uns lange Zahlenfolgen
zu merken, verwenden wir dafür besser einen sinnvollen, selbstgewählten Namen,
den \textbf{Variablennamen}.
\index{Variablenname}
Variablen sollen verschiedene Arten von Daten speichern können und
müssen daher auch verschiedene Datentypen unterstützten.
Es gibt einige Programmiersprachen, bei denen der Computer
selbstständig den Typ der Variable anhand des zu speichernden
Werts erkennt. In C muss der Typ immer angeben werden.
Wollen wir eine neue Variable verwenden, so müssen wir sie erst einmal \emph{deklarieren}, das heißt in
unserem Programm bekannt machen.
Um eine Variable zu deklarieren die ein Zeichen speichert, muss der Typ \emph{character} als dem Namen vorangestelltes {\tt char} angegeben werden.
Die folgende Anweisung, die man auch als {\bf Deklaration} bezeichnet, erzeugt eine neue Variable
mit dem Namen {\tt fred} vom Typ \textit{character}:
\index{Deklaration}
\index{Anweisung!Deklaration}
\vskip 0.7em
\begin{verbatim}
char fred; /* creates a new character variable */
\end{verbatim}
\vskip 0.5em
%
\index{Typ!char}
%Diese Art von Anweisungen heißt {\bf Deklaration}.
Der Typ einer Variable bestimmt, welche Werte gespeichert werden können.
Eine {\tt char} Variable kann genau ein Zeichen speichern. Ganze
Zahlen können als {\tt int} Variablen gespeichert werden.
Um eine einfache Variable vom Typ \emph {integer} anzulegen, verwenden wir folgende
Syntax:
\vskip 0.7em
\begin{verbatim}
int bob;
\end{verbatim}
\vskip 0.5em
\index{Typ!int}
%
Dabei ist {\tt bob} ein beliebiger Name, den wir auswählen können um
die Variable zu identifizieren. Es ist im Allgemeinen eine gute
Idee Namen zu wählen, welche die Daten beschreiben,
die in ihnen gespeichert werden sollen. Das erleichtert den
Umgang mit Variablen und macht ein Programm
leichter lesbar. Weiterhin sollten Sie sich bereits am Anfang mit den Regeln für
die Namensverwendungen vertraut machen (siehe Anhang \ref{Conventions for names}).
Schauen wir uns zum Beispiel die folgenden Variablendeklarationen
an:
\begin{verbatim}
char first_letter;
char last_letter;
int hour, minute;
\end{verbatim}
%
Wir können wahrscheinlich eine erste, zutreffende Vermutung
äußern, welche Werte in diesen Variablen gespeichert werden.
Dieses Beispiel zeigt auch, wie wir einfach mehrere Variablen des
gleichen Typs deklarieren können: {\tt hour} und {\tt minute}
sind beides Variablen für ganze Zahlen ({\tt int} Typ).
Für sehr große und komplexe Programme ist auch diese
Form der Variablenbezeichnung noch zu unübersichtlich.
Deswegen hat der aus Ungarn stammende Programmierer
Charles Simonyi ein System der Variablenbezeichnung
entworfen, indem dem Namen einer Variablen noch weitere
Informationen hinzugefügt werden können.\footnote{\url{http://de.wikipedia.org/wiki/Ungarische_Notation}}
Wir werden dieses System in diesem Buch aber nicht anwenden,
da unsere Programme noch sehr klein und übersichtlich sind.
Im Gegensatz zu anderen Programmiersprachen gibt es in C keinen
eigenen Datentyp, um die Werte von Zeichenketten in einer
Variable zu speichern. Das ist schade, aber wir werden lernen
damit umzugehen. Leider brauchen wir dafür noch ein tieferes
Verständnis der Programmiersprache, so dass ich erst später im
Kapitel~\ref{strings} darauf zurückkommen werde.
Für den Anfang beschränken wir uns also auf Zahlen und einzelne Zeichen.
%but we
%are going to skip that for now (see Chapter~\ref{strings}).
ACHTUNG: Der ältere C89 Standard erlaubt die Deklaration von
Variablen nur am Anfang eines neuen Abschnitts (Block) im Quelltext.
Es ist deshalb sinnvoll, alle in einer Funktion benötigten Variablen
gleich am Anfang der Funktion zu deklarieren -- selbst wenn wir
diese Variable erst viel später in unserem Programm benutzen wollen. \hint
\section{Zuweisung}
\label{sec:assignment}
\index{Zuweisung}
\index{Anweisung!Zuweisung}
Nachdem wir jetzt einige Variablen erzeugt haben, möchten wir
gern Werte in ihnen speichern. Dazu benutzen wir eine
Anweisung, die eine {\bf Zuweisung} vornimmt:
\vskip 0.7em
\begin{verbatim}
first_letter = 'a'; /* give first_letter the value 'a' */
hour = 11; /* assign the value 11 to hour */
minute = 59; /* set minute to 59 */
\end{verbatim}
\vskip 0.5em
%
Dieses Beispiel zeigt drei Zuweisungen und die Kommentare
geben uns drei Beispiele, wie Programmierer über den
Vorgang des Speicherns eines Wertes in einer Variable sprechen.
Das Vokabular ist vielleicht etwas verwirrend, aber die
Idee ist eigentlich ziemlich einfach zu beschreiben:
\begin{enumerate}
\item Wenn wir eine Variable deklarieren, erschaffen wir eine benannte
Speicherstelle.
\item Wenn wir eine Zuweisung zu dieser Variable vornehmen,
speichern wir einen Wert in dieser Speicherstelle.
\end{enumerate}
Wir können dabei den zweiten Schritt nicht vor dem ersten Schritt
tun. Sollten wir den zweiten Schritt vergessen, lässt sich die
Variable durchaus verwenden (zum Beispiel in einer
Ausgabeanweisung), der Wert der Variable ist aber nicht bestimmt.
Man sagt dazu, die Variable ist nicht initialisiert. Der Compiler legt
in der Regel beim Erstellen einer Variable keinen Anfangswert fest.
Es ist deshalb eine gute Idee, einer Variablen einen definierten
Anfangswert zuzuweisen -- anderenfalls kann die Verwendung der
Variable leicht zu schwer zu findenden Programmfehlern führen.
Eine weit verbreitete Methode Variablen auf Papier darzustellen,
besteht darin einen Kasten mit dem Variablennamen zu zeichnen
und den Wert der Variable hier einzutragen.
Das folgende Diagramm zeigt den Effekt der
drei Zuweisungsanweisungen:
%\vspace{0.1in}
%\centerline{\epsfig{figure=figs/assign.eps}}
%\vspace{0.1in}
\setlength{\unitlength}{1mm}
\begin{picture}(20,17)
\put(7,12){\large \texttt{first\_letter}}
\put(46,12){\large \texttt{hour}}
\put(74,12){\large \texttt{minute}}
\put(10,0){\framebox(20,10){{\large \textsf{a}}}}
\put(40,0){\framebox(20,10){{\large \textsf{11}}}}
\put(70,0){\framebox(20,10){{\large \textsf{59}}}}
\end{picture}
%\begin{picture}(50,10)
%\put(7,7){\large \texttt{Text}}
%\put(10,0){\framebox(5,5){{\large \texttt{0}}}}
%\put(15,0){\framebox(5,5){\texttt{1}}}
%\put(20,0){\framebox(5,5){{\large \textsf{1}}}}
%\thicklines
%\put(30,2.5){\vector(1,0){5}}
%\put(35,0){\framebox(5,5){ \textsf{1}}}
%\end{picture}
Wir können auf diese Weise den aktuellen Zustand einer Variablen
darstellen.
Dieser Zustand ist abhängig von der Ausführung von
Anweisungen in unserem Programm und kann sich während
des Programmablaufs ändern. Solche Veränderungen
kann man in einem {\bf Zustandsdiagramm} darstellen.
%I sometimes use different shapes to indicate different
%variable types. These shapes should help remind you that one of the
%rules in C is that a variable has to have the same type as the
%value you assign it.
Bei der Zuweisung von Werten an Variablen müssen
wir aufpassen, dass der Typ des Werts mit dem Typ der
Variable übereinstimmt.
So können wir zum Beispiel keine Zeichenkette in einer
{\tt int} Variable speichern. Die folgende Anweisung führt zu einer
Warnmeldung des Compilers:
\vskip 0.7em
\begin{verbatim}
int hour;
hour = "Hello."; /* WRONG !! */
\end{verbatim}
\vskip 0.5em
%
Diese Regel führt manchmal zu Verwirrungen, weil es viele Möglichkeiten
gibt, Werte von einem Typ in einen anderen Typ zu konvertieren.
Manchmal nimmt C diese Typumwandlung auch automatisch vor.
Es hilft aber sich einzuprägen, dass Variablen
und Werte den gleichen Typ haben müssen. Wir werden uns später
um die Spezialfälle kümmern.
Eine weitere Quelle für Verwechslungen besteht darin,
dass einige Zeichenketten wie Zahlen \emph{aussehen}, aber keine
sind.
So ist zum Beispiel die Zeichenkette {\tt ''123''}, aus
den Zeichen {\tt 1}, {\tt 2} und {\tt 3} zusammengesetzt.
Der \emph{String} {\tt ''123''} unterscheidet sich für den Computer grundlegend
von der {\em Zahl} {\tt 123}.
Die folgende Zuweisung ist illegal:
\vskip 0.7em
\begin{verbatim}
minute = "59"; /* WRONG!! */
\end{verbatim}
%
\section{Variablen ausgeben}
\label{output variables}
Wir können die Werte von Variablen mit den selben Kommandos ausgeben, die
wir auch für die Ausgabe von einfachen Werten genutzt haben:
\begin{verbatim}
int hour, minute;
char colon;
hour = 11;
minute = 59;
colon = ':';
printf ("The current time is ");
printf ("%i", hour);
printf ("%c", colon);
printf ("%i", minute);
printf ("\n");
\end{verbatim}
%
Dieses Programmfragment erzeugt zwei \emph{integer} Variablen mit Namen {\tt hour} und {\tt
minute}, und die \emph{character} Variable {\tt colon}.
Den Variablen werden geeignete Werte zugewiesen, um danach mit einer
Reihe von Ausgabeanweisungen die folgende Nachricht auf dem Bildschirm auszugeben:
\begin{verbatim}
The current time is 11:59
\end{verbatim}
Wenn wir davon sprechen eine Variable ``auszugeben'', meinen wir,
dass wir den {\em Wert} der Variable ausgeben.
Der Name einer Variable ist nur für den Programmierer wichtig.
Wir erinnern uns, es ist ein Name für eine Speicherstelle.
Das kompilierte Programm enthält diese für Menschen
lesbare Referenzen nicht mehr. Den Benutzer interessiert nur noch
der dort gespeicherte Wert.
%The name of a variable only has significance for
%the programmer. The compiled program no longer contains a human readable
%reference to the variable name in your program.
%If you need to output the {\em name} of a variable,
%you have to print it in quotes. For example: {\tt cout << "hour";}
Die \texttt{ printf()} Ausgabeanweisung kann mehr als einen Wert in einer
einzigen Anweisung ausgeben. Dafür müssen wir so viele Platzhalterzeichen
wie auszugebende Werte in die Anweisung einfügen und danach
die auszugebenden Werte mit Komma getrennt anfügen. Wichtig ist es
dabei, auf die richtige Reihenfolge und den Typ der Werte zu achten.
Damit können wir unser Programm folgendermaßen zusammenfassen:
\begin{verbatim}
int hour, minute;
char colon;
hour = 11;
minute = 59;
colon = ':';
printf ("The current time is %i%c%i\n", hour, colon, minute);
\end{verbatim}
%
In einer Programmzeile können wir jetzt einen \emph{string}, zwei \emph{integer} und
einen \emph{character} Wert ausgeben. Sehr eindrucksvoll!
\section{Schlüsselwörter}
\index{Schlüsselwörter}
Einige Abschnitte zuvor sagte ich, dass wir für unsere Variablen
beliebige Namen verwenden dürfen.
Das war leider nicht ganz richtig.
Es gibt in C einige Namen, die reserviert sind,
weil sie bereits vom Compiler genutzt werden,
um die Struktur eines C Programms zu parsen.
Wenn wir diese Wörter als Variablennamen verwenden,
würden Mehrdeutigkeiten entstehen und der Compiler könnte
nicht mehr auseinanderhalten, ob es sich dabei um den
Variablennamen oder das reservierte Wort der Sprache handelt.
Die komplette Liste der Schlüsselwörter ist im jeweiligen C Standard festgelegt.
Die hier aufgeführten Schlüsselwörter entsprechen der Sprachdefinition,
wie sie die Internationale Organisation für Normung (ISO) am 1. September 1998
festgelegt hat.
Die reservierten Wörter werden {\bf Schlüsselwörter} genannt.
In der folgenden Tabelle sind alle derzeit definierten Schlüsselwörter
der Sprache aufgeführt.
\vskip 1em
\setlength{\fboxsep}{6pt}
\begin{center}
\begin{boxedminipage}[c]{0.9\linewidth}
\begin{center}
\begin{multicols}{5}[\underline{Reservierte Schlüsselwörter der Sprache C}]
\begin{verbatim}
auto
break
case
char
const
continue
default
do
double
else
enum
extern
float
for
goto
if
inline
int
long
register
restrict
return
short
signed
sizeof
static
struct
switch
typedef
union
unsigned
void
volatile
while
_Bool
_Complex
_Imaginary
\end{verbatim}
\end{multicols}
\end{center}
\end{boxedminipage}
\end{center}
\vskip 1em
%You can download a copy electronically from
%
%\begin{verbatim}
% http://www.ansi.org/
%\end{verbatim}
%
Anstatt diese Liste jetzt auswendig zu lernen, empfehle ich einen
der Vorteile moderner Entwicklungsumgebungen zu nutzen: Syntaxhervorhebungen.
Wenn wir den Quelltext in einer Entwicklungsumgebung
wie Code::Blocks\footnote{http://www.codeblocks.org/} eingeben, werden
unterschiedliche Teile unseres Programms unterschiedlich farblich
eingefärbt. So erscheinen beispielsweise Schlüsselwörter in der
Farbe blau, Zeichenketten rot und alle anderen Befehle schwarz.
Wenn wir jetzt einen Variablennamen eingeben und dieser in der
Farbe blau erscheint, sollten wir aufpassen! Der Compiler
wird wahrscheinlich ein seltsames Verhalten zeigen.
%
%Rather than memorize the list, I would suggest that you
%take advantage of a feature provided in many development
%environments: code highlighting. As you type, different
%parts of your program should appear in different colors. For
%example, keywords might be blue, strings red, and other code
%black. If you type a variable name and it turns blue, watch
%out! You might get some strange behavior from the compiler.
\section{Mathematische Operatoren}
\label{operators}
\index{Operatoren!mathematische}
Mathematische {\bf Operatoren} sind spezielle Symbole, die dazu benutzt werden,
einfache Berechnungen wie Addition und Multiplikation darzustellen. Viele
der mathematischen Operatoren in C verhalten sich genauso, wie wir das von den
gebräuchlichen mathematischen Symbolen kennen. So wird zum
Beispiel das Zeichen {\tt +} für die Addition von zwei Zahlen benutzt.
Für die Multiplikation wird das Zeichen {\tt *} und für die Division
das Zeichen {\tt /} verwendet.
\index{Ausdruck}
Wenn wir Operatoren mit Operanden kombinieren, entsteht ein
sogenannter {\bf Ausdruck} der einen Wert repräsentiert. Ausdrücke
können Variablen, Werte und Operatoren enthalten.
In jedem Fall werden immer die Namen der Variablen durch
die Werte der Variablen ersetzt, bevor die Berechnung (Auswertung)
des Ausdrucks vorgenommen wird.
Die folgenden Ausdrücke der Sprache C sind legal und ihre
Bedeutung erschließt sich praktisch von selbst:
\begin{verbatim}
1+1 hour-1 hour*60+minute minute/60
\end{verbatim}
%
Addition, Subtraktion und Multiplikation funktionieren in C so, wie
wir das erwarten würden. Überrascht werden wir vom Ergebnis
der Division. Schauen wir uns das folgende Programm an:
\begin{verbatim}
int hour, minute;
hour = 11;
minute = 59;
printf ("Minutes since midnight: %i\n", hour*60 + minute);
printf ("Fraction of the hour that has passed: %i\n", minute/60);
\end{verbatim}
%
Es erzeugt die folgende Ausgabe:
\begin{verbatim}
Number of minutes since midnight: 719
Fraction of the hour that has passed: 0
\end{verbatim}
%
Die erste Zeile der Ausgabe ist korrekt, aber die zweite Zeile ist
seltsam. Der Wert der Variablen {\tt minute} ist 59 und
59 dividiert durch 60 ergibt 0,98333, nicht~0. Der Grund für dieses
Verhalten liegt darin, dass C für ganze Zahlen eine
{\bf ganzzahlige Division} durchführt.
\index{Datentyp!int}
\index{Ganzzahldivision}
\index{arithmetic!integer}
\index{Division!ganze Zahlen}
\index{Operand}
Wenn beide {\bf Operanden} ganzzahlige Werte sind,
%(operands are the things operators operate on)
dann ist das Resultat der Berechnung ebenfalls ein ganzzahliger Wert.
Nach der Definition wird dabei eine Division mit Rest durchgeführt.
Das Ergebnis ist ein Ganzzahlquotient und ein Divisionsrest und
hierbei wird niemals aufgerundet, selbst dann, wenn
die nächste Ganzzahl noch so nah ist.
Eine mögliche Alternative wäre in unserem Fall statt des gebrochenen
Anteils den Prozentwert auszurechnen:
\begin{verbatim}
printf ("Percentage of the hour that has passed: ");
printf ("%i\n", minute*100/60);
\end{verbatim}
%
Das Resultat ist:
\begin{verbatim}
Percentage of the hour that has passed: 98
\end{verbatim}
%
Auch hier fehlen wieder die Nachkommastellen, aber jetzt ist die
Antwort wenigstens annähernd korrekt.
Um eine noch genauere Antwort zu erhalten, müssen wir einen
ganz neuen Typ von Variablen für die Berechnung benutzen: Fließkommazahlen.
Mit diesem Variablentyp könne auch die Resultate von Brüchen und
reellen Zahlen gespeichert werden.
%In order to get an even more accurate
%answer, we could use a different type of variable, called
%floating-point, that is capable of storing fractional values.
Wir werden darauf im nächsten Kapitel zurückkommen.
\section{Rangfolge der Operatoren}
%\index{precedence}
\index{Rangfolge der Operatoren}
\index{Vorrang}
\index{Operatoren!Rangfolge}
Wenn mehr als ein Operator in einem Ausdruck enthalten ist,
wird die Reihenfolge der Auswertung von {\bf Vorrangregeln}
zwischen den Operatoren bestimmt.
Eine komplette Erklärung dieser Regeln wäre sehr umfangreich,
so dass ich hier nur die Wichtigsten erwähnen möchte:
\begin{itemize}
\item Multiplikation und Division werden vor
Addition und Subtraktion ausgeführt (Punktrechnung geht vor Strichrechnung).
{\tt 2*3-1} ergibt 5, nicht 4 und {\tt 2/3-1} ergibt -1, nicht 1
%(remember that in integer division {\tt 2/3} is 0).
\item Wenn die Operatoren den selben Rang aufweisen, werden sie von
links nach rechts ausgewertet. So wird in dem Ausdruck {\tt minute*100/60},
zuerst die Multiplikation ausgeführt, was {\tt 5900/60} ergibt, die weitere
Auswertung ergibt {\tt 98}.
%Wäre die Berechnung von rechts nach links
%durchgeführt worden ,
%the result would be {\tt 59*1} which is {\tt 59}, which
%is wrong.
\item Immer dann, wenn wir diese Vorrangregeln ändern wollen (oder
wenn wir uns nicht komplett sicher sind), können wir Klammern
setzen. Klammern setzen die automatischen Vorrangregeln außer Kraft.