MathemaTriX ⋅ Theorie nach Thema. Diagramme
| ||||||||||||||||||
Inhalt
Ein-Aus- klappen |
AUFGABEN |
Was ist ein Diagramm
[Bearbeiten]In Diagrammen kann man verschiedene Daten in einem Bild darstellen, die man dann schnell ablesen kann. Diagramme können helfen, einen schnellen Überblick zu bekommen, werden aber auch oft benutzt, um einen falschen Eindruck zu bewirken. Hier werden das Säulendiagramm, das Liniendiagramm, das Kreisdiagramm und das Boxplotdiagramm präsentiert, es gibt aber auch zahlreiche andere Diagrammarten, wie z.B. Punktdiagramm, Balkendiagramm usw.
Säulendiagramm
[Bearbeiten]Das Diagramm mit den Farben gibt die Anzahl der Steine in einem Kinderspiel, die eine gewisse Farbe haben. 4 Steine sind rot, 1 ist orange, 1 ist gelb, keine ist grün, es gibt 6 türkis usw. So ein Diagramm nennt man Säulendiagramm, weil es aus „Säulen“ besteht, wie in einem alten Tempel (Bild rechts). Die Farben sind sogenannte nominale Variablen. Nominale Variablen können wir zwar voneinander unterscheiden, wir können aber nicht z.B. sagen, dass rot "größer" als blau ist, wie z.B. wir sagen können, dass 4 mehr als 1 ist. Nominalen Variablen können wir also nicht der Größe nach ordnen. In diesem Diagramm können wir allerdings den sogenannten Modus ablesen, also welche Farbe am häufigsten vorkommt (Türkis).
Das folgende Diagramm gibt die Anzahl der Packungen, die eine gewisse Anzahl von Bananen pro Packung beinhalten. Die Anzahl der Bananen pro Packung ist eine sogenannte kardinale Größe (genauer gesagt: Variable einer Verhältnisskala). Wir können die einzelne Werte addieren, wir können auch dadurch einen Durchschnitt finden. Das geht allerdings nicht mit den Werten, die auf der x-Achse stehen (hier Bananen pro Packung), sondern nur mit den einzelnen Werten.Wenn die Frage z.B. ist, wie viele Packungen 4 Bananen haben, geht man so vor:
Auf der Achse unten (waagerechte Achse, x-Achse, auch Abszissenachse oder einfach Abszisse genannt) kann man die Bananen pro Packung ablesen, also kann man Bananen ablesen. Da wo 4 Bananen stehen (unten am Diagramm) befindet sich eine Säule. Man kann sehen, wie hoch diese Säule ist. Sie ist so hoch wie 5 Packungen. Die Anzahl der Packungen kann man links ablesen (auf der senkrechte Achse, der y-Achse, auch Ordinatenachse oder einfach Ordinate genannt). Also es gibt 5 Packungen mit 4 Bananen.
Wie viele Packungen haben 3 Bananen? Da, wo 3 Bananen stehen (unten, x-Achse), gibt es keine Säule! Die Höhe der Säule ist daher 0. Es gibt also keine (0) Packung, die 3 Bananen hat!
Wie viele Packungen haben keine Banane? Da, wo 0 Bananen stehen (unten, x-Achse), gibt es eine Säule, die 4 Packungen hoch ist. Es gibt also 4 Packungen mit keiner Banane!
Wie viele Packungen haben höchstens 3 Bananen? Höchstens bedeutet bis, also so viel wie 3 Bananen oder weniger (also 2, 1 oder keine Banane). Es gibt keine Packung mit 3 Bananen, 3 Pack. mit 2 Ban., 2 Pack. mit 1 Banane und 4 Pack. mit keiner Banane, also insgesamt 0+3+2+4=9 Pack..
Wie viele Packungen haben mindestens 3 Bananen? Mindestens bedeutet ab, also so viel wie 3 Bananen oder mehr (also 4, 5, 6 oder mehr Bananen). Es gibt keine Packung mit 3 Bananen, 5 Pack. mit 4 Ban. und 1 Pack. mit 5 Ban., also insgesamt 0+5+1=6 Pack..
Mittelwerte bei einem Säulendiagramm
[Bearbeiten]Aus dem Diagramm kann man eine Tabelle erzeugen!
Es gibt also 33 Bananen in 15 Packungen. Der Durchschnitt ist daher: B/P (Bananen pro Packung) im Durchschnitt.
Man kann auch den Median finden. Man soll die Werte (wie viele Bananen) einordnen. Wir haben 4 Packungen mit 0 Bananen (also die null kommt vier mal vor), 2 mit einer Banane, 3 mit 2 Bananen usw.:
Wie man sehen kann, 3 kommt nicht vor. Wir haben ja keine Packung mit 3 Bananen, also der Wert 3 Bananen kommt nicht vor! Wir haben insgesamt 15 Werte (15 Packungen). Der Wert in der Mitte ist der achte Wert, also 2. Der Median ist 2.
Welcher Wert kommt öfters vor? 4 Bananen kommt 5 mal vor (in 5 Packungen). Alle andere Werte kommen nicht so oft vor. Also 4 ist der Modalwert.
Säulendiagramm erstellen
[Bearbeiten]Die ans Rauchen zuzuschreibenden gemeldeten Todesfälle in den Dörfern einer Region in einer Woche waren:
7, 6, 3, 4, 3, 8, 7, 7, 8, 6, 7, 6, 3, 8, 8, 7, 6, 6.
- Zeichnen Sie ein Säulendiagramm, aus dem man ablesen kann, wie viele Dörfer welche Anzahl von Todesfälle hat
- Geben Sie den Durchschnitt, den Modalwert, den Median und die Spannweite der Todesfälle an!
Die Frage "wie viel ist der Durchschnitt der Todesfälle pro Dorf" ist sinnvoller als die Frage "wie viel ist der Durchschnitt der Dörfer pro Todesfälle". Wenn wir aber über Todesfälle pro Dorf sprechen, dann muss die Anzahl der Todesfälle auf der x-Achse des Säulendiagramms stehen. Wir haben fünf verschiedene Werte, 3 4 6 7 oder 8 Todesfälle. 3 kommt in drei Dörfer vor, 4 in einem Dorf, 6 in fünf Dörfern, 7 in fünf Dörfern und 8 in vier Dörfern. Wir haben also fünf Säule und ihre "Höhe" wird 3 (für 3 Todesfälle), 1 (für 4 Todesfälle), 5 (für 6 T.), 5 (für 7 T.) und 4 (für 8 T.). Das Ergebnis kann da so aussehen:
|
|
Wie man den Durchschnitt, den Median und den Modus findet, haben wir schon an einer anderen Stelle gelernt. Für die Spannweite werden wir hier die x-Achse benutzen (auch wenn dies nicht ganz richtig ist). Spannweite ist dann der größte minus den kleinsten Wert, also hier
Liniendiagramme
[Bearbeiten]Lineare Funktion Diagramm
[Bearbeiten]In einem Liniendiagramm spricht man von einem Koordinatensystem. Es gibt zwei „Koordinaten“, die x-Achse (senkrecht) und die y-Achse (waagerecht).
In Balkendiagramm im vorherigen Absatz hatten wir diskrete Werte. Das Wort „diskrete“ bedeutet in Mathematik, dass man z.B. den Wert 2 und den Wert 3 (Bananen im letzten Beispiel) hat, aber keinen Wert dazwischen (z.B. keine 2,156 Bananen). Das Gegenteil von diskreten Werten sind die kontinuierlichen Werte. In unserem Beispiel hier sieht man eine sogenannte (quasi-kontinuierliche) Kostenkurve. Man kann in Diagramm ablesen, sowohl wie viel die Produktion von z.B. 60 T-Shirts kostet, als auch wie viele T-Shirts man mit z.B. 20€ produzieren kann. Für die erste Frage (wie viel kosten 60 T-Shirts) fängt man an der x-Achse an, da wo die Anzahl der T-Shirts angegeben ist. Man geht von 60 (T-Shirts) senkrecht nach oben, bis man die Linie (oft Kurve genannt) trifft. Dann geht man waagerecht zur y-Achse (hier links), bis man die y-Achse trifft, da wo die Kosten stehen. In diesem Fall sind die Kosten 25€. Umgekehrt geht man vor, wenn die Kosten angegeben sind. In unserem Beispiel sind 20€ gegeben. Wie viele T-Shirts kann man damit produzieren? Man fängt in diesem Fall mit der y-Achse an, da auf dieser Achse die Kosten angegeben sind. Man geht dann waagerecht rechts bis man die Linie trifft und dann senkrecht nach unten, bis man die x-Achse trifft. Da kann man 45 T-Shirts ablesen. Man kann also mit 20€ 45 T-Shirts produzieren.
Liniendiagramm
[Bearbeiten]Die Kurve in einem Liniendiagramm kann irgendeine Form haben (und nicht nur eine Gerade). Das folgende Beispiel zeigt die Körpertemperatur von einer Person (namens Gregor) am 12.3.15. Man kann sich aber vorstellen, was im Diagramm dargestellt wird. Man kann z.B. sehen welche Temperatur Gregor um 6 oder um 22.15 Uhr hatte, oder am welchen Zeitpunkten seine Temperatur z.B. 36,45°C oder 36,6°C war.
Kreisdiagramm
[Bearbeiten]Ein Kreisdiagramm zeigt Anteile des Ganzen. Es kann benutzt werden, um einen schnellen Überblick von statistischen Daten zu bekommen.
Ein Beispiel: In einer Klasse sind 8 Personen aus Österreich, 2 aus Deutschland, 2 aus der Türkei, 2 aus Serbien und 2 aus Tschechien. Diese Information kann man so wie im Bild in einem Kreisdiagramm darstellen. Die Hälfte des Kreises sind die 8 Personen aus Österreich. Die andere Hälfte ist in vier gleichen Teilen geteilt, also jeweils 2 Personen für Türkei, Deutschland, Serbien und Tschechien.
Boxplot
[Bearbeiten]Ein Boxplotdiagramm hilft bei der Darstellung von statistischen Daten. Mit einem Boxplotdiagramm bekommt man einen schnellen aber etwas groben Überblick über die Verteilung der Daten. Im Bild kann man mit einer dicken senkrechten Linie den Median sehen. Das „Box“ fängt links dort, wo ¼ der Daten stehen und endet rechts dort, wo ¾ der Daten stehen. Dazu gibt es zwei senkrechte Linien, die den kleinsten und den größten Wert zeigen. Dazu kann es auch „Ausreißer“ geben, also Daten die zu groß oder zu klein sind.
Den Median (auch Zentralwert genannt) mehrerer Werte findet man, indem man die Werte zuerst der Größe nach ordnet (z.B. vom kleineren zum größeren) und dann den Wert in der Mitte der Reihe wählt.
Die Spannweite, also die Differenz zwischen größten und kleinsten Wert ist ein Streuungsmaß auch im Fall des Medians. Ein anderes Maß ist in diesem Fall der Interquartilsabstand (Symbol IQR). Median ist der Wert in der Mitte der geordneten Werte. Wenn wir den ersten viertel der geordneten Werte nehmen, dann ist der Wert am oberen Rand das untere (erste) Quartil. Am oberen Rand der ersten drei Viertel befindet sich das obere (dritte) Quartil[1]. Die Differenz der Werte des oberen und des unteren Quartils ist der Interquartilsabstand.
All diese Sachen können wir in einem sogenannten Boxplot Diagramm darstellen[2]. Das folgende Beispiel beruht auf einer Messreihe mit den folgenden 20 Datenpunkten:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | |
(unsortiert) | 9 | 6 | 7 | 7 | 3 | 9 | 10 | 1 | 8 | 7 | 9 | 9 | 8 | 10 | 5 | 10 | 10 | 9 | 10 | 8 |
(sortiert) | 1 | 3 | 5 | 6 | 7 | 7 | 7 | 8 | 8 | 8 | 9 | 9 | 9 | 9 | 9 | 10 | 10 | 10 | 10 | 10 |
Ein Box-Plot hilft dabei sehr schnell einen Überblick über diese Daten zu erhalten. So erkennt man direkt, dass der Median (durchgezogene Linie) genau bei 8,5 liegt und dass je 25 % der Daten unter 7 und über 9,5 liegen, denn dies sind genau die Abmessungen der Box (die "Schachtel" in der Mitte), in der 50 % der Messwerte enthalten sind. Folglich ist auch der Interquartilsabstand, der der Länge der Box entspricht, genau 2,5 (also 9,5−7).
Dieser Box-Plot wurde mit Whiskern [3] bis zu einer Länge des 1,5-fachen Interquartilsabstands erstellt. Diese sind also maximal 3,75 Maßeinheiten lang. Allerdings reichen Whisker stets nur bis zu einem Wert aus den Daten, der sich noch innerhalb dieser 3,75 Einheiten befindet. Der obere Whisker verläuft also nur bis zu 10, da es keinen größeren Wert in den Daten gibt, und der untere Whisker nur bis 5, da der nächstkleinere Wert weiter als 3,75 vom Anfang der Box entfernt ist.
Die Werte von 1 und 3 werden im Box-Plot als Ausreißer markiert, da sie sich nicht innerhalb der Box oder der Whisker befinden. Bei diesen Werten sollte untersucht werden, ob es sich tatsächlich um Ausreißer oder um Tippfehler oder anderweitig auffällige Werte handelt.
- ↑ (als zweite (mittlere) Quartil ist der Median gemeint)
- ↑ Folgender Teil wurde fast ohne Änderungen von wikipedia übernommen.
- ↑ auch "Antennen" genannt, das sind die Strecken bei den Werten 5 und 10 oben und unten vom "Box" im Boxplot