1 Aufgaben

1.1 Übungsaufgaben

  1. Erstellen Sie eine beliebige Grafik des diamonds Datensatzes und fügen Sie der Grafik einen Überschrift (title), einen Untertitel (subtitle), eine “Unterschrift” (caption) und Beschriftungen der x-und y-Achse (x und y) sowie ein Farblabel bei.

  2. Verwenden Sie geom_text(), um Text in jede Ecke dieser Grafik zu zeichnen.

  3. Schauen Sie in die Beispiele der ?annotate() Funktion und fügen Sie mit Hilfe dieser Text in eine Grafik ein ohne vorher einen zusätzlichen tibble zu erstellen.

  4. Erstellen Sie ein Streudiagramm von displ und hwy des mpg Datensatzes.

    1. Filtern Sie zusätzlich für jeden Autotyp class nach dem effizientesten Auto.

    2. Markieren Sie diese Autos farblich anders als den Rest.

    3. Fügen Sie mit geom_segment und arrow() Pfeile in die Grafik ein, die auf die Punkte zeigen.

    4. Fügen Sie zusätzlich Label an das Ende der Pfeile ein, die das Automodell beschreiben.

    5. Fügen Sie schlussendlich der Grafik aussagekräftige Beschriftungen, usw. bei.

  5. Warum funktioniert der folgende Befehl nicht?

df <- tibble(
  x = rnorm(10000),
  y = rnorm(10000)
)
ggplot(df, aes(x, y)) +
  geom_hex() +
  scale_color_gradient(low = "white", high = "red") +
  coord_fixed()

6. Überschreiben Sie die Aesthetics in dem folgenden Befehl, um die Legende anschaulicher zu machen.

ggplot(diamonds, aes(carat, price)) +
  geom_point(aes(colour = cut), alpha = 1/20)

  1. Zeichnen Sie ein Streudiagramm von Sepal.Width und Sepal.Length des iris Datensatzes.
    1. Färben Sie die Punkte gemäß der Spezies ein.

    2. Fügen Sie Linien für jede Spezies hinzu und ändern Sie die linetype.

    3. Markieren Sie die kleinste und größte Pflanze jeder Spezies mit Pfeilen und Label.

    4. Beschriften Sie die Legende, Achsen und Titel sinnvoll.

1.2 Lösungen

1.2.1 Erstellen Sie eine beliebige Grafik des diamonds Datensatzes und fügen Sie der Grafik einen Überschrift (title), einen Untertitel (subtitle), eine “Unterschrift” (caption) und Beschriftungen der x-und y-Achse (x und y) sowie ein Farblabel bei.

Im folgenden Beispiel sehen wir die x-und y-Werte der Diamanten, wobei Farbgradienten und Achsen angepasst wurden:

library(viridis)
ggplot(diamonds, aes(x, y)) + 
    geom_hex() +
    scale_fill_viridis(begin = 0.4, end = 0.8, option = "A") +
    scale_x_continuous(breaks = seq(3, 15, 3), limits = c(3, 12), name = "y-Dimension") +
    scale_y_continuous(breaks = seq(3, 12, 3), limits = c(3, 12), name = "x-Dimension") +
    labs(caption = "Vergrößerte Ansicht",
             title = "Die meisten Diamanten weisen einen x-und y-Werte zwischen 3 und 12 auf",
             subtitle = "Besonders interessant ist der scheinbar lineare Zusammenhang",
             fill = "Anzahl")

1.2.2 Verwenden Sie geom_text(), um Text in jede Ecke dieser Grafik zu zeichnen.

label <- tibble(
    x = c(Inf, Inf, -Inf, -Inf),
    y = c(Inf, -Inf, Inf, -Inf),
    label = c("RO", "RU", "LO", "LU"),
    vjust = c("top", "bottom", "top", "bottom"),
    hjust = c("right", "right", "left", "left")
)
ggplot(diamonds, aes(x, y)) + 
    geom_hex() +
    scale_fill_viridis(begin = 0.4, end = 0.8, option = "A") +
    scale_x_continuous(breaks = seq(3, 15, 3), limits = c(3, 12), name = "y-Dimension") +
    scale_y_continuous(breaks = seq(3, 12, 3), limits = c(3, 12), name = "x-Dimension") +
    labs(caption = "Vergrößerte Ansicht",
             title = "Die meisten Diamanten weisen einen x-und y-Werte zwischen 3 und 12 auf",
             subtitle = "Besonders interessant ist der scheinbar lineare Zusammenhang",
             fill = "Anzahl") +
    geom_text(data = label, mapping = aes(label = label, vjust = vjust, hjust = hjust))

1.2.3 Schauen Sie in die Beispiele der ?annotate() Funktion und fügen Sie mit Hilfe dieser Text in eine Grafik ein ohne vorher einen zusätzlichen tibble zu erstellen.

label <- tibble(
    x = c(Inf, Inf, -Inf, -Inf),
    y = c(Inf, -Inf, Inf, -Inf),
    label = c("RO", "RU", "LO", "LU"),
    vjust = c("top", "bottom", "top", "bottom"),
    hjust = c("right", "right", "left", "left")
)
ggplot(diamonds, aes(x, y)) + 
    geom_hex() +
    scale_fill_viridis(begin = 0.4, end = 0.8, option = "A") +
    scale_x_continuous(breaks = seq(3, 15, 3), limits = c(3, 12), name = "y-Dimension") +
    scale_y_continuous(breaks = seq(3, 12, 3), limits = c(3, 12), name = "x-Dimension") +
    labs(caption = "Vergrößerte Ansicht",
             title = "Die meisten Diamanten weisen einen x-und y-Werte zwischen 3 und 12 auf",
             subtitle = "Besonders interessant ist der scheinbar lineare Zusammenhang",
             fill = "Anzahl") +
    geom_text(data = label, mapping = aes(label = label, vjust = vjust, hjust = hjust)) +
    annotate("text", x = 7.5, y = 7.5, label = "Mittelpunkt")

1.2.4 Erstellen Sie ein Streudiagramm von displ und hwy des mpg Datensatzes.

ggplot(mpg, aes(displ, hwy)) +
    geom_point()

1.2.4.1 Filtern Sie zusätzlich für jeden Autotyp class nach dem effizientesten Auto.

eff <- mpg %>%
    group_by(class) %>%
    slice_max(hwy)

1.2.4.2 Markieren Sie diese Autos farblich anders als den Rest.

ggplot(mpg, aes(displ, hwy)) +
    geom_point() +
    geom_point(data = eff, color = "red")

1.2.4.3 Fügen Sie mit geom_segment und arrow() Pfeile in die Grafik ein, die auf die Punkte zeigen.

ggplot(mpg, aes(displ, hwy)) +
    geom_point() +
    geom_point(data = eff, color = "red") +
    geom_segment(data = eff, mapping = aes(xend = displ + 0.3, yend = hwy + 1),
                             arrow = arrow(ends = "first", length = unit(0.1, "in"), type = "closed"))

1.2.4.4 Fügen Sie zusätzlich Label an das Ende der Pfeile ein, die das Automodell beschreiben.

# Zuerst muss definiert werden, wo die Label stehen sollen (z.B. am Ende der Pfeile)
label <- eff %>%
    mutate(hwy = hwy + 1.5,
                 displ = displ + 0.6)
ggplot(mpg, aes(displ, hwy)) +
    geom_point() +
    geom_point(data = eff, color = "red") +
    geom_segment(data = eff, mapping = aes(xend = displ + 0.3, yend = hwy + 1),
                             arrow = arrow(ends = "first", length = unit(0.1, "in"), type = "closed")) +
    geom_text(data = label, mapping = aes(label = model))

Hierbei überlappen sich die Label im oberen Bereich. Stattdessen kann auch geom_label_repel() aus ggrepel verwendet werden.

library(ggrepel)
ggplot(mpg, aes(displ, hwy)) +
    geom_point(aes(color = class)) +
    geom_point(data = eff, color = "black") +
    geom_label_repel(data = eff, aes(label = model),
    arrow = arrow(length = unit(0.02, "npc")),
    box.padding = 1, point.padding = 1
  )

1.2.4.5 Fügen Sie schlussendlich der Grafik aussagekräftige Beschriftungen, usw. bei.

In diesem Fall wurde die Legende noch unter die Grafik geschoben und die Transparenz angepast.

ggplot(mpg, aes(displ, hwy)) +
    geom_point(aes(color = class), alpha = 0.4) +
    geom_point(data = eff, color = "black", alpha = 0.4) +
    geom_label_repel(data = eff, aes(label = model),
    arrow = arrow(length = unit(0.02, "npc")),
    box.padding = 1, point.padding = 1
  ) +
    labs(x = "Hubraum (l)",
             y = "Kraftstoffverbrauch (Gallone pro Meile)",
             title = "Kraftstoffeffizienz fällt tendenziell mit steigendem Hubraum",
             subtitle = "Von jeder Autoklasse wurden die effizientesten Autos markiert") +
    guides(colour = guide_legend(nrow = 1, override.aes = list(size = 3, alpha = 1))) +
    theme(legend.position = "bottom")

1.2.5 Warum funktioniert der folgende Befehl nicht?

Bei dem Befehl wurde als Aesthetic color angegeben an Stelle von fill, sodass die Füllfarbe nicht verändert wurde. Wenn color durch fill in der Skalierung angepasst wird, funktioniert der Befehl wie erwartet:

1.2.6 Überschreiben Sie die Aesthetics in dem folgenden Befehl, um die Legende anschaulicher zu machen.

Durch das Setzen des alpha-Werts der Aesthetic sind die Punkte in der Legende ebenfalls transparent. Durch das Überschreiben der Legende durch guides() und dem Argument colour sowie override.aes lassen sich die Änderungen in der Grafik für die Legende anderweitig überschreiben (z. B. mit alpha = 1):

1.2.7 Zeichnen Sie ein Streudiagramm von Sepal.Width und Sepal.Length des iris Datensatzes.

1.2.7.1 Färben Sie die Punkte gemäß der Spezies ein.

1.2.7.2 Fügen Sie Linien für jede Spezies hinzu und ändern Sie die linetype.

1.2.7.3 Markieren Sie die kleinste und größte Pflanze (bezüglich Sepal) jeder Spezies mit Pfeilen und Label.

1.2.7.4 Beschriften Sie die Legende, Achsen und Titel sinnvoll.

---
title: "Übungszettel 7"
output: 
  html_notebook: 
    highlight: tango
    number_sections: yes
---

# Aufgaben

## Übungsaufgaben

1.  Erstellen Sie eine beliebige Grafik des `diamonds` Datensatzes und
    fügen Sie der Grafik einen Überschrift (`title)`, einen Untertitel
    (`subtitle`), eine "Unterschrift" (`caption`) und Beschriftungen der
    x-und y-Achse (`x` und `y`) sowie ein Farblabel bei.

2.  Verwenden Sie `geom_text()`, um Text in jede Ecke dieser Grafik zu
    zeichnen.

3.  Schauen Sie in die Beispiele der `?annotate()` Funktion und fügen
    Sie mit Hilfe dieser Text in eine Grafik ein ohne vorher einen
    zusätzlichen `tibble` zu erstellen.

4.  Erstellen Sie ein Streudiagramm von `displ` und `hwy` des `mpg`
    Datensatzes.

    1.  Filtern Sie zusätzlich für jeden Autotyp `class` nach dem
        effizientesten Auto.

    2.  Markieren Sie diese Autos farblich anders als den Rest.

    3.  Fügen Sie mit `geom_segment` und `arrow()` Pfeile in die Grafik
        ein, die auf die Punkte zeigen.

    4.  Fügen Sie zusätzlich Label an das Ende der Pfeile ein, die das
        Automodell beschreiben.

    5.  Fügen Sie schlussendlich der Grafik aussagekräftige
        Beschriftungen, usw. bei.

5.  Warum funktioniert der folgende Befehl nicht?

```{r}
df <- tibble(
  x = rnorm(10000),
  y = rnorm(10000)
)
ggplot(df, aes(x, y)) +
  geom_hex() +
  scale_color_gradient(low = "white", high = "red") +
  coord_fixed()
```

6\. Überschreiben Sie die Aesthetics in dem folgenden Befehl, um die
Legende anschaulicher zu machen.

```{r}
ggplot(diamonds, aes(carat, price)) +
  geom_point(aes(colour = cut), alpha = 1/20)
```

7.  Zeichnen Sie ein Streudiagramm von `Sepal.Width` und `Sepal.Length`
    des `iris` Datensatzes.
    1.  Färben Sie die Punkte gemäß der Spezies ein.

    2.  Fügen Sie Linien für jede Spezies hinzu und ändern Sie die
        `linetype`.

    3.  Markieren Sie die kleinste und größte Pflanze jeder Spezies mit
        Pfeilen und Label.

    4.  Beschriften Sie die Legende, Achsen und Titel sinnvoll.

## Lösungen

### Erstellen Sie eine beliebige Grafik des `diamonds` Datensatzes und fügen Sie der Grafik einen Überschrift (`title)`, einen Untertitel (`subtitle`), eine "Unterschrift" (`caption`) und Beschriftungen der x-und y-Achse (`x` und `y`) sowie ein Farblabel bei.

Im folgenden Beispiel sehen wir die `x`-und `y`-Werte der Diamanten,
wobei Farbgradienten und Achsen angepasst wurden:

```{r}
library(viridis)
ggplot(diamonds, aes(x, y)) + 
	geom_hex() +
	scale_fill_viridis(begin = 0.4, end = 0.8, option = "A") +
	scale_x_continuous(breaks = seq(3, 15, 3), limits = c(3, 12), name = "y-Dimension") +
	scale_y_continuous(breaks = seq(3, 12, 3), limits = c(3, 12), name = "x-Dimension") +
	labs(caption = "Vergrößerte Ansicht",
			 title = "Die meisten Diamanten weisen einen x-und y-Werte zwischen 3 und 12 auf",
			 subtitle = "Besonders interessant ist der scheinbar lineare Zusammenhang",
			 fill = "Anzahl")
```

### Verwenden Sie `geom_text()`, um Text in jede Ecke dieser Grafik zu zeichnen.

```{r}
label <- tibble(
	x = c(Inf, Inf, -Inf, -Inf),
	y = c(Inf, -Inf, Inf, -Inf),
	label = c("RO", "RU", "LO", "LU"),
	vjust = c("top", "bottom", "top", "bottom"),
	hjust = c("right", "right", "left", "left")
)
ggplot(diamonds, aes(x, y)) + 
	geom_hex() +
	scale_fill_viridis(begin = 0.4, end = 0.8, option = "A") +
	scale_x_continuous(breaks = seq(3, 15, 3), limits = c(3, 12), name = "y-Dimension") +
	scale_y_continuous(breaks = seq(3, 12, 3), limits = c(3, 12), name = "x-Dimension") +
	labs(caption = "Vergrößerte Ansicht",
			 title = "Die meisten Diamanten weisen einen x-und y-Werte zwischen 3 und 12 auf",
			 subtitle = "Besonders interessant ist der scheinbar lineare Zusammenhang",
			 fill = "Anzahl") +
	geom_text(data = label, mapping = aes(label = label, vjust = vjust, hjust = hjust))
```

### Schauen Sie in die Beispiele der `?annotate()` Funktion und fügen Sie mit Hilfe dieser Text in eine Grafik ein ohne vorher einen zusätzlichen `tibble` zu erstellen.

```{r}
label <- tibble(
	x = c(Inf, Inf, -Inf, -Inf),
	y = c(Inf, -Inf, Inf, -Inf),
	label = c("RO", "RU", "LO", "LU"),
	vjust = c("top", "bottom", "top", "bottom"),
	hjust = c("right", "right", "left", "left")
)
ggplot(diamonds, aes(x, y)) + 
	geom_hex() +
	scale_fill_viridis(begin = 0.4, end = 0.8, option = "A") +
	scale_x_continuous(breaks = seq(3, 15, 3), limits = c(3, 12), name = "y-Dimension") +
	scale_y_continuous(breaks = seq(3, 12, 3), limits = c(3, 12), name = "x-Dimension") +
	labs(caption = "Vergrößerte Ansicht",
			 title = "Die meisten Diamanten weisen einen x-und y-Werte zwischen 3 und 12 auf",
			 subtitle = "Besonders interessant ist der scheinbar lineare Zusammenhang",
			 fill = "Anzahl") +
	geom_text(data = label, mapping = aes(label = label, vjust = vjust, hjust = hjust)) +
	annotate("text", x = 7.5, y = 7.5, label = "Mittelpunkt")
```

### Erstellen Sie ein Streudiagramm von `displ` und `hwy` des `mpg` Datensatzes.

```{r}
ggplot(mpg, aes(displ, hwy)) +
	geom_point()
```

#### Filtern Sie zusätzlich für jeden Autotyp `class` nach dem effizientesten Auto.

```{r}
eff <- mpg %>%
    group_by(class) %>%
    slice_max(hwy)
```

#### Markieren Sie diese Autos farblich anders als den Rest.

```{r}
ggplot(mpg, aes(displ, hwy)) +
	geom_point() +
	geom_point(data = eff, color = "red")
```

#### Fügen Sie mit `geom_segment` und `arrow()` Pfeile in die Grafik ein, die auf die Punkte zeigen.

```{r}
ggplot(mpg, aes(displ, hwy)) +
	geom_point() +
	geom_point(data = eff, color = "red") +
	geom_segment(data = eff, mapping = aes(xend = displ + 0.3, yend = hwy + 1),
							 arrow = arrow(ends = "first", length = unit(0.1, "in"), type = "closed"))
```

#### Fügen Sie zusätzlich Label an das Ende der Pfeile ein, die das Automodell beschreiben.

```{r}
# Zuerst muss definiert werden, wo die Label stehen sollen (z.B. am Ende der Pfeile)
label <- eff %>%
	mutate(hwy = hwy + 1.5,
				 displ = displ + 0.6)
ggplot(mpg, aes(displ, hwy)) +
	geom_point() +
	geom_point(data = eff, color = "red") +
	geom_segment(data = eff, mapping = aes(xend = displ + 0.3, yend = hwy + 1),
							 arrow = arrow(ends = "first", length = unit(0.1, "in"), type = "closed")) +
	geom_text(data = label, mapping = aes(label = model))
```

Hierbei überlappen sich die Label im oberen Bereich. Stattdessen kann
auch `geom_label_repel()` aus `ggrepel` verwendet werden.

```{r}
library(ggrepel)
ggplot(mpg, aes(displ, hwy)) +
	geom_point(aes(color = class)) +
	geom_point(data = eff, color = "black") +
	geom_label_repel(data = eff, aes(label = model),
    arrow = arrow(length = unit(0.02, "npc")),
    box.padding = 1, point.padding = 1
  )
```

#### Fügen Sie schlussendlich der Grafik aussagekräftige Beschriftungen, usw. bei.

In diesem Fall wurde die Legende noch unter die Grafik geschoben und die
Transparenz angepast.

```{r}
ggplot(mpg, aes(displ, hwy)) +
	geom_point(aes(color = class), alpha = 0.4) +
	geom_point(data = eff, color = "black", alpha = 0.4) +
	geom_label_repel(data = eff, aes(label = model),
    arrow = arrow(length = unit(0.02, "npc")),
    box.padding = 1, point.padding = 1
  ) +
	labs(x = "Hubraum (l)",
			 y = "Kraftstoffverbrauch (Gallone pro Meile)",
			 title = "Kraftstoffeffizienz fällt tendenziell mit steigendem Hubraum",
			 subtitle = "Von jeder Autoklasse wurden die effizientesten Autos markiert") +
	guides(colour = guide_legend(nrow = 1, override.aes = list(size = 3, alpha = 1))) +
	theme(legend.position = "bottom")
```

### Warum funktioniert der folgende Befehl nicht?

Bei dem Befehl wurde als Aesthetic `color` angegeben an Stelle von
`fill`, sodass die Füllfarbe nicht verändert wurde. Wenn `color` durch
`fill` in der Skalierung angepasst wird, funktioniert der Befehl wie
erwartet:

```{r}
df <- tibble(
  x = rnorm(10000),
  y = rnorm(10000)
)
ggplot(df, aes(x, y)) +
  geom_hex() +
  scale_fill_gradient(low = "white", high = "red") +
  coord_fixed()
```

### Überschreiben Sie die Aesthetics in dem folgenden Befehl, um die Legende anschaulicher zu machen.

Durch das Setzen des `alpha`-Werts der Aesthetic sind die Punkte in der
Legende ebenfalls transparent. Durch das Überschreiben der Legende durch
`guides()` und dem Argument `colour` sowie `override.aes` lassen sich
die Änderungen in der Grafik für die Legende anderweitig überschreiben
(z. B. mit `alpha = 1`):

```{r}
ggplot(diamonds, aes(carat, price)) +
  geom_point(aes(colour = cut), alpha = 1/20) +
	guides(colour = guide_legend(override.aes = list(alpha = 1)))
```

### Zeichnen Sie ein Streudiagramm von `Sepal.Width` und `Sepal.Length` des `iris` Datensatzes.

```{r}
ggplot(iris, aes(Sepal.Width, Sepal.Length)) +
	geom_point()
```

#### Färben Sie die Punkte gemäß der Spezies ein.

```{r}
ggplot(iris, aes(Sepal.Width, Sepal.Length, color = Species)) +
	geom_point()
```

#### Fügen Sie Linien für jede Spezies hinzu und ändern Sie die `linetype`.

```{r}
ggplot(iris, aes(Sepal.Width, Sepal.Length, color = Species)) +
	geom_point() +
	geom_smooth(aes(linetype = Species), se = FALSE)
```

#### Markieren Sie die kleinste und größte Pflanze (bezüglich Sepal) jeder Spezies mit Pfeilen und Label.

```{r}
# Entweder nach Sepal.Width oder Sepal.Length filtern
# Alternativ kann auch versucht werden, die größte/kleinste Summe zu suchen
max <- iris %>%
	group_by(Species) %>%
	slice_max(Sepal.Width + Sepal.Length)
min <- iris %>%
	group_by(Species) %>%
	slice_min(Sepal.Width + Sepal.Length)
ggplot(iris, aes(Sepal.Width, Sepal.Length, color = Species)) +
	geom_point() +
	geom_smooth(aes(linetype = Species), se = FALSE) +
	geom_label_repel(data = max, mapping = aes(label = "Max"),
									 arrow = arrow(type = "closed", length = unit(0.2, "cm")),
									 box.padding = 1, point.padding = 1) +
	geom_label_repel(data = min, mapping = aes(label = "Min"),
									 arrow = arrow(type = "closed", length = unit(0.2, "cm")),
									 box.padding = 1, point.padding = 1)
```

#### Beschriften Sie die Legende, Achsen und Titel sinnvoll.

```{r}
ggplot(iris, aes(Sepal.Width, Sepal.Length, color = Species)) +
	geom_point() +
	geom_smooth(aes(linetype = Species), se = FALSE) +
	geom_label_repel(data = max, mapping = aes(label = "Maximum"),
									 arrow = arrow(type = "closed", length = unit(0.2, "cm")),
									 box.padding = 1, point.padding = 1) +
	geom_label_repel(data = min, mapping = aes(label = "Minimum"),
									 arrow = arrow(type = "closed", length = unit(0.2, "cm")),
									 box.padding = 1, point.padding = 1) +
	theme(legend.position = "bottom") +
	labs(x = "Kelchblattbreite", y = "Kelchblattlänge", 
			 title = "Die unterschiedlichen Irisarten weisen abweichende (lineare) Größenverhältnisse auf",
			 subtitle = "Setosa scheint kleiner als die anderen Irisarten zu sein", 
			 colour = "Spezies", linetype = "Spezies")
```
