library(tidyverse) load("./data/imdb-students.RData") ## AUFGABE 1: Wie könnte eine alternative Schreibweise dieses ## Befehls aussehen? tail(imdb, 10) ## Lösung: imdb %>% tail(10) ## AUFGABE 2: Gib mir nur Episoden aus der 7. Staffel einer ## Serie. imdb %>% filter(season.no == 7) ## AUFGABE 3: Gib mir nur Episoden aus der 2. Staffel einer ## Serie UND deren Rating kleiner gleich 8 ist. imdb %>% filter(season.no == 2, episode.rating <= 8) ## AUFGABE 4: Wie viele Bewertungen wurden für die Serie ## 'The Wire' abgegeben? imdb %>% filter(show.title == "The Wire") %>% summarize(gesamtbewertungen = sum(episode.rating.count)) ## Aufgabe 5 und 6 ## z.B. wollen wir aus dem Datum der Ausstrahlung nur das ## Jahr der Ausstrahlung auslesen imdb %>% mutate( year = format(episode.airdate,"%Y") ) ## Korrektur imdb <- imdb %>% mutate( year = format(episode.airdate,"%Y"), year = as.numeric(year) ) ## AUFGABE: Berechne die Mittelwerte der Bewertung von Episoden die nach ## 2014 ausgestrahlt wurden und zwar gruppiert nach ## Shows imdb %>% filter(year > 2014) %>% group_by(show.title) %>% summarize(show.mittelwerte = mean(episode.rating)) ## Aufgabe: Im Datensatz gibt es Daten für die Netflix Serie ## "House of Cards". Allerdings gibt es schon einen ## Vorgänger der BBC. Diese ist im Datensatz ## mit dem Titel "House of Cards (1990)" enthalten. ## Doch welche der beiden Serien ist in den Augen ## der Bewertenden die bessere? ## Überlege einen geeigneten Vergleich imdb %>% filter(show.title == "House of Cards (1990)") %>% summarize(mittelalt = mean(episode.rating)) imdb %>% filter(show.title == "House of Cards") %>% summarize(mittelneu = mean(episode.rating)) imdb %>% filter(show.title %in% c("House of Cards (1990)", "House of Cards")) %>% group_by(show.title) %>% summarize(mittelwert = mean(episode.rating))