Från http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

Matstat-kurser fokuserar oftast helt på Model-steget, denna kurs har ambitionen att beröra de övriga.
Bild från: http://r4ds.had.co.nz/introduction.html
Reproducibility is the ability to get the same research results or inferences, based on the raw data and computer programs provided by researchers. (Wikipedia)
Allt skrivet i kod (inget klickande eller klippande/klistrande av resultat/tabeller/figurer)
Portabelt (koden skall vara körbar, inte bara på din dator idag)
Tillgängligt (andra skall enkelt kunna ta del av och reproducera din analys)
Automatiserat från rådata till rapport (en knapptyckning skall räcka för att generera slutprodukten)
summary(mtcars$mpg) summary(mtcars$"mpg") summary(mtcars[, "mpg"]) summary(mtcars["mpg"]) summary(mtcars[["mpg"]]) summary(mtcars[1]) summary(mtcars[, 1]) summary(mtcars[[1]]) with(mtcars, summary(mpg)) attach(mtcars); summary(mpg) summary(subset(mtcars, select=mpg))
En serie R-paket med stort inflytande från Hadley Wickham på RStudio. Snabba, konsistenta och ändamålsenliga funktioner. Fokus i denna kurs.
Vi behöver automatiskt kombinera text, resultat, tabeller och figurer.
Bild från https://rosannavanhespenresearch.files.wordpress.com/
Ett märkspråk (markup language) för typsättning.
En utveckling av Markdown som inkluderar körbar kod.
En mjukvara för versionshantering och en webbaserad lagringstjänst.
Bild från http://phdcomics.com/comics/archive.php?comicid=1531
Inte nödvändigt för reproducerbarhet, men ett måste för stora projekt som pågår under lång tid. Mest en bieffekt av att vi använder GitHub i denna kurs.
Ger även .Rproj för ökad portabilitet.
Allt skrivet i kod: R
Portabelt: .Rproj (RStudio)
Tillgängligt: GitHub
Automatiserat: R Markdown
Ger grundläggande träning och förberedelse inför lektion. Inte betygsgrundande, men lektioner och handledning kommer förutsätta att de är gjorda.
1/2: Sebastian Tengborg
19/2: Mehrdad Mamaghani