Einführung

Was ist R?

  • R ist eine statistische Programmierumgebung für numerische und graphische Datenanalyse
  • R basiert auf der Programmiersprache S und wurde anfänglich entwickelt von Ross Ithaka und Robert Gentleman
  • R ist frei erhältlich unter der GNU GPL Lizenz
  • Wird aktiv weiterentwickelt (2 Releases pro Jahr)
  • Offizielle R Homepage http://www.R-project.org

Woher bekomme ich R?

R besteht aus der Basisdistribution (base) und einer Vielzahl (Stand 04.10.2015: 7264) von Zusatzpaketen (contrib). Im Kurs arbeiten wir mit der Basisdistribution und ein paar weiteren Zusatzpakten, auf die wir später genauer eingehen.

Alles ist erhältlich über das Comprehensive R Archive Network http://CRAN.R-project.org

Dort gibt es R Distributionen für

Wer benutzt R?

R kann eine stetig wachsende "Fangemeinde" vorweisen. Im aktuellen IEEE spectrum ranking hat R den größten Sprung in den Top 10 gemacht. Eine Aufstellung von Firmen, die R nutzen findet man auf der Webseite von Revolution Analytics.

Interessante Beiträge von R Nutzern findet man z.B. auf den Seiten

Die Konferenz EARL 2015 hatte verschiedene Anwendungsmöglichkeiten von R zum Thema.

Die ersten Schritte mit R?

R besitzt keine eigene komfortable Benutzeroberfläche. Kommandos werden am Prompt eingegeben:

> 2 + 2
## [1] 4
> x <- 3.14
> sin(x)
## [1] 0.001592653
> (z <- 3 : 6)
## [1] 3 4 5 6

RStudio

RStudio ist ein integrierte Entwicklungsumgebung für R. Sie ist ebenfalls frei erhältlich über die Webseite http://www.rstudio.com

Im Kurs werden wir intensiv mit RStudio arbeiten. Speziell werden wir das Paket rmarkdown nutzen, welches stark in RStudio integriert ist. rmarkdown kombiniert Markdown Syntax mit R Befehlen (und deren Output). Dies ermöglicht eine einfache Erstellung dynamischer (reproduzierbarer) Dokumente.

Es existieren weitere grafische Benutzeroberflächen wie z.B. der RCommander, Tinn-R, Emacs Speaks Statistics oder Verknüpfungen zu beispielsweise Excel (RExcel). Auf diese wird im Kurs aber nicht weiter eingegangen.

Literatur

Der Kurs sowie diese Unterlagen basieren auf den beiden Quellen

Das Buch Programmieren mit R ist als eBook erhältlich. Es ist Teil des Springer Informatik Pakets der Bibliothek. Zum Buch Advanced R, gibt es auch eine eigene Webseite: http://adv-r.had.co.nz/

Natürlich gibt es zu R eine Vielzahl weiterer Literaturquellen, siehe z.B. http://www.r-project.org/doc/bib/R-books.html. Für den Kurs sind die angegebenen Quellen aber mehr als ausreichend.