R lernen

LERNE MIT R ZU PROGRAMMIEREN

____

R für Data Scientists, Studierende
und Hobbyprogrammierer:innen

R lernen mit R-Coding

Du möchtest R lernen oder deine Kenntnisse in der Programmierung mit R vertiefen? Perfekt – ich zeige dir hier alles von den Grundlagen bis hin zu den fortgeschrittenen Themen. Schau einfach auf meinem Blog vorbei oder schreib mir eine Mail, wenn du spezifische Fragen hast, die ich noch nicht in Angriff genommen habe!

Aktuelle Beiträge

  • Python in R
    Kann man Python in R ausführen? Ja, das geht! Die Kombination der leistungsstarken Funktionen von R und Python kann dir helfen, das Beste aus beiden Welten zu nutzen. Dank des…
  • Unit Tests in R
    Unit Tests sind ein wichtiger Bestandteil in der Softwareentwicklung. Mit Unit Tests kannst du sicherzustellen, dass einzelne Komponenten eines Programms richtig funktionieren. Sie können zum Beispiel die Zuverlässigkeit und Robustheit…
  • NA in R – Umgang mit fehlenden Werten
    Fehlende Werte sind in Datensätzen ein häufig auftretendes Problem, das besondere Herausforderungen an die Datenanalyse stellt. In R werden fehlende Werte als NA, also „not available“ bezeichnet. In diesem Blogpost…

Warum R lernen?

R ist eine von Statistikern entwickelte Programmiersprache, die besonders für statistische Analysen geeignet ist. Sie ist eine freie Implementierung der Programmiersprache S, welche auch für die Verarbeitung statistischer Daten eingesetzt wird. R ist open source (d.h., der Quellcode ist öffentlich frei zugänglich und kann von jedem benutzt werden), kostenlos, und für verschiedene Betriebssysteme erhältlich. Zudem wird R regelmäßig weiterentickelt (vom „R Core Team“ angeleitet); es bleibt also aktuell und fehlerfrei, und wird kontinuierlich optimiert was z.B. Performance angeht.

RStudio und Git

R wird mit einer relativ spartanischen Oberfläche geliefert: Es ist eigentlich nur ein Interpreter (ein Programm, das den Code interpretiert und umsetzt), für den es eine Konsole (bzw. Kommandozeilenschnittstelle) gibt, um die Befehle bzw. ganze Scripte darin auszuführen. Entsprechend entstand das Programm RStudio, eine Entwicklungsumgebung für R. In RStudio hat man einen wesentlich besseren Überblick: Es beinhaltet auch eine Konsole und ein Fenster für ganze Skripte, bietet aber zusätzlich noch Übersichten über die definierten Variablen (inklusive Variablentypen und Werte) und Fenster für Dokumentation, erstellte Graphen, sowie einen Datei-Explorer. RStudio unterstützt des Weiteren Versionskontrolle via Git und das Erstellen und Ausführen von z.B. von R-Markdown-Dateien. Im Vergleich zu z.B. SPSS ist der Anfang allerdings etwas schwieriger mit R, da man nicht über eine graphische Oberfläche zu den gewünschten Ergebnissen kommt, sondern alles selbst als Code eingeben muss.

Bibliotheken für R

Für R gibt es etliche Pakete bzw. Bibliotheken, welche die Funktionalität stark erweitern. Es gibt tausende von diesen „packages“ und jede Zusatzbibliothek erfüllt einen bestimmten Zweck. So gibt es Pakete für Finanzanalyse (z.B. quantmod oder TTR), Web-Parsing (z.B. XML oder rvest), Datenbankzugriffe (z.B. RODBC oder RPostgreSQL), Visualisierungen (z.B. ggplot2, ggvis, oder htmlwidgets), oder welche, die das Schreiben von performantem Code ermöglichen (z.B. data.table oder Rcpp).

R lernen für Datenanalyse oder KI

R ist mittlerweile recht bekannt an Universitäten, welche häufig eigene Kurse für R anbieten und an denen Wissenschaftler R für ihre statistischen Analysen benutzen. Mit dem noch relativ neuen Big Data Hype und den Entwicklungen in den Bereichen maschnielles Lernen und künstlicher Intelligenz ist der Bekanntheitsgrad von R weiterhin gewachsen. Nach einer Umfrage von kdnuggets war R in 2016 die am häufigsten verwendete Programmiersprache für Data Science und R lernen lohnt sich auch noch heute. Besonders für komplexere Abläufe ist R gut geeignet; zum Beispiel, wenn es sich um größere Workflows handelt, welche verschiedenste Arten der Datenmanipulation oder das Erstellen individualisierter Reports beinhalten.