R lernen

LERNE MIT R ZU PROGRAMMIEREN

____

R für Data Scientists, Studierende
und Hobbyprogrammierer:innen

R lernen mit R-Coding

Du möchtest R lernen oder deine Kenntnisse in der Programmierung mit R vertiefen? Perfekt – ich zeige dir hier alles von den Grundlagen bis hin zu den fortgeschrittenen Themen. Schau einfach auf meinem Blog vorbei oder schreib mir eine Mail, wenn du spezifische Fragen hast, die ich noch nicht in Angriff genommen habe!

Aktuelle Beiträge

  • NA in R – Umgang mit fehlenden Werten
    Fehlende Werte sind in Datensätzen ein häufig auftretendes Problem, das besondere Herausforderungen an die Datenanalyse stellt. In R werden fehlende Werte als NA, also „not available“ bezeichnet. In diesem Blogpost…
  • Data Science mit R
    Data Science ist ein interdisziplinäres Feld, das aus der Kombination von Programmierung, Statistik und Fachwissen in einem bestimmten Anwendungsbereich entsteht. R ist eine bekannte Programmiersprache, die sich im Laufe der…
  • Objektorientierte Programmierung mit R6
    Beim Programmieren gibt es verschiedene Ansätze und Paradigmen, um effizienten und gut organisierten Code zu schreiben. Ein bekanntes und weit verbreitetes Paradigma ist die objektorientierte Programmierung (OOP). Viele Herausforderungen in…

Warum R lernen?

R ist eine von Statistikern entwickelte Programmiersprache, die besonders für statistische Analysen geeignet ist. Sie ist eine freie Implementierung der Programmiersprache S, welche auch für die Verarbeitung statistischer Daten eingesetzt wird. R ist open source (d.h., der Quellcode ist öffentlich frei zugänglich und kann von jedem benutzt werden), kostenlos, und für verschiedene Betriebssysteme erhältlich. Zudem wird R regelmäßig weiterentickelt (vom „R Core Team“ angeleitet); es bleibt also aktuell und fehlerfrei, und wird kontinuierlich optimiert was z.B. Performance angeht.

RStudio und Git

R wird mit einer relativ spartanischen Oberfläche geliefert: Es ist eigentlich nur ein Interpreter (ein Programm, das den Code interpretiert und umsetzt), für den es eine Konsole (bzw. Kommandozeilenschnittstelle) gibt, um die Befehle bzw. ganze Scripte darin auszuführen. Entsprechend entstand das Programm RStudio, eine Entwicklungsumgebung für R. In RStudio hat man einen wesentlich besseren Überblick: Es beinhaltet auch eine Konsole und ein Fenster für ganze Skripte, bietet aber zusätzlich noch Übersichten über die definierten Variablen (inklusive Variablentypen und Werte) und Fenster für Dokumentation, erstellte Graphen, sowie einen Datei-Explorer. RStudio unterstützt des Weiteren Versionskontrolle via Git und das Erstellen und Ausführen von z.B. von R-Markdown-Dateien. Im Vergleich zu z.B. SPSS ist der Anfang allerdings etwas schwieriger mit R, da man nicht über eine graphische Oberfläche zu den gewünschten Ergebnissen kommt, sondern alles selbst als Code eingeben muss.

Bibliotheken für R

Für R gibt es etliche Pakete bzw. Bibliotheken, welche die Funktionalität stark erweitern. Es gibt tausende von diesen „packages“ und jede Zusatzbibliothek erfüllt einen bestimmten Zweck. So gibt es Pakete für Finanzanalyse (z.B. quantmod oder TTR), Web-Parsing (z.B. XML oder rvest), Datenbankzugriffe (z.B. RODBC oder RPostgreSQL), Visualisierungen (z.B. ggplot2, ggvis, oder htmlwidgets), oder welche, die das Schreiben von performantem Code ermöglichen (z.B. data.table oder Rcpp).

R lernen für Datenanalyse oder KI

R ist mittlerweile recht bekannt an Universitäten, welche häufig eigene Kurse für R anbieten und an denen Wissenschaftler R für ihre statistischen Analysen benutzen. Mit dem noch relativ neuen Big Data Hype und den Entwicklungen in den Bereichen maschnielles Lernen und künstlicher Intelligenz ist der Bekanntheitsgrad von R weiterhin gewachsen. Nach einer Umfrage von kdnuggets war R in 2016 die am häufigsten verwendete Programmiersprache für Data Science und R lernen lohnt sich auch noch heute. Besonders für komplexere Abläufe ist R gut geeignet; zum Beispiel, wenn es sich um größere Workflows handelt, welche verschiedenste Arten der Datenmanipulation oder das Erstellen individualisierter Reports beinhalten.