Lerne mit R zu programmieren
Du möchtest R lernen oder deine Kenntnisse in der Programmierung mit R vertiefen? Perfekt – ich zeige dir hier alles von den Grundlagen bis hin zu den fortgeschrittenen Themen. Schau einfach auf meinem Blog vorbei oder schreib mir eine Mail, wenn du spezifische Fragen hast, die ich noch nicht in Angriff genommen habe!
Lerne in verschiedenen Themengebieten
Der Blog umfasst zur Zeit vier Kategorien. Da aber immer mehr Posts dazukommen, wird es auch nach und nach mehr Themen geben, zu denen ich etwas schreiben werde. Hast du ein bestimmtes Problem bzw. ein Wunschthema? Schreib mir eine Mail an mail@r-coding.de oder benutze das Kontaktformular unten und ich werde darüber schreiben.
Allgemein
Unter der Kategorie Allgemein findest du News aus der R-Szene und zum Blogangebot – zum Beispiel meinen ersten Post.
Questions and Answers
In Questions and Answers findest du Posts, in denen ich Leserfragen mit Hilfe von Beispielen beantworte.
Getting Started
Unter Getting Started lernst du die Grundlagen von R kennen. Ich begleite dich Schritt für Schritt durch die Anfänge – vom Einrichten der Entwicklungsumgebung bis hin zu den Basics der Datenstrukturierung.
Automatisierung
In Automatisierung geht es darum, wie man R-Skripte bzw. ganze Workflows einfach und sicher automatisieren kann.
Fortgeschritten
In der Kategorie Fortgeschritten findest du – wie der Name schon sagt – Themen, die über die Grundlagen hinaus gehen und entsprechend etwas spezifischer sein können. Ein Beispiel ist die Fehlersuche via Debuggen.
Statistik
Unter Statistik werden bald Posts zu finden sein, die das Benutzen statistischer Methoden in R behandeln. Beispiele sind das Berechnen einer Varianzanalyse, das Durchführen einer Faktoranalyse, oder Clustering-Methoden.
Aktuelle Posts
Zeitreihen sind Datensätze, die in regelmäßigen Abständen über einen bestimmten Zeitraum erfasst werden, wie zum Beispiel tägliche Aktienkurse, monatliche Umsatzzahlen...
Wie kann ich JSON-Dateien in R einlesen oder aus R heraus schreiben? Immer mehr Daten werden im JSON-Format (JavaScript Object...
Excel-Dateien sind weit verbreitet Format und viele Menschen sind es gewohnt, Daten in Excel-Tabellen zu bearbeiten und zu speichern. Somit...
Was ist R überhaupt?
R ist eine von Statistikern entwickelte Programmiersprache, die besonders für statistische Analysen geeignet ist. Sie ist eine freie Implementierung der Programmiersprache S, welche auch für die Verarbeitung statistischer Daten eingesetzt wird. R ist open source (d.h., der Quellcode ist öffentlich frei zugänglich und kann von jedem benutzt werden), kostenlos, und für verschiedene Betriebssysteme erhältlich. Zudem wird R regelmäßig weiterentickelt (vom „R Core Team“ angeleitet); es bleibt also aktuell und fehlerfrei, und wird kontinuierlich optimiert was z.B. Performance angeht.
R wird mit einer relativ spartanischen Oberfläche geliefert: Es ist eigentlich nur ein Interpreter (ein Programm, das den Code interpretiert und umsetzt), für den es eine Konsole (bzw. Kommandozeilenschnittstelle) gibt, um die Befehle bzw. ganze Scripte darin auszuführen. Entsprechend entstand das Programm RStudio, eine Entwicklungsumgebung für R. In RStudio hat man einen wesentlich besseren Überblick: Es beinhaltet auch eine Konsole und ein Fenster für ganze Skripte, bietet aber zusätzlich noch Übersichten über die definierten Variablen (inklusive Variablentypen und Werte) und Fenster für Dokumentation, erstellte Graphen, sowie einen Datei-Explorer. RStudio unterstützt des Weiteren Versionskontrolle via Git und das Erstellen und Ausführen von z.B. von R-Markdown-Dateien. Im Vergleich zu z.B. SPSS ist der Anfang allerdings etwas schwieriger mit R, da man nicht über eine graphische Oberfläche zu den gewünschten Ergebnissen kommt, sondern alles selbst als Code eingeben muss.
Für R gibt es etliche Pakete bzw. Bibliotheken, welche die Funktionalität stark erweitern. Es gibt tausende von diesen „packages“ und jede Zusatzbibliothek erfüllt einen bestimmten Zweck. So gibt es Pakete für Finanzanalyse (z.B. quantmod oder TTR), Web-Parsing (z.B. XML oder rvest), Datenbankzugriffe (z.B. RODBC oder RPostgreSQL), Visualisierungen (z.B. ggplot2, ggvis, oder htmlwidgets), oder welche, die das Schreiben von performantem Code ermöglichen (z.B. data.table oder Rcpp).
R ist mittlerweile recht bekannt an Universitäten, welche häufig eigene Kurse für R anbieten und an denen Wissenschaftler R für ihre statistischen Analysen benutzen. Mit dem noch relativ neuen Big Data Hype und den Entwicklungen in den Bereichen maschnielles Lernen und künstlicher Intelligenz ist der Bekanntheitsgrad von R weiterhin gewachsen. Nach einer Umfrage von kdnuggets war R in 2016 die am häufigsten verwendete Programmiersprache für Data Science und R lernen lohnt sich auch noch heute. Besonders für komplexere Abläufe ist R gut geeignet; zum Beispiel, wenn es sich um größere Workflows handelt, welche verschiedenste Arten der Datenmanipulation oder das Erstellen individualisierter Reports beinhalten.