NA in R – Umgang mit fehlenden Werten
|

NA in R – Umgang mit fehlenden Werten

Fehlende Werte sind in Datensätzen ein häufig auftretendes Problem, das besondere Herausforderungen an die Datenanalyse stellt. In R werden fehlende Werte als NA, also „not available“ bezeichnet. In diesem Blogpost wollen wir uns nochmals ansehen, wie man mit NA in R umgeht und dabei einige Fragen beantworten, die im früheren Beitrag noch nicht beantwortet wurden….

Zeichenketten in R

Zeichenketten in R

Wie extrahiere ich Informationen aus Zeichenketten in R? Heute zeige ich dir, wie du mit Zeichenketten arbeitest (auch „string“ genannt, oder „character“ in R). Dazu gehört, wie du Substrings ausliest, Strings auf bestimmte Muster prüfst, oder verschiedene Texte zusammenfügst. Zeichenketten in R Einführung Zeichenketten bzw. Strings in R sind vom Typ character und werden mit…

Das lubridate Package
|

Das lubridate Package

Heute schreibe ich über das lubridate Package, welches wir immer dann benutzen können, wenn wir mit Datumsvariablen in R umgehen müssen. Also, was macht lubridate so praktisch? Das lubridate-Package Erste Schritte mit lubridate und Daten vom Typ Date Im Folgenden werden wir einige Szenarios durchspielen, in denen wir das lubridate-Package dafür gut verwenden können. Wie…

Schleifen in R

Schleifen in R

Schleifen in R – das ist unser heutiges Thema. Wir behandeln for-Schleifen, while-Schleifen und schauen uns kurz zwei apply-Funktionen an, die häufig sehr hilfreich sind. Für einen Teil des Codes ist das data.table-Package notwendig. Für die Visualisierungen wird das ggplot2-Package benutzt. Schleifen in R Grundsätzlich wäre da erstmal die Frage: Was ist eine Schleife und…

Lists

Lists

Heute kommen wir zu einer weiteren Datenstruktur in R, nämlich den Listen. Mit diesem Post wird gleichzeitig die „Getting Started“-Kategorie etwas abrundet, da es jetzt zu allen grundlegenden Datenstrukturen einen Post gibt (Vektoren, Data Frames, Matrizen und Listen). Hat man diese verschiedenen Strukturen verstanden, fällt das Programmieren mit R schon wesentlich einfacher. Du weißt dann,…

Plots – Die Basics

Plots – Die Basics

„Ein Bild sagt mehr als tausend Worte“ Ein perfektes Sprichwort für das heutige Thema: Graphen bzw. „Plots“. Gerade zum Präsentieren von Ergebnissen statistischer Analysen sind sie unabdingbar. Eine Sache vorweg: Richtig schöne und komplexere Plots ermöglicht das Extra-Package ggplot2, das wiederum einen eigenen Post in der Zukunft verdient. Heute gehe ich nur auf die Möglichkeiten…

Datenstrukturen, Variablentypen und Sonderwerte

Datenstrukturen, Variablentypen und Sonderwerte

Um effektiv mit R programmieren zu können, ist es wichtig die grundlegenden Datenstrukturen, die wichtigsten Variablentypen, sowie spezielle Werte zu kennen (in einem der letzten Posts haben wir zum Beispiel schon das NA kennengelernt). Gerade am Anfang ist es gar nicht so einfach all das auseinanderzuhalten und deswegen möchte ich mit diesem Post etwas Überblick…

Funktionen in R

Funktionen in R

Was sind Funktionen und was haben Funktionen eigentlich mit dem Titelbild zu tun? Tatsächlich musste ich erstmal überlegen, was für ein Bild passend wäre für dieses Thema. „Funktion“ ist schon ein sehr abstrakter Begriff, zu dem man meistens Grafiken mit mathematischen Funktionen oder eben mit Programmiercode findet, wenn man nach entsprechenden Bildern im Internet sucht….

Missing Values

Missing Values

Im heutigen Post werde ich genauer auf fehlende Werte („missings“, „missing values“) eingehen. R hat einen eigenen Wert für fehlende Werte, nämlich NA (für „not available“). Missings können ein heikles Thema sein, aber wenn man damit umzugehen weiß, ist es alles nur noch halb so schlimm! Die Grundlagen Wir fangen mit den Grundlagen an. Wie…