NA in R – Umgang mit fehlenden Werten
|

NA in R – Umgang mit fehlenden Werten

Fehlende Werte sind in Datensätzen ein häufig auftretendes Problem, das besondere Herausforderungen an die Datenanalyse stellt. In R werden fehlende Werte als NA, also „not available“ bezeichnet. In diesem Blogpost wollen wir uns nochmals ansehen, wie man mit NA in R umgeht und dabei einige Fragen beantworten, die im früheren Beitrag noch nicht beantwortet wurden….

Data Science mit R
|

Data Science mit R

Data Science ist ein interdisziplinäres Feld, das aus der Kombination von Programmierung, Statistik und Fachwissen in einem bestimmten Anwendungsbereich entsteht. R ist eine bekannte Programmiersprache, die sich im Laufe der Jahre neben Python als beliebtes Werkzeug für Data Scientists etabliert hat. In diesem Post werfen wir einen Blick auf einige der wichtigsten Funktionen und Pakete,…

Objektorientierte Programmierung mit R6
|

Objektorientierte Programmierung mit R6

Beim Programmieren gibt es verschiedene Ansätze und Paradigmen, um effizienten und gut organisierten Code zu schreiben. Ein bekanntes und weit verbreitetes Paradigma ist die objektorientierte Programmierung (OOP). Viele Herausforderungen in der Datenanalyse oder Data Science kann man zwar ohne OOP angehen, doch das Wissen um OOP in R kann sich durchaus lohnen – z.B. wenn…

Zeitreihenanalyse in R

Zeitreihenanalyse in R

Zeitreihen sind Datensätze, die in regelmäßigen Abständen über einen bestimmten Zeitraum erfasst werden, wie zum Beispiel tägliche Aktienkurse, monatliche Umsatzzahlen oder jährliche Klimadaten. Die Analyse von Zeitreihen hilft uns, Muster und Trends in diesen Daten zu erkennen und zukünftige Werte vorherzusagen. In diesem Beitrag zeige ich dir, wie du mit der Programmiersprache R eine effektive…

JSON-Dateien in R
|

JSON-Dateien in R

 Wie kann ich JSON-Dateien in R einlesen oder aus R heraus schreiben? Immer mehr Daten werden im JSON-Format (JavaScript Object Notation) gespeichert oder z. B. in APIs (Application Programming Interfaces) verwendet. Auch in der Datenanalyse und -verarbeitung ist es wichtig, Daten im JSON-Format lesen und schreiben zu können. In diesem Post zeige ich, wie man…

Logistische Regression
|

Logistische Regression

Die logistische Regression ist ein wichtiger und häufig verwendeter Algorithmus in Statistik und Data Science. Noch besser: du kannst ihn in R ganz einfach implementieren. Der Algorithmus trifft Vorhersagen über die Wahrscheinlichkeit eines bestimmten Ereignisses und kommt deshalb bei Klassifikationsproblemen zum Einsatz. Es ist wie die lineare Regression ein Supervised Learning-Algorithmus. Supervised Learning ist eine…

Zeichenketten in R

Zeichenketten in R

Wie extrahiere ich Informationen aus Zeichenketten in R? Heute zeige ich dir, wie du mit Zeichenketten arbeitest (auch „string“ genannt, oder „character“ in R). Dazu gehört, wie du Substrings ausliest, Strings auf bestimmte Muster prüfst, oder verschiedene Texte zusammenfügst. Zeichenketten in R Einführung Zeichenketten bzw. Strings in R sind vom Typ character und werden mit…

Das lubridate Package
|

Das lubridate Package

Heute schreibe ich über das lubridate Package, welches wir immer dann benutzen können, wenn wir mit Datumsvariablen in R umgehen müssen. Also, was macht lubridate so praktisch? Das lubridate-Package Erste Schritte mit lubridate und Daten vom Typ Date Im Folgenden werden wir einige Szenarios durchspielen, in denen wir das lubridate-Package dafür gut verwenden können. Wie…