Hypothesentests und p-Werte
|

Hypothesentests und p-Werte

Hypothesentests sind eine grundlegende Methode in der Statistik, um zu bestimmen, ob eine bestimmte Annahme über die Daten wahrscheinlich zutrifft. Somit werden Tests auch häufig in Data Science verwendet (z.B. A/B-Tests). Heute werden wir uns damit beschäftigen, wie man Hypothesentests in R durchführt und wie man p-Werte interpretiert. Überblick Was sind Hypothesentests? Ein Hypothesentest ist…

Python in R

Python in R

Kann man Python in R ausführen? Ja, das geht! Die Kombination der leistungsstarken Funktionen von R und Python kann dir helfen, das Beste aus beiden Welten zu nutzen. Dank des reticulate-Pakets ist es möglich, Python-Code nahtlos in R-Skripten und RMarkdown-Dokumenten auszuführen. In diesem Beitrag zeige ich dir Schritt für Schritt, wie du das machen kannst….

Unit Tests in R
|

Unit Tests in R

Unit Tests sind ein wichtiger Bestandteil in der Softwareentwicklung. Mit Unit Tests kannst du sicherzustellen, dass einzelne Komponenten eines Programms richtig funktionieren. Sie können zum Beispiel die Zuverlässigkeit und Robustheit von Funktionen und Skripten gewährleisten. In diesem Post zeige ich, wie du Unit Tests in R mit dem Paket testthat erstellst und durchführst. Allgemeines zu…

NA in R – Umgang mit fehlenden Werten
|

NA in R – Umgang mit fehlenden Werten

Fehlende Werte sind in Datensätzen ein häufig auftretendes Problem, das besondere Herausforderungen an die Datenanalyse stellt. In R werden fehlende Werte als NA, also „not available“ bezeichnet. In diesem Blogpost wollen wir uns nochmals ansehen, wie man mit NA in R umgeht und dabei einige Fragen beantworten, die im früheren Beitrag noch nicht beantwortet wurden….

Data Science mit R
|

Data Science mit R

Data Science ist ein interdisziplinäres Feld, das aus der Kombination von Programmierung, Statistik und Fachwissen in einem bestimmten Anwendungsbereich entsteht. R ist eine bekannte Programmiersprache, die sich im Laufe der Jahre neben Python als beliebtes Werkzeug für Data Scientists etabliert hat. In diesem Post werfen wir einen Blick auf einige der wichtigsten Funktionen und Pakete,…

Objektorientierte Programmierung mit R6
|

Objektorientierte Programmierung mit R6

Beim Programmieren gibt es verschiedene Ansätze und Paradigmen, um effizienten und gut organisierten Code zu schreiben. Ein bekanntes und weit verbreitetes Paradigma ist die objektorientierte Programmierung (OOP). Viele Herausforderungen in der Datenanalyse oder Data Science kann man zwar ohne OOP angehen, doch das Wissen um OOP in R kann sich durchaus lohnen – z.B. wenn…

Zeitreihenanalyse in R

Zeitreihenanalyse in R

Zeitreihen sind Datensätze, die in regelmäßigen Abständen über einen bestimmten Zeitraum erfasst werden, wie zum Beispiel tägliche Aktienkurse, monatliche Umsatzzahlen oder jährliche Klimadaten. Die Analyse von Zeitreihen hilft uns, Muster und Trends in diesen Daten zu erkennen und zukünftige Werte vorherzusagen. In diesem Beitrag zeige ich dir, wie du mit der Programmiersprache R eine effektive…

JSON-Dateien in R
|

JSON-Dateien in R

 Wie kann ich JSON-Dateien in R einlesen oder aus R heraus schreiben? Immer mehr Daten werden im JSON-Format (JavaScript Object Notation) gespeichert oder z. B. in APIs (Application Programming Interfaces) verwendet. Auch in der Datenanalyse und -verarbeitung ist es wichtig, Daten im JSON-Format lesen und schreiben zu können. In diesem Post zeige ich, wie man…

Logistische Regression
|

Logistische Regression

Die logistische Regression ist ein wichtiger und häufig verwendeter Algorithmus in Statistik und Data Science. Noch besser: du kannst ihn in R ganz einfach implementieren. Der Algorithmus trifft Vorhersagen über die Wahrscheinlichkeit eines bestimmten Ereignisses und kommt deshalb bei Klassifikationsproblemen zum Einsatz. Es ist wie die lineare Regression ein Supervised Learning-Algorithmus. Supervised Learning ist eine…