Donnerstag, 4. Dezember 2014

Einstieg in R

Um die Leistungsfähigkeit von R in vollem Umfang zu nutzen, ist es unumgänglich, die Programmiersprache R zu lernen. Das Lernen einer Programmiersprache ist allerdings nicht ganz trivial, vor allem dann nicht, wenn man noch keine Erfahrung im Schreiben von Programmen hat.

Da die R Community ausgesprochen aktiv ist, findet man bei der Online-Suche schnell eine enorme Vielzahl an Anleitungen, Handbüchern, Präsentationen und Kursen. Aus eigener Erfahrung eignen sich folgende kostenlose Angebote für den ersten Kontakt mit R.

Swirl
Swirl ist ein Software Paket für die R Programmierumgebung, das die R Konsole in eine interaktive Lernumgebung (Tutorial) verwandelt. Der Benutzer wird in mehren Lektionen in Data Science und R Programmierung eingeführt. Die Lektionen können in einem selbst bestimmten Tempo absolviert werden und der Benutzer erhält nach jedem Schritt unmittelbar Rückmeldung. Je nach Interessensgebiet können weitere Module bearbeitet werden. Dieser Kurs setzt eine lokale Installation von R voraus.

http://swirlstats.com/


Datacamp.com
Das Mission Statement von Datacamp lautet vielversprechend.
We are and will be working non-stop to deliver anyone, teacher and student,
with the best learning experience for data science and statistics.
Neben kostenpflichtigen Kursen die sich eher an Fortgeschrittene wenden, bietet Datacamp auch qualitativ hochwertige kostenlose Kurse an:

Der Kurs Introduction to R richtet sich an Personen, welche R für ihre Prüfungen, Forschungsprojekte oder andere berufliche Ziele verwenden wollen. Programmierkenntnisse oder Kenntnisse in Data Science werden nicht vorausgesetzt. Der Kurs vermittelt Kenntnisse zu den elementaren Datentypen in R und wird in einer Online-R-Umgebung durchgeführt. Eine lokale Installation von R ist nicht nötig.

Der ebenfalls kostenlose Kurs Data Analysis and Statistical Inference ist ein Begleitkurs mit praktischen Übungen zum ebenfalls empfehlenswerten Open-Source Lehrbuch OpenIntro Statistics (2nd ed). Der Kurs ist in eine Online-R-Umgebung eingebettet und in neun Lektionen gegliedert:

  1. Introduction to R
  2. Introduction to data
  3. Probability
  4. Foundations for inference: Sampling distributions
  5. Foundations for inference: Confidence intervalls
  6. Inference for numerical data
  7. Inference for categorical data
  8. Introduction to linear regression
  9. Multiple linear regression
Sowohl der Kurs als auch das Lehrbuch sind didaktisch sehr gut aufgebaut.

http://www.datacamp.com/

Wegleitung zur Arbeit mit R Commander



R Commander ist ein GUI für R und erleichtert Studierenden in einem Statistik-Grundkurs die Arbeit mit R, da sie die wichtigsen statistische Prozeduren auch ohne Programmierkenntnisse ausführen können. Hier kann eine Wegleitung in deutscher Sprache und ein einfacher Übungsdatensatz heruntergeladen werden.

Diese Wegleitung wird regelmässig überarbeitet. Kommentare, Hinweise und Korrekturen werden gerne entgegengenommen.

Download Wegleitung
Download Übungsdatensatz

Von Hasen und Drachen




Die New York Times/Science hat kürzlich einen Artikel zur Bedeutung der Normalverteilung in der Statistik publiziert. Der Artikel wird durch ein wunderbares Video illustriert. Unbedingt ansehen!

Alternativ: Youtube-Link zum Video

R Psychologist




Kristoffer Magnusson ist ein schwedischer PhD-Student in Psychologie und betreibt den Blog R Psychologist der sich den Themen Statistik, Psychologie, Open Science und Datenvisualisierung widmet. Besonders gefallen mir folgende Beiträge:

Interpreting Confidence Intervals
Interpreting Correlations
Understanding Significance Testing and Statistical Power
Interpreting Cohen's d effect size
Visualizing a One-Way ANOVA
How to tell when error bars correspond to a significant p-value