Daten einlesen

Für Windows-NutzerInnen

Table of Contents


Einleitung

Im Psychologiestudium kommt man um „R“ nicht herum, und das aus gutem Grund, denn es ist kostenlos und bietet viele Möglichkeiten der Datenanalyse. Den meisten Studierenden fällt die Anwendung von R aber nicht leicht. Im Folgenden werden wir eine detaillierte Anleitung zum Einlesen von Daten in R-Studio geben.

Vorab: Installation von R und R Studio

Um mit R Studio arbeiten zu können, müssen sowohl R als auch R-Studio installiert worden sein. Die aktuelle R-Version für Windows kann hier runtergeladen werden; ältere Versionen unter diesem Link. Jetzt kann man auch die aktuellste oder eine ältere R-Studio-Version installieren. Es sollte darauf geachtet werden, dass die mit dem Betriebssystem kompatiblen Versionen ausgewählt werden.


Beim Einlesen von Daten in R geschehen in der Regel zwei Dinge. Zum einen werden die Informationen, die oftmals in einem Datenfile (Textdatei, Excel-Sheet, SPSS Datenformat, etc.) gespeichert sind, ausgelesen. Zum anderen wird auf Basis dieser Daten innerhalb der R-Umgebung ein sogenanntes Datenobjekt erzeugt, oftmals in Form eines Data Frames.

Im Folgenden gehen wir die einzelnen Schritte bzw. die verschiedenen Wege zum Einlesen von Dateien durch. Grundsätzlich kann man die grafische Benutzeroberfläche von R Studio oder Funktionen nutzen. Exemplarisch schauen wir uns das für zwei weit verbreitete Arten von tabellarischen Daten an: .csv- und .txt-Dateien. Die Endung .csv steht für comma separated values; .txt steht für Textdatei.

Was ist eine grafische Benutzeroberfläche?

Die Grafische Benutzeroberfläche, oder auch Benutzungsschnittstelle, wird häufig auch mit GUI (Graphical User Interface) abgekürzt. Durch diese kann man mit der Maus auf Symbole und andere Steuerelemente klicken anstatt Funktionen in der Konsole auszuführen.


1. Datei herunterladen

Die erste Frage, die sich stellt, ist, wie man an die Datenfiles kommt, die man einlesen möchte. Tatsächlich existieren hier unterschiedliche Wege. Im Rahmen eines Experimentes können Datenfiles selbst erstellt werden, z.B. in Excel (.xlsx). In Seminaren oder Übungen werden dagegen meist fertige Datenfiles über Moodle bereitgestellt, oftmals im .txt- oder .csv-Format. Im nachfolgenden Beispiel wird gezeigt, wie man unter Benutzung des Browsers Google Chrome ein Datenfile aus einem Moodle-Kurs herunterladen, auf der Festplatte des Computers speichern und in R-Studio einlesen kann.

Dazu begibt man sich in den entsprechenden Moodle-Kurs und wählt dann das Datenfile mit der rechten Maustaste an, wählt die Option Link speichern unter… sowie den gewünschten Zielordner zur Ablage aus (siehe Abb. 1).

Abb. 1: Herunterladen des Datenfiles neuro.csv aus Moodle


Sehr wichtig ist es, sich immer zu merken, in welchem Ordner der heruntergeladene Datensatz gespeichert wird. Es ist sinnvoll, ihn bereits jetzt in dem Ordner zu speichern, in welchem man auch sein R-Skript später speichern möchte. Unter Windows und im Browser Chrome kann man den Zielordner sehr leicht herausfinden, indem man im Browser rechts oben auf die drei Punkte klickt und den Menüpunkt Downloads anwählt (siehe Abb. 2). Es öffnet sich ein neuer Tab im Browser, in dem man dann die Option In Ordner anzeigen auswählen kann.

Abb. 2: Finden des Downloadordners



2. Verschieben der Datei in den Arbeitsordner

Häufig werden heruntergeladene Datenfiles unter Windows standardmäßig im Ordner Downloads gespeichert. Möchte man eine Datenanalyse durchführen, ist es aber von Bedeutung, dass sich alle Files, auf die man zurückgreifen möchte, sowie das Skript selbst, in demselben Ordner befinden. Daher sollte man für jedes neue Projekt einen neuen Ordner anlegen und die heruntergeladenen Datenfiles dorthin verschieben.

Dazu wählt dann mit Rechtsklick die Datei im Ordner aus, die verschoben werden soll, und klickt dann auf die Option Ausschneiden (siehe Abb. 3). Im Gegensatz zu Kopieren entfernt dabei Ausschneiden das File bereits aus dem ursprünglichen Ordner.