Daten einlesen

Für Mac-NutzerInnen

Table of Contents


Einleitung

Im Psychologiestudium kommt man um „R“ nicht herum, und das aus gutem Grund, denn es ist kostenlos und bietet viele Möglichkeiten der Datenanalyse. Den meisten Studierenden fällt die Anwendung von R aber nicht leicht. Im Folgenden werden wir eine detaillierte Anleitung zum Einlesen von Daten in R-Studio geben.

Vorab: Installation von R und R Studio

Um mit R Studio arbeiten zu können, müssen sowohl R als auch R-Studio installiert worden sein. Verschiedene Versionen von R für Mac OS X kann man unter diesem Link herunterladen. Jetzt kann man auch die aktuellste oder eine ältere R-Studio-Version installieren. Es sollte darauf geachtet werden, dass die mit dem Betriebssystem kompatiblen Versionen ausgewählt werden.


Beim Einlesen von Daten in R geschehen in der Regel zwei Dinge. Zum einen werden die Informationen, die oftmals in einem Datenfile (Textdatei, Excel-Sheet, SPSS Datenformat, etc.) gespeichert sind, ausgelesen. Zum anderen wird auf Basis dieser Daten innerhalb der R-Umgebung ein sogenanntes Datenobjekt erzeugt, oftmals in Form eines Data Frames.

Im Folgenden gehen wir die einzelnen Schritte bzw. die verschiedenen Wege zum Einlesen von Dateien durch. Grundsätzlich kann man die grafische Benutzeroberfläche von R Studio oder Funktionen nutzen. Exemplarisch schauen wir uns das für zwei weit verbreitete Arten von tabellarischen Daten an: .csv- und .txt-Dateien. Die Endung .csv steht für comma separated values; .txt steht für Textdatei.

Was ist eine grafische Benutzeroberfläche?

Die Grafische Benutzeroberfläche, oder auch Benutzungsschnittstelle, wird häufig auch mit GUI (Graphical User Interface) abgekürzt. Durch diese kann man mit der Maus auf Symbole und andere Steuerelemente klicken anstatt Funktionen in der Konsole auszuführen.


1. Datei herunterladen

Die erste Frage, die sich stellt, ist, wie man an die Datenfiles kommt, die man einlesen möchte. Tatsächlich existieren hier unterschiedliche Wege. Im Rahmen eines Experimentes können Datenfiles selbst erstellt werden, z.B. in Excel (.xlsx). In Seminaren oder Übungen werden dagegen meist fertige Datenfiles über Moodle bereitgestellt, oftmals im .txt- oder .csv-Format.

Im nachfolgenden Beispiel wird gezeigt, wie man eine csv-Datei aus einem Moodle-Kurs herunterladen, auf der Festplatte des Computers speichern und in R-Studio einlesen kann.

Google Chrome

Man wählt das Datenfile an, indem man gleichzeitig die Maustaste und die ctrl-Taste drückt (alternativ kann man einen Rechtsklick ausführen). Nun öffnet sich ein Menü, indem man die Option Link speichern unter… sowie anschließend den gewünschten Zielordner zur Ablage auswählt (siehe Abb. 1). Wenn man dies macht, befindet sich das Datenfile von Anfang an im richtigen Arbeits- bzw. Zielordner. Es sollte für jedes Projekt ein spezifischer Ordner angelegt werden.

Abb. 1: Herunterladen eines Datenfiles (Chrome)


Sehr wichtig ist es, sich immer zu merken, in welchem Ordner der heruntergeladene Datensatz gespeichert wird. Den Zielordner kann man finden, indem man im Browser rechts oben auf die drei Punkte klickt und den Menüpunkt Downloads anwählt (siehe Abb. 2). Es öffnet sich ein neuer Tab im Browser, in dem man dann die Option In Finder anzeigen auswählen kann. Anschließend öffnet sich der Finder und zeigt die betreffende Datei an.

Abb. 2: Finden des Downloadordners (Chrome)


Safari

Man öffnet die Datei im Browser (z.B. in einem neuen Tab oder Fenster), macht einen Rechtsklick (dabei darf nichts markiert sein) und klickt auf Seite sichern unter…. In dem Fenster, welches sich dann öffnet, muss man bei Format noch festlegen, dass man den Quelltext der Seite (und nicht das Webarchiv) herunterladen möchte (siehe Abb. 3). Auch hier kann man festlegen, wo die Datei gespeichert werden soll.

Hinweis: Manchmal wird man beim Speichern gefragt, ob die Endung .txt angehängt werden soll. Das sollte man verneinen, da ansonsten das Dateiformat geändert wird bzw. die Endung sich doppelt.