ubuntuusers.de

R

Dieser Artikel wurde für die folgenden Ubuntu-Versionen getestet:


Du möchtest den Artikel für eine weitere Ubuntu-Version testen? Mitarbeit im Wiki ist immer willkommen! Dazu sind die Hinweise zum Testen von Artikeln zu beachten.

Zum Verständnis dieses Artikels sind folgende Seiten hilfreich:

./rlogo.jpg GNU R 🇬🇧 ist eine freie Programmiersprache und Umgebung für statistische Berechnungen und Grafiken unter Linux, Windows und macOS. R ist eine freie Implementierung der statistischen Programmiersprache S bzw. S-Plus. Es stellt eine Alternative zu anderen kommerziellen Statistikprogrammen wie Stata oder SPSS und anderen freien Programmen wie PSPP und Gretl dar.

Während R selbst eine reine Kommandozeilenanwendung ist, ermöglichen grafische Benutzer- und Entwicklungs-Oberflächen einen leichteren Zugang. Eine Auswahl an Einführungen in die Benutzung von R ist am Ende dieses Artikels zu finden.

Installation

R besteht aus einem Basisprogramm sowie einer Vielzahl von ergänzenden R-Paketen (engl. "packages") mit Funktions-Sammlungen. Für eine Basisinstallation muss das folgende Ubuntu-Paket installiert werden:

  • r-base (universe )

Befehl zum Installieren der Pakete:

sudo apt-get install r-base 

Oder mit apturl installieren, Link: apt://r-base

Grafische Benutzer- und Entwicklungs-Oberflächen

Die Basisinstallation umfasst keine grafische Benutzeroberfläche. Die statistischen Operationen werden rein über Text-Befehle ausgeführt. Es gibt aber eine Reihe von Benutzeroberflächen, die separat installiert werden können und die interaktive Arbeit mit R erleichtern. Dies reicht von simplen Editoren mit Syntaxhervorhebung über integrierte Entwicklungsumgebungen ("IDEs"), welche Daten, Befehle und Plots anzeigen, bis hin zu grafischen Anwendungen, die statistische Funktionen über Menüs und Dialoge zur interaktiven Datenanalyse zugänglich machen.

RStudio Desktop

./rstudio_logo.png

RStudio Desktop 🇬🇧 ist eine umfangreiche Entwicklungsumgebung für R und quasi Standard für anspruchsvolle Anwender und Entwickler von R-Skripten und R-Paketen. Es bietet auch eine gute Git-Unterstützung zur Versionierung der R-Skripte.

Zur Installation von RStudio kann man von der Homepage ein Fremdpaket im .deb-Format herunterladen ⮷. Die anschließende Installation wird im Artikel Paketinstallation DEB beschrieben.

Hinweis!

Fremdpakete können das System gefährden.

./rstudio.png

Wenn man RStudio öffnet, sieht man vier Bereiche:

  • einen Editor für R-Skripte (links oben),

  • eine R-Kommandozeile mit ausgeführten Kommandos und zur interaktiven Nutzung (links unten),

  • die geladenen Daten und Variablen (rechts oben) sowie

  • einen Bereich für Plots und Grafiken, Online-Hilfe, Projekt-Dateien und installierte R-Pakete (rechts unten).

Im Kommandozeilenfenster kann man direkt Befehle ausführen wie zum Beispiel simple Berechnungen

a <- 1
b <- 2
a + b 

Das Ergebnis wird im Kommandozeilenfenster ausgegeben und die angelegten Variablen a und b im Datenfenster angezeigt.

Eine etwas interessantere Funktion ist zum Beispiel das Plotten eines Histogramms von zufälligen normal-verteilten Daten. Hierzu kann man im Skriptfenster die folgenden Befehle eingeben:

# rnorm() = random normal distribution (zum Erzeugen von Zufallszahlen)
# Funktions-Signatur: rnorm(n, mean, sd)
y <- rnorm(100, 5, 1)
hist(y) 

Zum Ausführen selektiert man die Befehle im Editor klickt auf "Run". In diesem Beispiel werden 100 normal-verteilte Zufallswerte mit Mittelwert 5 und Standardabweichung 1 generiert. Von diesem Datenvektor wird dann ein Histogramm rechts unten angezeigt.

R enthält auch Beispieldaten, die zu Demonstrations- und Schulungszwecken verwendet werden können. Das folgende Beispiel lädt einen Datensatz über Luftqualität und plottet dann die Ozonwerte gegenüber den Windmessungen in diesem Demodatensatz:

data("airquality")
head(airquality)
plot(airquality$Wind, airquality$Ozone) 

Der Screenshot oben zeigt das Resultat.

RKWard

RKWard ist ein KDE-Projekt und nicht nur eine grafische Entwicklungsumgebung für R, sondern bietet auch eine Palette von statistischen Funktionen direkt über Menüs und Dialoge an zur interaktiven Arbeit mit Daten an.

RKWard kann über das folgende Ubuntu-Paket installiert werden: ./rkward.png

  • rkward (universe)

Befehl zum Installieren der Pakete:

sudo apt-get install rkward 

Oder mit apturl installieren, Link: apt://rkward

Weitere grafische Anwendungen

Es gibt noch einige weitere grafische Anwendungen, die aber teilweise etwas komplexere Installationsprozeduren haben und auch meist nicht direkt aus den Paketquellen installiert werden können:

Kommandozeilennutzung

R kann auch direkt im Terminal gestartet werden:

R 

Es öffnet sich ein Befehlsprompt, in dem R-Befehle direkt eingegeben werden können. Die umfangreiche Hilfe von R lässt sich mit dem Befehl:

help.start() 

in einem Browser aufrufen.

Die oben in der Beschreibung von RStudio aufgeführten R-Skripte können hier auch direkt eingeben werden. Beim Drücken der Eingabetaste wird jeder Befehl sofort "interaktiv" ausgeführt. Um R zu beenden, führt man den Befehl

q() 

aus. Die Nachfrage, ob der "Workspace" gespeichert werden soll, sollte in der Regel mit n (nein) beantworten, da sonst beim nächsten Start von R die gespeicherten Daten und Variablen wieder automatisch geladen werden. Das R-Terminal bietet zudem Befehlsvervollständigung mit Tab ⇆ und eine Historie der zuletzt ausgeführten Befehle mit den Tasten und .

Neben dem interaktiven Modus, kann R auch zur Abarbeitung von Skripts verwendet werden. Der Befehl:

R --no-save < skript.R  

führt die R-Befehle in skript.R aus und schreibt die Ausgabe direkt ins Terminal. Etwaige Plots werden in der Datei Rplots.pdf abgelegt.

Zusätzliche R-Pakete installieren

Eine große Stärke von R ist die einfache Erweiterbarkeit um neue Funktionen durch die Installation von sog. R-Paketen. Diese R-Pakete enthalten oft auch die Funktions-Dokumentation (Hilfe) und eine einführende Dokumentation ("Vignette").

Für R-Pakete gibt es verschiedene Paket-Quellen:

  • CRAN (The Comprehensive R Archive Network) 🇬🇧 - R hat mit CRAN (einem Pendant zu CPAN für Perl und CTAN für TeX) seine eigene offizielle Paketverwaltung für qualitätsgesicherte R-Pakete.

  • Github 🇬🇧 - Dort kann man den neusten Quellcode von vielen R-Paketen finden und selbst kompilieren und installieren (z. B. das bekannte Logging-Paket futile.logger 🇬🇧). Viele CRAN-R-Pakete sind hier als neuste (u. U. noch nicht auf CRAN veröffentlichte Version) zu finden und können genutzt werden, wenn man z. B. dringend einen Bug-Fix benötigt.

  • Andere Quellen wie Bioconductor 🇬🇧

Die Sektion universe der offiziellen Ubuntu-Paketquellen enthält eine Reihe von weiteren R-Paketen, deren Namen alle mit r-cran beginnen (Übersicht) und mit APT installiert werden können.

Sollte ein Zusatzpaket nicht über die Ubuntu-Paketverwaltung verfügbar sein, kann man dies auch direkt aus R heraus installieren:

install.packages(c("futile.logger","paket2")) 

Die CRAN Website 🇬🇧 bietet hierzu weitere Informationen.

Empfehlung: Grundsätzlich sollte man unter Ubuntu bevorzugt die Ubuntu-Pakete für R-Pakete installieren, weil man so eine R-Umgebung bekommt, mit der man Verarbeitungsergebnisse gut auf anderen Ubuntu-Computern reproduzieren kann.

Die direkte Installation von R-Paketen in R (z. B. von CRAN) sollte man dann wählen, wenn man neuere R-Pakete benötigt (wegen Bug-Fixes oder neuen Funktionen).

Je nach Installations-Art (Ubuntu-Paketverwaltung vs. direkt in R) werden die R-Pakete in unterschiedlichen Pfaden installiert, die man in R mit

> .libPaths()
[1] "/home/user1/R/x86_64-pc-linux-gnu-library/3.6" "/usr/local/lib/R/site-library"                  
[3] "/usr/lib/R/site-library"                         "/usr/lib/R/library"   

abrufen kann.

Hat man das gleiche R-Paket sowohl über die Ubuntu-Paketverwaltung als auch direkt in R installiert, entscheidet der obige Suchpfad, welches R-Paket zuerst gefunden und geladen wird.

Intern

  • PSPP - Statistikprogramm mit SPSS-kompatibler Syntax

  • Gretl - Regressions- und Zeitreihen-Analysen

Extern

  • r-project.org 🇬🇧 - offizielle Seite mit Einführungen, Referenzen, FAQs, Büchern, etc.

  • Stackoverflow (Tag "R") - Umfangreicher inoffizieller Anwender-Support für alle Fragen rund um R

  • r-bloggers 🇬🇧 - umfangreiche zentrale Blog-Aggregator auf Basis von vielen dezentralen Blogs rund um R

  • wikibooks 🇩🇪 - deutschsprachige R Dokumentation bei Wikibooks

  • twotorials 🇬🇧 - Serie von 2-Minuten Videos über R

  • rdocumentation.org 🇬🇧 - Befehlsreferenz mit interaktiven Beispielen, (z.B. für plot)

  • simpleR 🇬🇧 - Sehr gut verständliche englische Einführung in R, 08/2002

  • CRAN Readme 🇬🇧 - neuere R Version installieren

  • GPU-Computing mit R auf Nvidia CUDA 🇩🇪 - Pro-Linux, 12/2013

Diese Revision wurde am 20. Februar 2022 10:13 von tuxifreund erstellt.
Die folgenden Schlagworte wurden dem Artikel zugewiesen: Programmierung, Bildung, Mathematik, Statistik, Büro, Wissenschaft