[[Vorlage(Getestet, focal)]] {{{#!vorlage Wissen [:Pakete_installieren: Installation von Programmen] [:Terminal: Ein Terminal öffnen] }}} [[Inhaltsverzeichnis(2)]] [[Bild(./rlogo.jpg, 48, align=left)]] [http://www.r-project.org GNU R] {en} ist eine freie Programmiersprache und Umgebung für statistische Berechnungen und Grafiken unter Linux, Windows und macOS. R ist eine freie Implementierung der statistischen Programmiersprache [wikipedia:S_(Statistiksprache):S] bzw. S-Plus. Es stellt eine Alternative zu anderen kommerziellen Statistikprogrammen wie [wikipedia:Stata:] oder [:SPSS:] und anderen freien Programmen wie PSPP und [:Gretl:] dar. Während R selbst eine reine Kommandozeilenanwendung ist, ermöglichen [#Grafische-Benutzer-und-Entwicklungs-Oberflaechen grafische Benutzer- und Entwicklungs-Oberflächen] einen leichteren Zugang. Eine Auswahl an Einführungen in die Benutzung von R ist am [#Links Ende] dieses Artikels zu finden. = Installation = R besteht aus einem Basisprogramm sowie einer Vielzahl von ergänzenden R-Paketen (engl. "packages") mit Funktions-Sammlungen. Für eine Basisinstallation muss das folgende Ubuntu-Paket installiert werden: {{{#!vorlage Paketinstallation r-base, universe }}} = Grafische Benutzer- und Entwicklungs-Oberflächen = Die Basisinstallation umfasst keine grafische Benutzeroberfläche. Die statistischen Operationen werden rein über Text-Befehle ausgeführt. Es gibt aber eine Reihe von Benutzeroberflächen, die separat installiert werden können und die interaktive Arbeit mit R erleichtern. Dies reicht von simplen Editoren mit Syntaxhervorhebung über integrierte Entwicklungsumgebungen ("IDEs"), welche Daten, Befehle und Plots anzeigen, bis hin zu grafischen Anwendungen, die statistische Funktionen über Menüs und Dialoge zur interaktiven Datenanalyse zugänglich machen. == RStudio Desktop == [[Bild(./rstudio_logo.png, 48, align=right)]] [http://rstudio.com RStudio Desktop] {en} ist eine umfangreiche Entwicklungsumgebung für R und quasi Standard für anspruchsvolle Anwender und Entwickler von R-Skripten und R-Paketen. Es bietet auch eine gute [:Git:Git]-Unterstützung zur Versionierung der R-Skripte. Zur Installation von RStudio kann man von der Homepage ein Fremdpaket im '''.deb'''-Format [http://www.rstudio.com/products/rstudio/download/ herunterladen] {dl}. Die anschließende Installation wird im Artikel [:Paketinstallation_DEB:] beschrieben. [[Vorlage(Fremd, Paket, "")]] [[Bild(./rstudio.png, 200, align=right)]] Wenn man RStudio öffnet, sieht man vier Bereiche: * einen Editor für R-Skripte (links oben), * eine R-Kommandozeile mit ausgeführten Kommandos und zur interaktiven Nutzung (links unten), * die geladenen Daten und Variablen (rechts oben) sowie * einen Bereich für Plots und Grafiken, Online-Hilfe, Projekt-Dateien und installierte R-Pakete (rechts unten). Im Kommandozeilenfenster kann man direkt Befehle ausführen wie zum Beispiel simple Berechnungen {{{#!vorlage Befehl a <- 1 b <- 2 a + b }}} Das Ergebnis wird im Kommandozeilenfenster ausgegeben und die angelegten Variablen a und b im Datenfenster angezeigt. Eine etwas interessantere Funktion ist zum Beispiel das Plotten eines Histogramms von zufälligen normal-verteilten Daten. Hierzu kann man im Skriptfenster die folgenden Befehle eingeben: {{{#!vorlage Befehl # rnorm() = random normal distribution (zum Erzeugen von Zufallszahlen) # Funktions-Signatur: rnorm(n, mean, sd) y <- rnorm(100, 5, 1) hist(y) }}} Zum Ausführen selektiert man die Befehle im Editor klickt auf ''"Run"''. In diesem Beispiel werden 100 normal-verteilte Zufallswerte mit Mittelwert 5 und Standardabweichung 1 generiert. Von diesem Datenvektor wird dann ein Histogramm rechts unten angezeigt. R enthält auch Beispieldaten, die zu Demonstrations- und Schulungszwecken verwendet werden können. Das folgende Beispiel lädt einen Datensatz über Luftqualität und plottet dann die Ozonwerte gegenüber den Windmessungen in diesem Demodatensatz: {{{#!vorlage Befehl data("airquality") head(airquality) plot(airquality$Wind, airquality$Ozone) }}} Der Screenshot oben zeigt das Resultat. == RKWard == [:RKWard:] ist ein KDE-Projekt und nicht nur eine grafische Entwicklungsumgebung für R, sondern bietet auch eine Palette von statistischen Funktionen direkt über Menüs und Dialoge an zur interaktiven Arbeit mit Daten an. RKWard kann über das folgende Ubuntu-Paket installiert werden: [[Bild(./rkward.png, 200, align=right)]] {{{#!vorlage Paketinstallation rkward, universe }}} == Weitere grafische Anwendungen == Es gibt noch einige weitere grafische Anwendungen, die aber teilweise etwas komplexere Installationsprozeduren haben und auch meist nicht direkt aus den Paketquellen installiert werden können: * [https://www.rforge.net/JGR/ JGR] {en} (sprich: Jaguar, Java GUI für R) * [http://www.deducer.org Deducer] {en} * [https://projects.eclipse.org/projects/science.statet StatET] {en} Auf [:Eclipse:] basierende [:IDE:] für R * [https://rattle.togaware.com Rattle] {en} = Kommandozeilennutzung = R kann auch direkt im Terminal gestartet werden: {{{#!vorlage Befehl R }}} Es öffnet sich ein Befehlsprompt, in dem R-Befehle direkt eingegeben werden können. Die umfangreiche Hilfe von R lässt sich mit dem Befehl: {{{#!vorlage Befehl help.start() }}} in einem Browser aufrufen. Die oben in der Beschreibung von RStudio aufgeführten R-Skripte können hier auch direkt eingeben werden. Beim Drücken der Eingabetaste wird jeder Befehl sofort "interaktiv" ausgeführt. Um R zu beenden, führt man den Befehl {{{#!vorlage Befehl q() }}} aus. Die Nachfrage, ob der "Workspace" gespeichert werden soll, sollte in der Regel mit `n` (nein) beantworten, da sonst beim nächsten Start von R die gespeicherten Daten und Variablen wieder automatisch geladen werden. Das R-Terminal bietet zudem Befehlsvervollständigung mit [[Vorlage(Tasten,tab)]] und eine Historie der zuletzt ausgeführten Befehle mit den Tasten [[Vorlage(Tasten,rauf)]] und [[Vorlage(Tasten,runter)]]. Neben dem interaktiven Modus, kann R auch zur Abarbeitung von Skripts verwendet werden. Der Befehl: {{{#!vorlage Befehl R --no-save < skript.R }}} führt die R-Befehle in ''skript.R'' aus und schreibt die Ausgabe direkt ins Terminal. Etwaige Plots werden in der Datei ''Rplots.pdf'' abgelegt. = Zusätzliche R-Pakete installieren = Eine große Stärke von R ist die einfache Erweiterbarkeit um neue Funktionen durch die Installation von sog. R-Paketen. Diese R-Pakete enthalten oft auch die Funktions-Dokumentation (Hilfe) und eine einführende Dokumentation ("Vignette"). Für R-Pakete gibt es verschiedene Paket-Quellen: * [https://cran.r-project.org/ CRAN (The Comprehensive R Archive Network)] {en} - R hat mit CRAN (einem Pendant zu CPAN für Perl und CTAN für TeX) seine eigene offizielle Paketverwaltung für qualitätsgesicherte R-Pakete. * [https://www.github.com Github] {en} - Dort kann man den neusten Quellcode von vielen R-Paketen finden und selbst kompilieren und installieren (z. B. das bekannte Logging-Paket [https://github.com/zatonovo/futile.logger futile.logger] {en}). Viele CRAN-R-Pakete sind hier als neuste (u. U. noch nicht auf CRAN veröffentlichte Version) zu finden und können genutzt werden, wenn man z. B. dringend einen Bug-Fix benötigt. * Andere Quellen wie [https://www.bioconductor.org/ Bioconductor] {en} Die Sektion `universe` der offiziellen Ubuntu-Paketquellen enthält eine Reihe von weiteren R-Paketen, deren Namen alle mit '''r-cran''' beginnen ([packages:r-cran:Übersicht]) und mit [:APT:] installiert werden können. Sollte ein Zusatzpaket nicht über die Ubuntu-Paketverwaltung verfügbar sein, kann man dies auch direkt aus R heraus installieren: {{{#!vorlage Befehl install.packages(c("futile.logger","paket2")) }}} Die [https://cran.r-project.org/ CRAN Website] {en} bietet hierzu weitere Informationen. Empfehlung: Grundsätzlich sollte man unter Ubuntu bevorzugt die Ubuntu-Pakete für R-Pakete installieren, weil man so eine R-Umgebung bekommt, mit der man Verarbeitungsergebnisse gut auf anderen Ubuntu-Computern reproduzieren kann. Die direkte Installation von R-Paketen in R (z. B. von CRAN) sollte man dann wählen, wenn man neuere R-Pakete benötigt (wegen Bug-Fixes oder neuen Funktionen). Je nach Installations-Art (Ubuntu-Paketverwaltung vs. direkt in R) werden die R-Pakete in unterschiedlichen Pfaden installiert, die man in R mit {{{#!vorlage Befehl > .libPaths() [1] "/home/user1/R/x86_64-pc-linux-gnu-library/3.6" "/usr/local/lib/R/site-library" [3] "/usr/lib/R/site-library" "/usr/lib/R/library" }}} abrufen kann. Hat man das gleiche R-Paket sowohl über die Ubuntu-Paketverwaltung als auch direkt in R installiert, entscheidet der obige Suchpfad, welches R-Paket zuerst gefunden und geladen wird. = Links = == Intern == ## * [:PSPP:] - Statistikprogramm mit SPSS-kompatibler Syntax * [:Gretl:] - Regressions- und Zeitreihen-Analysen == Extern == * [https://www.r-project.org/ r-project.org] {en} - offizielle Seite mit Einführungen, Referenzen, FAQs, Büchern, etc. * [https://stackoverflow.com/questions/tagged/r Stackoverflow (Tag "R")] - Umfangreicher inoffizieller Anwender-Support für alle Fragen rund um R * [https://www.r-bloggers.com/ r-bloggers] {en} - umfangreiche zentrale Blog-Aggregator auf Basis von vielen dezentralen Blogs rund um R * [http://de.wikibooks.org/wiki/GNU_R wikibooks] {de} - deutschsprachige R Dokumentation bei Wikibooks * [http://www.twotorials.com/ twotorials] {en} - Serie von 2-Minuten Videos über R * [https://www.rdocumentation.org rdocumentation.org] {en} - Befehlsreferenz mit interaktiven Beispielen, (z.B. für [https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/plot plot]) * [http://www.math.csi.cuny.edu/Statistics/R/simpleR/ simpleR] {en} - Sehr gut verständliche englische Einführung in R, 08/2002 * [https://cran.r-project.org/bin/linux/ubuntu/fullREADME.html CRAN Readme] {en} - neuere R Version installieren * [http://www.pro-linux.de/artikel/2/1661/gpu-computing-mit-r.html GPU-Computing mit R auf Nvidia CUDA] {de} - Pro-Linux, 12/2013 # tag: Bildung, Büro, Mathematik, Statistik, Wissenschaft, Programmierung