Update: 16.01.2019

Dies ist nur eine Zusammenfassung der Installation und Eingabe von Befehlen zur Berechnung verschiedener Daten. Den theoretischen Hintergrund hatte jemand anderer. Angaben ohne Gewähr!

Installation von R

Auf der R-Projektseite sucht man sich die passende Installationsdatei: Download / CRAN und jeweiliges Land.

Z.B. https://cran.wu.ac.at/ -> Download R for Windows -> base -> Download R 3.5.2 for Windows

Es wird gewarnt, dass für eine vollständige Installation die Installation als Administrator erfolgen muss. Somit bei Bedarf als Administrator installieren. Die Standard-Optionen dürften normalerweise passen.

Danach ist R im Startmenü unter R ausführbar.

Erster Start

R aufrufen. Als erstes ein Arbeitsverzeichnis festlegen: mit Menü-Punkt Datei / Verzeichnis wählen ein beschreibbares Verzeichnis wählen, z.B. Dieser PC / E:\ / Arbeit / R

Im Menü-Punkt Pakete / Setze CRAN-Mirror lässt sich das Land festlegen, aus welchem Pakete nachgeladen werden. In Pakete / Repositories legt man das Repository fest. Mit Installiere Paket installiert man ein Paket und mit Aktualisiere Paket aktualisiert man es.

Für bspw. edgeR die beiden Repositories CRAN und BioC software gleichzeitig wählen (beim Mausklick Tastaturtaste STRG halten) und Paket edgeR installieren.

Ist das Standard-Verzeichnis nicht beschreibbar wird empfohlen eine persönliche Bibliothek (personal library) anzulegen. Nach ja wird ein bestimmtes Verzeichnis empfohlen und ein zweites Mal gefragt. Durch ein nochmaliges ja werden ab nun alle Pakete in dieses Verzeichnis installiert.

Schlägt eine Installation wegen fehlender Schreibrechte fehl, könnte man die Pakete notfalls mit dem Administrator-Account installieren. Auch dann stehen die Pakete für alle Nutzer zur Verfügung.

Daten verarbeiten

Es hängt alles davon ab, welche Daten man hat und wie man sie bearbeiten möchte.

Ein Beispiel wäre folgendes:

Bibliothek edgeR laden

library(edgeR)

Daten als Tabelle einlesen; ein Header ist vorhanden und soll beim Einlesen ignoriert werden; der Name eines Gens ist der erste Wert in einer Reihe; die Daten werden in der Variable y gespeichert

y= read.table( "Galaxy_test1.txt", header=TRUE, row.names=1 )

eine Gruppierung festlegen: die ersten Werte sind eine Gruppe, die letzten drei sind eine weitere Gruppe

group <- factor(c(1,1,1,2,2,2))

auf die Tabelle die Gruppierung anwenden und das Ergebnis als Liste speichern; alle Null-Werte werden entfernt

genelist <- DGEList(counts=y,group=group,remove.zeros=TRUE)

die Liste normalisieren

genelist <- calcNormFactors(genelist)

ein Model erstellen und als design speichern

design <- model.matrix(~group)

eine zweite Liste anhand des gewünschten Models erstellen???

genelist2 <- estimateDisp(genelist, design)

berechnen???

fit <- glmFit(genelist2,design )

lrt <- glmLRT(fit)

tab <- topTags(lrt, n=Inf)

write.table(tab, file="mygenelist.txt")

Weitere Programme

Ebenfalls etwas hochgeladen, aber nicht beendet hatte ich zu Python und HTSeq.