Statistik für Jedermann

ArticleCategory:

Applications

AuthorImage:

[Photo of the Author]

TranslationInfo:

original in en Jürgen Pohl

en to de Jürgen Pohl

AboutTheAuthor:

Jürgen Pohl arbeitet als Entwicklungsingenieur und Übersetzer an der Pazifikküste der USA.

Abstract:


Die meisten Statistik-Pakete sind in ihrem Umfang etwas überwältigend, sie zwingen den Benutzer auf einen steilen Lernpfad, ausserdem sind sie teuer. Es existieren jedoch einige hilfreiche Alternativen für jene, die solche am dringendsten benötigen: Anfänger, die gerade in die magische Welt der Statistik einsteigen und jene, für welche die umfangreichen kommerziellen Pakete einfach zu umfangreich sind. SalStat ist eine der gewünschten Alternativen - dank seines Schöpfers ist es Open Source, d.h. es ist gratis! Ein weiterer Vorteil: das Programm läuft auf den meisten Plattformen und ist sehr benutzerfreundlich.
Das Programm ist in Python geschrieben, es kann jedoch ohne Vorkenntnisse dieser Sprache benutzt werden. Auf der Homepage des Programms ist eine deutsche Version des Handbuchs zu finden.

ArticleIllustration:[Das Titelbild des Artikels]

[Logo]

ArticleBody:

SalStat - das Statistikprogramm

Einleitung

Mit seiner eigenen Erfahrung im Hintergrund, war sich der Entwickler von SalStat wohl bewusst, in welcher Klemme sich die neu in die Statistik Eingeführten befinden: um ihr neues Wissen aufzubauen (oder einfach ihre Hausaufgaben oder ein Projekt auszuführen), ist ein erschwingliches, benutzerfreundliches Statistikprogramm erforderlich. Mit diesen Gedanken begann Alan James Salmoni SalStat zu entwickeln. Es wurde unter der GNU-Lizenz veröffentlicht, es ist auf seiner Homepage zu finden.

Was kann man mit SalStat anfangen?

Leider kann dieser Artikel keine Einführung in die Statistik anbieten, in ('Ressourcen') finden sich einige Quellen zu dem Thema.
Nachfolgend die Listen mit den Statistiken und Tests die SalStat ausführen kann.

Parametrische and Nicht-parametrische Tests sind hier zusammengefasst:

N (Gesamtumfang) Bereich
Summe Anzahl der fehlenden Zellen
Mittelwert geometrisches Mittel
Varianz harmonisches Mittel
Standardabweichung Schiefe
Standardfehler Kurtosis
Quadratsumme Medianwert
Summe der Abweichungsquadrate durchschnittliche absolute Abweichung
Varianzkoeffizient Modalwert, häufigster Wert
Minimum Quartilabstand
Maximum Anzahl der spezifischen Datennivaus

Inferenzstatistik

t-Test (paarweise) Pearsons Korrelation
t-Test (nicht-paarweise) Spearmans Rangkorrelation
Vorzeichentest mit einer Stichprobe Kendallsche Rangkorrelation
Vorzeichentest mit zwei Stichproben Punktbiseriale Korrelation r
F-Test, Varianzverhältnistest Lineae Regression
Wilcoxon Rangsummentest Einfaktorvarianzanalyse (zwischen Datenreihen)
Mann-Whitney U-Test Einfaktorvarianzanalyse (innerhalb einer Datenreihe)
Kolmogorov-Smirnov-Test Kruskall-Wallis H-Test
Paarweiser Permutationstest Friedmantest

Wie arbeitet man mit SalStat?

Bevor wir einen Blick auf SalStat werfen können, muss das Programm auf unserer Maschine installiert sein, darauf kommen wir jedoch später - einleitend möchte ich einen Eindruck von dem Programm geben.
Beim Öffnen des Programms erscheinen zwei Fenster auf dem Bildschirm (ich muss hier einflechten, dass das Programm nicht lokalisiert ist, d.h. alle Werkzeuge, Auswahllisten, usw. sind in Englisch, z.Z. gibt es jedoch eine deutschsprachige Version des Benutzerhandbuchs - es kann von der Homepage heruntergeladen werden):


SalStat Statistics Main Window


Das Fenster im Vordergrund oben (betitelt 'SalStat Statistics') ist im Tabellenformat: hier geben wir unsere zu analysierenden Daten ein. Am oberen Rand des Fensters das Menü mit den üblichen Werkzeugen - klicken wir auf ein Werkzeug, öffnet sich die zugehörige Dropdownliste zur Auswahl.

Das zweite Fenster ('SalStat Statistcs - Output') ist beim Öffnen leer, dort werden nach Durchführung des Tests die Ergebnisse ausgegeben.


Um dem Einstiegsfrust vorzubeugen, hat der Autor von SalStat in weiser Voraussicht eine Testdatei beigefügt (testreport1.txt). Wir geben also die Daten aus dieser Datei in unsere Tabelle ein, wählen die gewünschten Statistiken und Tests - nach Bestätigung mit 'Okay' wird kurz darauf das Ergebnis im Output-Fenster erscheinen.
Der Screenshot unten zeigt diesen Vorgang in dieser Reihenfolge:


  1. Wir tragen die Daten der Testdatei in die Spalten A, B, C der Tabelle ein ('SalStat Statistics'-Fenster, unten links oben).
  2. In der Werkzeugleiste wählen wir 'Analyse'. Im folgenden Dropdownmenü wählen wir den 'One Condition Test' (nur ein Beispiel...).
  3. Das 'One Condition Test'-Fenster öffnet sich. Hier markieren wir in den Abhakkästchen unsere gewünschten Statistiken und Test(s):
  4. Wir klicken auf 'Okay' und das vorher leere 'SalStat Statistics - Output'-Fenster zeigt uns die Ergebnisse.

Test File

SalStat herunterladen und installieren

Das Programm kann von seiner Homepage. heruntergeladen werden. Dort finden wir einige Alternativen, um den entsprechenden Betriebssystemen gerecht zu werden. Ich habe zum Beispiel das Programm auf zwei Desktopmaschinen mit unterschiedlichen Betriebssystemen laufen. Der Sourcecode steht ebenfalls zur Verfügung - vielleicht möchte jemand seine Pythonerfahrung demonstrieren und zur Erweiterung des Programms beitragen... Vor der Installation bitte den 'Basic Users Guide' lesen, der auf der SalStat-Homepage unter 'Documentation'zu finden ist. Die Instruktionen dort sind sehr klar, so dass wir diese hier nicht wiederholen müssen.


SalStat Einstellungen

Eine sehr nützliche Eigenschaft von Salstat ist die Möglichkeit, durch Skripts persönliche Einstellungen vornehmen zu können, um Vorgänge zu automatisieren, eigene Tests zu bauen, usw. Im Handbuch (deutsche Version herunterladen, falls nötig) finden wir ausführliche Beschreibungen zum Skripting im Anhang C - API-Details zum Skripting, das ist auch eine gute Einführung zu diesem Thema, der Benutzer sollte sich ermutigt fühlen, Skripts zu schreiben.
Das letzte Werkzeug der Analyse-Dropdownliste führt direkt zum Skriptingfenster ('Scripting Window'), hier werden wir unsere Skripts eingeben: probieren wir doch einige von den Beispielen, die im Handbuch aufgeführt sind, gar nicht so schwierig, oder...?

Um weitgehende persönliche Anpassungen am Programm vornehmen zu können, sind Kenntnisse in Python Voraussetzung - in dieser Sprache ist das Programm geschrieben. Glücklicherweise ist Python eine freie Sprache, sie kann also gratis heruntergeladen werden. Ausführliche Einführungen und Dokumentation für Anfänger und Experten stehen auf der Python-Webseite zur Verfügung.
Falls sich Ihnen bei dem Gedanken die Haare sträuben - na ja, SalStat kann einfach benutzt werden wie es ist - mit Pythonkenntnissen könnten Sie eventuell mehr aus dem Programm herausholen.

Fazit

Die Grundidee für SalStat entsprang dem vielfachen Wunsch, ein einfaches Programm zur Verfügung zu stellen, das den Einsteiger ermutigt und den seriösen Benutzer ebenfalls zufriedenstellen kann. Der Benutzer kann sich in der gewohnten Weise einfach durch die Menüs der Statistiken und Tests klicken. Das Handbuch gibt Anweisungen für die Tests, ausserdem einige Hinweise über den Wert der Ergebnisse. Ganz allgemein wird jedoch vorausgesetzt, dass der Benutzer mindestens Grundkenntnisse der Statistik hat oder dabei ist, diese zu erwerben.

Eine Warnung: bevor Sie versuchen, Ihre Karriere als zukünftiger Wissenschaftler auf Daten aufbauen, die Sie mit diesem Programm erzeugt haben, hören Sie auf die Empfehlung des Programmentwicklers und testen Sie das Programm. Anfänger können wahrscheinlich Beispiele mit Testergebnissen in ihren Fachbüchern finden. Tragen Sie einige Daten von Testbeispielen in Salstat ein und vergleichen Sie die Ergebnisse mit denen, die mittels anderer Programme gefunden wurden. Die Testdatei (testreport1.txt) ist ein Anfang, dort sind auch Vergleiche mit den Ergebnissen von Tests mit anderen Programmen aufgeführt.

Resources

Wer mit Hilfe seiner bevorzugten Suchmaschine im WWW wühlt, kann in Bezug auf Statistik viele Quellen finden, die besten und umfassensten scheinen in Englisch zu sein.