Statistische Auswertung
Die statistische Datenanalyse dient der Aufbereitung und Darstellung von Daten zur Überprüfung von Hypothesen und zur Ableitung von Gestaltungs- und Handlungsempfehlungen. Hier bieten wir Unterstützung bei allen Stufen des Analyseprozesses. Dazu gehören…
- die Auswahl der geeigneten deskriptiven und inferenzstatistischen Verfahren je nach Fragestellung, Art und Umfang der vorliegenden Daten,
- die Aufbereitung der Daten, ihre Überprüfung und Verdichtung, z.B. die Prüfung auf Kohärenz, Datenaggregationen und Missinganalysen,
- die Durchführung der ausgewählten Verfahren mit Unterstützung der geeigneten Statistikprogramme: Von gängigen Verfahren wie z.B. t-Tests, Varianz- und Zusammenhangsanalysen hin zu Strukturgleichungsmodellen,
- und nicht zuletzt die Interpretation der Analyseergebnisse und Bewertung ihrer Aussagekraft unter Berücksichtigung der statistischen Signifikanz, ihrer praktischen Bedeutsamkeit und bestehender methodischer Limitationen.
Die Ergebnisse bereiten wir – wenn gewünscht auch gemäß wissenschaftlicher Standards – in Bild und Schrift auf.
Maschinelles Lernen
Maschinelles Lernen bezeichnet im Allgemeinen ein künstliches System, welches aus Beispielen lernt und nach Beendigung der Lernphase in der Lage ist, bestimmte Aussagen über die Lerndaten zu treffen.
Mit Hilfe von maschinellen Lernverfahren können verschiedenste Fragestellungen untersucht werden. Zum einen können in Versuchsdaten vorhandene, jedoch durch übliche statistische Verfahren nicht zu detektierende Gesetzmäßigkeiten erkannt werden („unüberwachtes maschinelles Lernen“). Aus den erkannten Zusammenhängen können deskriptive Modelle für eine weitere Untersuchung erstellt werden. Zum anderen können bei vorhandenem Vorwissen – beispielsweise über Klassenzugehörigkeiten – mehrdimensionale Funktionen zur Trennung der verschiedenen Klassen erzeugt werden. Mit Hilfe dieser Hyperebenen können prädiktive Modelle zur Vorhersage von Klassenzugehörigkeiten für zukünftig zu erhebende Datensätze generiert werden („überwachtes maschinelles Lernen“).
Eine typische Vorgehensweise wäre folgende: Aus den vorhandenen Versuchsdaten werden möglichst aussagekräftige Merkmale extrahiert, welche durch Merkmalsreduktionsverfahren auf die für die Klassifizierung relevanten verringert werden. Ein oder mehrere maschinelle Lernalgorithmen (z.B. Support Vector Machines, Künstliche Neuronale Netze) erzeugen aus diesen Merkmalsdatensätzen Modelle, mit denen die entsprechende Fragestellung weiter untersucht werden kann.