Clusterstabilität von Baumgart,  Andreas

Clusterstabilität

Konzepte und Einflussfaktoren

Clusterverfahren erfreuen sich im Rahmen des Data Mining einer großen Beliebtheit und werden in diesem Kontext besonders oft angewendet. Häufig wird jedoch außer Acht gelassen, dass die dabei erzielten Ergebnisse ohne eine theoretische Fundierung nicht über die Stichprobe hinaus auf die Grundgesamtheit verallgemeinert werden können.

Um eine solche Verallgemeinerung aus statistischer Sicht tätigen zu können, ist zunächst eine Betrachtung von Clusterverfahren im Allgemeinen unumgänglich, wobei die unterschiedlichen Ansätze der Verfahren besonders interessant sind. Aber auch eine saubere stochastische Spezifikation der Ausgangssituation, sowie die Analyse der Methoden zur Clustervalidierung sind Teil einer solchen Untersuchung.

Entscheidend für eine Verallgemeinerung ist die Veränderung der Clusterergebnisse beim statistischen Schluss von der Stichprobe auf die Population. Handelt es sich um einen stabilen Clusteralgorithmus, so kann davon ausgegangen werden, dass die Veränderungen gering sind. Neben einer formalen Definition von Stabilität werden als Analysegrundlage die klassischen Werkzeuge der robusten Statistik benötigt.

Bei der Analyse erweist sich die Datenrepräsentation als ein maßgeblicher Einflussfaktor. Am Beispiel der Netzwerkanalyse wird die Anwendbarkeit des entwickelten Clusterstabilitätsbegriffes gezeigt. Mit Hilfe von Wahrscheinlichkeitsnachbarschaften ist es möglich, einen verallgemeinerten Kommunitätsbegriff zu definieren.

Andreas Baumgart, Jahrgang 1982, studierte Wirtschaftsinformatik an der Universität Leipzig und der Westfälischen Wilhelms-Universität Münster. Im Anschluss war er als wissenschaftlicher Mitarbeiter am European Research Center for Information Systems (ERCIS) in Forschung und Lehre tätig. Im November 2013 erfolgte die Promotion zum Doktor der Wirtschaftswissenschaften.

> findR *
Produktinformationen

Clusterstabilität online kaufen

Die Publikation Clusterstabilität - Konzepte und Einflussfaktoren von ist bei Logos Berlin erschienen. Die Publikation ist mit folgenden Schlagwörtern verschlagwortet: Clusteranalyse, Clustervalidierung, Netzwerkanalyse, Robuste Statistik, Stabilität. Weitere Bücher, Themenseiten, Autoren und Verlage finden Sie hier: https://buch-findr.de/sitemap_index.xml . Auf Buch FindR finden Sie eine umfassendsten Bücher und Publikationlisten im Internet. Sie können die Bücher und Publikationen direkt bestellen. Ferner bieten wir ein umfassendes Verzeichnis aller Verlagsanschriften inkl. Email und Telefonnummer und Adressen. Die Publikation kostet in Deutschland 38.5 EUR und in Österreich 39.6 EUR Für Informationen zum Angebot von Buch FindR nehmen Sie gerne mit uns Kontakt auf!