Piraten suchten einst mithilfe vergilbter Schatzkarten und dem darauf plakativ angebrachten X nach großen Schätzen. Und auch wenn einige Unverdrossene auch heute noch die Karibik nach Überbleibseln wertvoller Ladungen durchkämmen, die wahren Schatzsucher unserer Zeit sitzen vor Monitoren. Denn längst haben Unternehmen erkannt, dass sich in großen Datensätzen oft Muster verstecken, die helfen Probleme zu lösen oder schlicht den Ertrag steigern.
Zwar müssen die Schatzsucher vor den Monitoren ohne so eindeutige Hinweise auskommen wie ihre Vorgänger. Doch im Grunde genommen benötigen sie auch kein "X", denn die moderne Suche gilt nicht einem bestimmten Datensatz, sondern den Mustern, die sich darin verbergen. Und sind die Datensätze sehr groß, lassen sich diese oft sehr komplexen Muster nur noch durch automatisierte Analysen finden. Genau das ist die Leistung, die maschinelles Lernen (Machine Learning, ML) erbringt. Integriert in eine Software, hilft maschinelles Lernen durch automatische Mustererkennung, klügere Anwendungen zu entwickeln.
Sollen beispielsweise bei einer Bank die Verluste durch Kreditkartenbetrug verringert werden, versteckt sich der Schlüssel dazu womöglich in den Nutzerdaten. Ein erster Verdacht des Bank-Managements wäre vielleicht, dass bestimmte Personengruppen zum Missbrauch der Kreditkarte neigen. Allerdings wäre die Behauptung, bestimmte Länder seien die Hauptquelle derartiger Verbrechen, auf den ersten Blick ebenso valide. Auf Basis dieser Annahmen ließe sich gewiss von einigen klugen Entwicklern ein Programm schreiben, dass den Kreditkartenbetrug verringert.
Die Bank will nun aber Klarheit und geht die Analyse der Kundendaten an. Dabei ist es naheliegend, dass die Untersuchung einer zu kleinen Stichprobe zu falschen Schlussfolgerungen führen kann. Etwa dass alle Kunden, deren Nachname mit "P"
...Der komplette Artikel ist nur für Abonnenten des ADMIN Archiv-Abos verfügbar.