2. Machine Learning

Was ist Machine Learning?

Machine Learning ist ein Teilbereich der künstlichen Intelligenz. Es ermöglicht Computern, aus Daten zu lernen und ihre Leistung im Laufe der Zeit zu verbessern. Anstatt einem Computer genau vorzugeben, was er machen soll, gibt man ihm Beispiele und lässt ihn selbstständig Muster und Regeln erkennen.

Schlüsselkonzepte im Machine Learning

Wenn Maschinen lernen, durchlaufen sie einen Prozess namens Training. Dabei analysieren sie bekannte Daten, um Muster und Zusammenhänge zu erkennen. Anschließend wird das System mit neuen, bisher unbekannten Daten getestet, um zu überprüfen, wie gut es das Gelernte anwenden kann.

Wie funktioniert Machine Learning?

  1. Daten Erhebung
    Der Prozess beginnt mit der Erfassung von Daten aus unterschiedlichen Quellen, etwa aus Dateien, Datenbanken, Sensoren oder Online-Aktivitäten. Diese Rohdaten bilden die Grundlage für alle weiteren Schritte. Die Qualität und Menge der Daten beeinflussen den Erfolg des maschinellen Lernmodells erheblich.

  2. Bereinigung, Vorbereitung & Bearbeitung der Daten
    Nachdem die Daten gesammelt wurden, müssen sie bereinigt und vorbereitet werden. Dabei werden fehlende Werte bearbeitet, Unstimmigkeiten korrigiert, die Daten in ein geeignetes Format (z.B. numerische Werte) konvertieren und gegebenenfalls neue Merkmale erstellt. Dieser Prozess ist besonders wichtig, da maschinelle Lernmodelle nur dann zuverlässig arbeiten können, wenn die Daten gut strukturiert und sorgfältig aufbereitet sind.

  3. Modelltraining
    In dieser Phase werden die vorbereiteten Daten verwendet, um ein maschinelles Lernmodell zu trainieren. Der Algorithmus erhält die Daten, um darin Muster und Zusammenhänge zu erkennen. Während des Trainings passt das Modell seine inneren Einstellungen Schritt für Schritt an, damit es immer bessere Vorhersagen treffen kann.

  4. Datentest
    Nach dem Training wird das Modell mit neuen, bisher unbekannten Daten (sogenannten Testdaten) geprüft. Dadurch lässt sich einschätzen, wie gut das Modell auf reale Situationen übertragbar ist. Um die Leistung des Modells zu beurteilen, werden u.a. Werte wie Genauigkeit, Präzision und Recall gemessen.

  5. Verbesserungen
    Nach den Testergebnissen muss das Modell möglicherweise angepasst oder neu trainiert werden. Eventuell müssen mehr Daten gesammelt, andere Merkmale ausgewählt, andere Algorithmen ausprobiert oder die Modellparameter optimiert werden. Dieser Schritt wird häufig wiederholt, um die Leistung des Modells im Laufe der Zeit zu verbessern.