In der Vorlesung werden verschiedene Methoden des Best?rkenden Lernens (Reinforcement Learning) vorgestellt, die es der Maschine erlauben, algorithmisch schwer l?sbare Probleme mittels Trial & Error zu l?sen. Hierbei werden die Unterschiede zum ?berwachten Lernen (Supervised Learning) aufgezeigt und die Vor- und Nachteile, sowie typischen Problemstellungen des Best?rkenden Lernen beleuchtet.?Neben den theoretischen Grundlagen werden mehrere Herangehensweisen (Dynamische Programmierung, Monte Carlo Methoden, TD-Lernen, Funktionsapproximation) und Optimierungen (Eligibility Traces, Generalisierung & Funktionsapproximation, Hierarchisches Best?rkendes Lernen) vorgestellt.?Die in der Theorie gelernten Methoden und Verfahren werden im Rahmen der ?bung vertieft und von den Teilnehmern eigenst?ndig in vorgegebenen Szenarien implementiert. Als Abschlussprojekt wird in Kleingruppen jeweils eine Anwendung mit Best?rkendem Lernen implementiert.