In 2009 veröffentlichte Jonas Gehring seine Bachelorarbeit mit dem Thema Intelligente Objekterkennung für ein lernfähiges Carrerabahn-System.
Darin schrieb er unter anderem:
1.3 Das NeuroRacer-System
Der von Riedmiller et al. entwickelte NeuroRacer ist ein System, dass einen Rennwagen auf einer Carrerabahn steuern kann. Es verwendet das ebenfalls von Riedmiller et al. entworfene CLSquare-Framework, um durch optimierendes Lernen eine Strategie zur Steuerung zu entwickeln. Eine Kamera, die über der Strecke angebracht ist, liefert die für die Positionsbestimmung des Fahrzeugs verwendeten Bilddaten.
Intern wird die Strecke durch ein eindimensionales Modell repräsentiert, bei dem die aktuelle Position des Wagens im Intervall [0, 1] dargestellt wird.
1.4 Carrera Vision
Zur Erfassung der Position des Rennwagens auf der Strecke wird das von Sascha Lange entwickelte Carrera Vision verwendet. Zur Segmentierung des Fahrzeugs wird ein farbbasiertes Verfahren genutzt. Grundlage hierfür bildet eine Funktion
s : (r, g, b) → c
die jeden Punkt im RGB-Farbraum auf eine Klasse c abbildet. Vor Beginn der eigentlichen Positionsbestimmung muss s justiert werden, so dass der Rennwagen mittels einer einzigen Klasse klar segmentiert werden kann. Die Funktion s ist, da sie auf die Farbe eines einzelnen Pixels beschränkt ist, von einer Vielzahl nicht direkt beeinflussbarer Parameter abhängig. Als Beispiel seien hier die unterschiedlich gefärbten Rennwagen oder die momentane Beleuchtung angeführt.
Neben der angesprochener Erkennung enthält Carrera Vision ebenfalls Funktionen, um die aktuelle Position des Wagens wie in Abschnitt 1.3 angegeben zu parametrisieren.
Hierzu wird vor dem eigentlichen Betrieb zunächst der Streckenverlauf aufgezeichnet, indem der Rennwagen die Strecke vollständig abfährt.
Neben der aktuellen Position werden im laufenden Betrieb weiterhin die Abweichung des Rennwagens von der Strecke und dessen Winkel gegenüber dem normalen Streckenverlauf berechnet. Somit kann auch negatives Feedback, d.h. der Rennwagen befindet sich nicht mehr auf der Strecke, an NeuroRacer gesendet werden.
In diesen Zusammenhang stehen auch die Videos Learning to drive fast in TORCS using Batch Mode Reinforcement Learning und NeuroRacer.
Learning to drive fast in TORCS using Batch Mode Reinforcement Learning:
Jonas Gehring schrieb mir:
Ich möchte gerne nochmal betonen, dass ich wirklich nur an der Erkennung der Autos gearbeitet habe. Das eigentlich tolle am NeuroRacer ist der lernende Controller CLS^2 (http://ml.informatik.uni-freiburg.de/research/clsquare), der quasi durch Ausprobieren lernt, ein Carrera-Auto zu steuern.
Lesenswert sind auch die Beiträge Lernfähiger Rennwagen – NeuroRacer beweist künstliche Intelligenz, sowie Der »NeuroRacer« lernt aus seinen Fehlern.
Publikation der Arbeitsgruppe zu dem Thema als PDF The Neuro Slot Car Racer: Reinforcement Learning in a Real World Setting und die offizielle Homepage von Prof. Riedmiller’s Gruppe Machine Learning Lab – University of Freiburg
Weitere Informationen zu Jonas Gehring, sowie die Bachelorarbeit finden sich auf der Seite jgehring.net.
Kommentare als RSS-Feed abonnieren