31. Januar 2013
Life-long learning for visual scene understanding
Projekt “Life-long learning for visual scene understanding”
Christoph Lamperts Projekt “Life-long learning for visual scene understanding”, das von der Europäischen Kommission durch einen ERC Starting Independent Researchers Grant gefördert wird, ist nun angelaufen. Das Projekt an der Schnittstelle zwischen Computer Vision und maschinellem Lernen zielt darauf ab, Computer mit der Fähigkeit auszustatten, Fotos inhaltlich zu verstehen und ihr Verständnis durch Lernen kontinuierlich zu verbessern.
Damit ein Computer ein Bild auf derselben Ebene wie ein Mensch versteht, muss er erkennen, welche Objekte sichtbar sind, und wie diese interagieren. Zurzeit benötigen Computer separate Algorithmen um die verschiedenen Aufgaben die in einem Bild präsentiert werden zu lösen. Um etwa Katzen zu erkennen, muss der Computer ein neues Modell von Grund auf lernen, selbst wenn er zuvor gelernt hat Hunde zu erkennen. Außerdem sind Programme für das Verstehen visueller Szenen typischerweise nicht in der Lage, ihre Leistung zu verbessern, nachdem die Lernphase beendet ist. Wenn eine neue Aufgabe oder eine neue Stufe an Komplexität hinzugefügt werden, muss ein neues Programm entwickelt werden. Die Idee hinter Christoph Lamperts Projekt ist, dass ein Computer kontinuierlich lernen kann. Auf diese Weise baut der Computer über längere Zeit hinweg eine Wissensbasis auf, also einen gewissen „Hausverstand“ mit dem er Bilder verstehen kann, so wie wir Menschen ihn in unserer Kindheit entwickeln. Wir wissen zum Beispiel, dass es unwahrscheinlich ist, dass ein Gesicht in der Luft schwebt ohne mit einem Körper verbunden zu sein. Ein Computer, dem dieses Wissen fehlt, passiert es leicht, dass er alle Elemente eines Gesichtes zu erkennen meint, und so fälschlicherweise meint, ein schwebendes Gesicht zu sehen. Mit einer Wissensbasis, die durch kontinuierliches Lernen aufgebaut wird, werden solche Fehler vermieden. Der Computer erlernt, dass ein schwebendes Gesicht wenig Sinn macht.
Christoph Lamperts ERC Projekt besteht zu gleichen Teilen aus Theorie – maschinelles Lernen – und Praxis – Computer Vision. Die Theorie, wie kontinuierliches Lernen formal beschrieben und analysiert werden kann, wird mit Methoden des maschinellen Lernens entwickelt. Dies führt zu Algorithmen, die in der Computer Vision implementiert werden. Ein wichtiger Aspekt dabei ist, wie das aufgebaute Wissen im Programm repräsentiert wird, so dass es für die Zukunft nutzbar ist. Beispielsweise lässt es den Computer wissen, wie groß Objekte normalerweise sind, welche Objekte üblicherweise drinnen oder draußen zu finden sind, oder welches Verhalten in einer bestimmten Situation oft beobachtet wird. Die Fähigkeit, kontinuierlich und automatisch, ohne einen Menschen als „Lehrer“, von natürlichen Szenen zu lernen wird nicht auf eine Aufgabe beschränkt sein, sondern auf verschiedene zusammenhängende Aufgaben innerhalb der Computer Vision angewendet werden. So wird die Notwendigkeit überwunden, separate Programme für separate Objekte – Katzen, Hunde, Sessel – und separate Aktivitäten zu verwenden. Da Lernen in vielen Situationen passiert, ist die Idee des kontinuierlichen, automatischen Lernens von Computern auf lange Sicht interdisziplinär, mit Berührungspunkten in den Gebieten des natürlichen Lernens und der kognitiven Wissenschaften. Christoph Lamperts Projekt wird unterstützt durch ein ERC Starting Independent Researchers Grant in der Höhe von 1.5 Mio Euro mit einer Laufzeit von 5 Jahren, und begann im Jänner 2013.