Automatische Bilderkennung
Sieh mal einer an!
14.05.2018
Mehrdimensionale Matrizen, Faltungslayer, Fully Connected Layer, Bounding Boxes, neuronale Netze – fragt man Robert Koch, Data Scientist in der Forschungs- und Entwicklungsabteilung bei ControlExpert, wie genau automatische Bilderkennung eigentlich funktioniert, erhält man auf jeden Fall detaillierte Antworten. Als einer der Bilderkennungs-Masterminds ist der Mathematiker bei ControlExpert ganz in seinem Element. Glücklicherweise versteht er es, das Ganze auch so zu erklären, dass die Aufnahmefähigkeit eines interessierten Laien nicht an Fachbegriffen zerschellt. „Facebook, Google, Apple – alle arbeiten an Anwendungen wie etwa der Gesichtserkennung. Dieselben Verfahren und Algorithmen werden auch bei ControlExpert genutzt und auf Bildern von Autos angewendet“, so Kai Siersleben, Geschäftsführer bei ControlExpert, kurz und bündig zu diesem Thema. In der Tat ist Bilderkennung eines der weltweit aktivsten Forschungsfelder. „Eigentlich forscht in diesem Bereich derzeit jeder“, so Robert Koch. „Dabei ist die Community unheimlich rege und arbeitet eng zusammen. Der gegenseitige Austausch an Wissen kommt allen zugute.“ Das ist aufgrund des sehr komplexen und komplizierten Feldes auch nicht anders möglich. So bildet das Lesen von Forschungsartikeln, das Durchkämmen von Blogs, Tutorials und Online-Workshops das Fundament für die eigene Arbeit. Das Forschungs- und Entwicklungsteam bei ControlExpert hat unter anderem zum Ziel, die Software auf Fahrzeugteile zu trainieren und diese automatisiert auf Bildern erkennen zu können. In den vergangenen Monaten erzielte das Team große Fortschritte: Eine Vielzahl der Karosserie-Teile kann bereits mit einer großen Genauigkeit erkannt werden.
Um allein so weit zu kommen, bedurfte es einiger Vorarbeit und hoher Rechnerkapazitäten. Für aktuelle künstliche neuronale Netze (Stichwort: Deep Learning) ist deutlich mehr Rechenpower als früher nötig. Am meisten profitieren diese Modelle von parallelen Recheneinheiten, wie sie insbesondere in Grafikkarten als Graphics Processing Unit (GPU) verbaut sind. Mittlerweile arbeiten wir mit mehreren Grafikkarten parallel, um die Modellentwicklung weiter zu beschleunigen. Im nächsten Schritt galt es, Bildmaterial von Fahrzeugen zu bekommen. Liegen diese Bilder vor, werden sie im Pre-Processing zunächst gelabelt, das heißt alle sichtbaren sowie relevanten Informationen werden in sogenannte Label-Files gepackt. Hat man einen ausreichend großen Datensatz von gelabelten Bildern, beginnt das eigentliche “Lernen“ der Modelle für den Computer. Eine geeignete Trainingsumgebung wird aufgesetzt, ein neuronales Netz implementiert – und los geht’s: Das Deep Learning beginnt.
Die Trainingsdauer variiert von einigen Stunden bis hin zu mehreren Tagen. Bilderkennung ist ein komplexes Thema mit hohem Rechenaufwand. Man benutzt daher ein iteratives Vorgehen, um bei jeder Wiederholung genauer zu werden. Nach dem Training erfolgt dann die eigentliche Evaluierung, das heißt: Welche Bilder hat der Computer richtig erkannt? Welche Ersatzteile erkennt er nun besser? Welche Vorhersagen sind noch nicht korrekt? Diese Auswertung erfolgt ebenfalls durch Computerprogramme. Mit einer stetig wachsenden Bild- Datenbank durchläuft der Computer Lernprozess um Lernprozess – und wird dadurch in seinen Vorhersagen immer präziser. Und die Modelle werden so lange weiter trainiert, bis sie keinen Zuwachs in der Genauigkeit mehr aufweisen.
Vor allem bei der Prüfung von Schadenfällen ergeben sich durch die automatische Bilderkennung enorme Vorteile. Die vorliegende Schadenkalkulation mit den zugesendeten Bildern kann abgeglichen und so validiert werden. Damit unterstützt Bilderkennung die Kfz-Meister von ControlExpert unmittelbar und erhöht entsprechend die Qualität der Prüfprozesse. Dadurch erleichtert sie z.B. die Erstellung von Schadenhöhenprognosen für EasyClaim – und hier ist noch weitaus mehr möglich.