Nieuwe beeldverwerkingsmethodes voor robots en zelfrijdende auto's

De Nederlandse TU Eindhoven heeft automatische beeldherkenning ontwikkeld die sneller en nauwkeuriger werkt dan bestaande modellen, zodat robots, zelfrijdende auto's of drones beter kunnen herkennen wat ze zien.

Trefwoorden: #auto, #beeld, #herkenning, #robots, #zelfrijdend

Lees verder

research

( Foto: TU/e - Daan de Geus )

ENGINEERINGNET.BE - Voor automatische beeldanalyse worden neurale netwerken gebruikt, die gericht worden getraind.

Zo krijg je verschillende modellen die gespecialiseerd zijn in specifieke taken, zoals het zoeken naar alle auto’s in een afbeelding.

Promovendus Daan de Geus van TU Eindhoven onderzocht hoe je de nauwkeurigheid en efficiëntie van die modellen kan verbeteren, door middel van modelunificatie.

“Sommige taken focussen op voorgrondobjecten en andere op de achtergrond, zoals vegetatie en lucht. Dat wordt gedaan door twee verschillende neurale netwerkmodules, want elke module is gespecialiseerd in een andere taak. Maar twee modules gebruiken is niet efficiënt, want die moeten parallel draaien.” 

De Geus kwam erachter dat je extra informatie kunt geven aan de netwerkmodule die achtergrondinformatie verwerkt, zodat deze ook voorgrondobjecten kan identificeren.

“Daardoor is de module voor voorgrondprojecten niet meer nodig. Zo werkt dit model twee keer sneller dan voorheen, met een vergelijkbare nauwkeurigheid.”

Een andere manier om de efficiëntie te verbeteren, is gebaseerd op de observatie dat veel regio's in een afbeelding sterk op elkaar lijken. Zo bestaat een foto die je buiten neemt voor een groot deel uit lucht. Neurale netwerken verwerken iedere beeldregio apart, wat ook inefficiënt is.

Vandaar dat De Geus een methode ontwikkelde om patches met vergelijkbare informatie te clusteren, zodat je het totaalaantal patches reduceert en dus minder rekenkracht nodig hebt.

“Zo kunnen we de snelheid met tot wel 110% verbeteren, zonder dat dit de nauwkeurigheid beïnvloedt.” Deze methode is breed toepasbaar voor verschillende modellen en toepassingen. Bijvoorbeeld ook voor de segmentatie van medische afbeeldingen.

De Geus ontwikkelde verder een algoritme dat een afbeelding op meerdere abstractieniveaus tegelijk kan begrijpen.

“Zodat een mobiele robot zowel de auto als zijn onderdelen waar kan nemen, en dat voor verschillende objecten tegelijk en inclusief de achtergrond, waardoor je een alomvattend beeld van de omgeving krijgt.”

Dit verbeterde model is breed toepasbaar en brengt veel voordelen met zich mee. “Een robot kan daardoor bijvoorbeeld niet alleen een deur, maar ook de deurklink herkennen en begrijpen dat deze een onderdeel is van die deur. Dat stelt hem in staat om die deur openen.”  

Nieuwe uitdagingen kunnen het ontwikkelen van modellen zijn om meer verschillende objecten te herkennen, die nog sneller en accurater werken.

Ook zou je de generalisatie van het model kunnen verbeteren, zodat het ook goede resultaten geeft als de data afwijken van de datasets waarmee het netwerk is getraind en dus beter kan presteren in real-world scenario's.