Revolutionäre 3D-Kartierung mit KI enthüllt
|

Revolutionäre 3D-Kartierung mit KI enthüllt

Das Wichtigste in Kürze

  • Forscher des MIT haben ein neues System entwickelt, damit Roboter ihre Umgebung schnell in 3D kartieren können.
  • Die Methode kombiniert künstliche Intelligenz (KI) mit bewährten Techniken der Computer-Vision.
  • Anstatt einer großen Karte werden viele kleine Teilkarten erstellt und nahtlos zusammengefügt, wodurch eine hohe Geschwindigkeit erreicht wird.
  • Das System benötigt keine speziell kalibrierten Kameras und ist dadurch einfacher in der Anwendung.
  • Mögliche Einsatzgebiete sind Rettungsroboter, Logistik und erweiterte Realität (Extended Reality).

Neue Methode zur 3D-Kartierung durch Roboter

Ein Roboter in einem Katastrophengebiet, wie einem eingestürzten Bergwerk, steht vor einer großen Herausforderung. Er muss sich schnell einen Überblick über die unvorhersehbare Umgebung verschaffen, um eingeschlossene Personen zu finden. Bisherige Systeme auf Basis von maschinellem Lernen können oft nur wenige Bilder gleichzeitig verarbeiten. Sie sind deshalb für große Areale zu langsam.

Die Lösung: Kleine Karten zu einem großen Ganzen

Forscher am Massachusetts Institute of Technology (MIT) haben nun einen neuen Ansatz entwickelt. Ihr KI-gestütztes System erfasst die Umgebung schrittweise und verarbeitet so eine unbegrenzte Anzahl an Bildern. Das System versucht nicht, die gesamte Szene auf einmal zu kartieren. Stattdessen erstellt es viele kleinere Teilkarten. Diese einzelnen Segmente werden anschließend wie Puzzleteile zu einer vollständigen und präzisen 3D-Karte zusammengesetzt. Während dieses Prozesses schätzt das System kontinuierlich die Position des Roboters in Echtzeit.

Die Kunst der präzisen Ausrichtung

Eine besondere Schwierigkeit bei diesem Vorgehen ist die exakte Ausrichtung der Teilkarten. KI-Modelle können bei der Verarbeitung von Bildern leichte Ungenauigkeiten in den 3D-Karten erzeugen. Eine einfache Drehung oder Verschiebung der Teilkarten reicht für eine passgenaue Verbindung nicht aus. Die Forscher griffen auf Ideen aus der klassischen Computer-Vision zurück. Sie entwickelten eine flexible mathematische Technik, die diese Verformungen berücksichtigt und korrigiert. Das System stellt so sicher, dass alle Teilkarten konsistent angepasst und nahtlos zusammengefügt werden.

Was ist SLAM?

Die hier angewandte Technologie ist ein zentraler Bestandteil der Roboternavigation. Sie wird als SLAM bezeichnet. Die Abkürzung steht für „Simultaneous Localization and Mapping“, was auf Deutsch „gleichzeitige Lokalisierung und Kartenerstellung“ bedeutet. Ein Roboter mit SLAM-Fähigkeit erstellt eine Karte seiner Umgebung. Gleichzeitig weiß er immer, wo er sich auf dieser Karte befindet. Dieser Prozess ist fundamental, damit sich autonome Systeme sicher in unbekanntem Terrain bewegen können.

Praktische Anwendungen und Ergebnisse

Die Einsatzmöglichkeiten dieser neuen Methode sind vielfältig. Rettungsroboter könnten davon profitieren, aber auch Industrieroboter in großen Lagerhallen. Sie könnten Waren schneller finden und transportieren. Eine weitere Anwendung liegt im Bereich der erweiterten Realität (Extended Reality, XR) für VR-Brillen. In Tests konnte das System komplexe Umgebungen fast in Echtzeit kartieren. Dafür nutzten die Forscher lediglich kurze Videos von einem normalen Smartphone. Die durchschnittliche Abweichung in den erstellten 3D-Rekonstruktionen betrug dabei weniger als fünf Zentimeter.

Unsere Einschätzung

Die am MIT entwickelte Methode stellt einen wichtigen Fortschritt für die autonome Roboternavigation dar. Die Kombination aus modernen KI-Modellen und etablierten Algorithmen der Computer-Vision ist besonders wirkungsvoll. Sie löst das Problem der Skalierbarkeit, mit dem bisherige Systeme zu kämpfen hatten. Die Technik kommt ohne speziell kalibrierte Kameras aus. Dies senkt die Hürde für den praktischen Einsatz erheblich.

Besonders die hohe Geschwindigkeit und Präzision bei der Kartenerstellung sind überzeugend. Dies könnte die Entwicklung von Robotern für den Einsatz in kritischen Situationen maßgeblich beschleunigen. Der Ansatz eröffnet auch neue Möglichkeiten für kommerzielle Anwendungen in der Logistik oder für Konsumentenprodukte wie XR-Brillen. Die Fähigkeit, große und komplexe Umgebungen schnell zu erfassen, ist ein entscheidender Schritt hin zu intelligenteren autonomen Systemen.

Quellen:
Den Originalartikel des MIT findest du hier.

Ähnliche Beiträge