Unsere Blogartikel

Startseite / Blogübersicht

Wie generative KI tödliche Baustellenunfälle vermeiden helfen kann

Wie generative KI tödliche Baustellenunfälle vermeiden helfen kann

!-- RSPEAK_STOP -->
Inhaltsverzeichnis

Im vergangenen Winter rutschte ein 32-jähriger Arbeiter namens Jose Luis Collaguazo Crespo beim Bau eines erschwinglichen Wohnbauprojekts auf Martha’s Vineyard in Massachusetts von einer Leiter im zweiten Stock ab und stürzte in den Keller. Er war einer von mehr als 1.000 Bauarbeitern, die jedes Jahr in den USA bei der Arbeit ums Leben kommen, womit diese Branche die gefährlichste für tödliche Ausrutscher, Stolperer und Stürze ist.

"Alle reden davon, dass Sicherheit oberste Priorität hat", sagte der Unternehmer und Geschäftsführer Philip Lorenzo bei einem Vortrag auf dem Construction Innovation Day 2025, einer Konferenz an der University of California, Berkeley, im April. "Aber intern hat sie dann vielleicht keine so hohe Priorität mehr. Die Leute nehmen Abkürzungen auf den Baustellen. Und so gibt es dieses ganze Tauziehen zwischen Sicherheit und Produktivität."

Um die Abkürzungen und die Risikobereitschaft zu bekämpfen, hat Lorenzo ein Programm für das in San Francisco ansässige Unternehmen DroneDeploy entwickelt. Das Unternehmen vertreibt eine Software, mit der sich täglich digitale Modelle des Arbeitsfortschritts aus Videos und Bildern erstellen lassen, was in der Branche als "Reality Capture" bezeichnet wird. Das neue Programm namens "Safety AI" analysiert die täglichen Reality-Capture-Bilder und zeigt mit einer Genauigkeit von 95 Prozent Bedingungen an, die gegen die Vorschriften der Occupational Safety and Health Administration (OSHA) verstoßen.

KI ist im Bauwesen auf dem Vormarsch

Das bedeutet, dass bei jedem Sicherheitsrisiko, das die Software anzeigt, die Anzeige mit 95-prozentiger Sicherheit korrekt ist und sich auf eine bestimmte OSHA-Vorschrift bezieht. Die Software kam im Oktober 2024 auf den Markt und wurde seither auf Hunderten von Baustellen in den USA eingesetzt, sagt Lorenzo. Dazu wurden auch länderspezifische Versionen mit Bauvorschriften etwa für Kanada, Großbritannien, Südkorea und Australien eingeführt.

Safety AI ist eines von mehreren KI-Tools für die Sicherheit im Bauwesen, die in den letzten Jahren vom Silicon Valley über Hongkong bis nach Jerusalem entstanden sind. Viele von ihnen stützen sich auf Teams menschlicher "Klicker", oft in Niedriglohnländern, die manuell Zeichen-Boxen um Bilder von Schlüsselobjekten wie Leitern ziehen, um große Datenmengen für das Training eines Algorithmus zu kennzeichnen.

Laut Lorenzo ist Safety AI das erste Unternehmen, das generative KI zum Aufspüren von Sicherheitsverstößen einsetzt. Das heißt, der Algorithmus kann mehr als nur Objekte wie Leitern oder Schutzhelme erkennen. Die Software kann "schlussfolgern", was in einem Bild einer Baustelle vor sich geht, und daraus schließen, ob ein OSHA-Verstoß vorliegt. Dies ist eine fortschrittlichere Form der Analyse als die Objekterkennung, die derzeit Industriestandard ist, so Lorenzo. Wie die Erfolgsquote von 95 Prozent zeigt, ist die Sicherheits-KI jedoch keine fehlerfreie und allwissende Intelligenz. Sie benötigt einen erfahrenen Sicherheitsinspektor als Aufseher.

Kann sich KI an ständig ändernde Baustellen anpassen?

Roboter und künstliche Intelligenz gedeihen am besten in kontrollierten, weitgehend statischen Umgebungen wie Fabrikhallen oder Versandterminals. Aber Baustellen verändern sich per Definition jeden Tag ein wenig. Lorenzo glaubt jetzt, dass er einen besseren Weg zur Überwachung von Baustellen gefunden hat, indem er eine Art von generativer KI verwendet, die als visuelles Sprachmodell oder VLM bezeichnet wird. Ein VLM ist ein LLM mit einem Vision-Encoder, der es ihm ermöglicht, Bilder der Welt zu "sehen" und zu analysieren, was in der Szene vor sich geht.

Lorenzos Team hat aus Reality-Capture-Bildern, die es über Jahre hinweg mit der ausdrücklichen Genehmigung von Kunden gesammelt hat, einen "goldenen Datensatz" zusammengestellt, wie er es nennt, der Zehntausende von Bildern von OSHA-Verstößen umfasst. Da es so viele spezifische Daten sind, macht er sich keine Sorgen, dass selbst ein milliardenschwerer Tech-Gigant in der Lage sein könnte, ihn zu "kopieren und zu vernichten".

Um das Modell zu trainieren, lässt Lorenzo ein kleines Team von Sicherheitsexperten aus dem Baugewerbe strategische Fragen an die KI stellen. Die Trainer geben Testszenen aus dem "goldenen" Datensatz in das VLM ein und stellen Fragen, die das Modell durch den Prozess der Zerlegung der Szene und deren schrittweise Analyse leiten, so wie es ein erfahrener Mensch tun würde. Wenn das VLM nicht die richtige Antwort generiert – zum Beispiel, wenn es einen Verstoß übersieht oder ein falsches positives Ergebnis registriert – optimieren die menschlichen Trainer die Aufforderungen oder Eingaben.

Wie bringt man einer KI bei, auf eine bestimmte Weise zu denken?

Lorenzo zufolge lernt das VLM nicht einfach nur, Objekte zu erkennen, sondern ihm wird auch beigebracht, "auf eine bestimmte Weise zu denken". Das bedeutet, dass es subtile Schlussfolgerungen über das Geschehen in einem Bild ziehen kann. Ein Beispiel: VLMs sind viel besser als ältere Methoden in der Lage, die Verwendung von Leitern zu analysieren, die für 24 Prozent der tödlichen Stürze in der Bauindustrie verantwortlich sind.

"Mit herkömmlichem maschinellem Lernen ist es sehr schwierig, die Frage zu beantworten, ob jemand eine Leiter auf unsichere Weise benutzt", sagt Lorenzo. "Man kann die Leitern finden. Man kann die Menschen finden. Aber eine logische Schlussfolgerung zu ziehen und zu sagen: 'Nun, dieser Person geht es gut' oder 'Oh nein, diese Person steht auf der obersten Stufe' – nur ein VLM kann eine logische Schlussfolgerung ziehen und dann sagen: 'In Ordnung, es ist unsicher. Und hier ist die OSHA-Referenz, die besagt, dass man nicht auf der obersten Sprosse stehen darf.'"

Antworten auf mehrere Fragen wie "Hat die Person auf der Leiter drei Kontaktpunkte?" und "Benutzt sie die Leiter wie Stelzen, um sich fortzubewegen?" werden kombiniert, um festzustellen, ob die Leiter auf dem Bild sicher benutzt wird. "Unser System besteht aus mehr als einem Dutzend Schichten von Fragen, nur um zu dieser Antwort zu gelangen", sagt Lorenzo. DroneDeploy hat seine Daten noch nicht zur Überprüfung freigegeben, aber er hofft, dass seine Methodik von unabhängigen Sicherheitsexperten geprüft wird.

Woran es der KI für den Bau noch mangelt

Die Verwendung von Bildsprachmodellen für die KI im Bauwesen ist vielversprechend, aber es gibt "einige ziemlich grundlegende Probleme" zu lösen, darunter Halluzinationen und das Problem der Randfälle, also der anomalen Gefahren, für die das VLM nicht trainiert wurde, sagt Chen Feng. Er leitet das AI4CE-Labor der New York University (NYU), das Technologien für 3D-Mapping und Szenenverständnis in der Baurobotik und anderen Bereichen entwickelt. "Fünfundneunzig Prozent sind ermutigend, aber wie können wir die verbleibenden fünf Prozent verbessern?"

Feng verweist auf eine Veröffentlichung von 2024 mit dem Titel "Eyes Wide Shut?", die von Shengbang Tong, einem NYU-Doktoranden verfasst und der KI-Koryphäe Yann LeCun mitverfasst wurde, in der "systematische Mängel" bei VLMs festgestellt wurden. "Bei der Objekterkennung können sie ziemlich gut die Leistung von Menschen erreichen", sagt Feng. "Bei komplizierteren Dingen müssen diese Fähigkeiten jedoch noch verbessert werden." Er merkt an, dass VLMs Schwierigkeiten haben, 3D-Szenenstrukturen aus 2D-Bildern zu interpretieren, dass sie kein gutes Situationsbewusstsein haben, wenn es darum geht, räumliche Beziehungen zu erkennen, und dass es ihnen oft an "gesundem Menschenverstand" in Bezug auf visuelle Szenen fehlt.

Lorenzo räumt ein, dass LLMs "einige große Schwächen" haben und sie sich mit räumlichen Schlussfolgerungen schwertun. Deshalb setzt Safety AI auch einige ältere Methoden des maschinellen Lernens ein, um räumliche Modelle von Baustellen zu erstellen. Zu diesen Methoden gehören die Segmentierung von Bildern in wichtige Komponenten und die Photogrammetrie, eine bewährte Technik zur Erstellung eines digitalen 3D-Modells aus einem 2D-Bild. Die Sicherheits-KI wurde auch in zehn verschiedenen Problembereichen, einschließlich der Verwendung von Leitern, intensiv trainiert, um die häufigsten Verstöße zu erkennen.

Die KI wird nicht alle brenzligen Lagen erkennen

Dennoch räumt Lorenzo ein, dass es Grenzfälle gibt, die das LLM nicht erkennen wird. Trotzdem stellt ein zusätzliches Paar digitaler "Augen" für überlastete Sicherheitsmanager, die oft für bis zu 15 Baustellen gleichzeitig verantwortlich sind, eine Verbesserung dar.

Aaron Tan, ein in der San Francisco Bay Area ansässiger Projektmanager für Beton, meint, dass ein Tool wie Safety AI für diese überlasteten Sicherheitsmanager hilfreich sein könnte. Man kann viel Zeit sparen, wenn sie per E-Mail benachrichtigt werden, anstatt eine zweistündige Fahrt zu einer Baustelle auf sich nehmen zu müssen. Und wenn die Software nachweisen kann, dass sie zur Sicherheit der Mitarbeitenden beiträgt, wird sie seiner Meinung nach auch von den Arbeitnehmern angenommen werden.

Tan stellt jedoch fest, dass die Arbeitnehmenden auch befürchten, dass diese Art von Instrumenten als "Bossware" eingesetzt wird, um sie in Schwierigkeiten zu bringen. "In meinem letzten Unternehmen haben wir Kameras [als] Sicherheitssystem eingeführt. Und das hat den Leuten nicht gefallen", sagt er. "Sie sagten: 'Oh, Big Brother. Ihr beobachtet mich ständig, ich habe keine Privatsphäre.'"

Älter heißt nicht veraltet

Izhak Paz, CEO des in Jerusalem ansässigen Unternehmens Safeguard AI, hat die Integration von VLMs in Erwägung gezogen. Dann aber blieb er bei dem älteren Paradigma des maschinellen Lernens, weil er es für zuverlässiger hält. Das "alte maschinelle Sehen", das auf maschinellem Lernen basiert, "ist immer noch besser, weil sie eine Mischung aus der Maschine selbst und dem menschlichen Eingreifen bei der Verarbeitung von Daten ist", sagt er.

Um den Algorithmus für eine neue Gefahrenkategorie zu trainieren, sammelt sein Team eine große Menge an gekennzeichnetem Filmmaterial, das mit der spezifischen Gefahr in Verbindung steht, und optimiert dann den Algorithmus, indem er falsch positive und falsch negative Ergebnisse ausfiltert. Dieser Prozess kann von Wochen bis zu sechs Monaten dauern, sagt Paz.

Nach Abschluss des Trainings führt Safeguard AI eine Risikobewertung durch, um potenzielle Gefahren auf dem Gelände zu identifizieren. Es kann den Standort in Echtzeit "sehen", indem es auf das Bildmaterial einer beliebigen, mit dem Internet verbundenen Kamera in der Nähe zugreift. Anschließend sendet ein KI-Agent Anweisungen für das weitere Vorgehen an die Mobilgeräte der Bauleiter.

Paz lehnt es ab, einen genauen Preis zu nennen, aber er sagt, sein Produkt sei nur für Bauunternehmen ab dem mittleren Marktsegment erschwinglich, insbesondere für diejenigen, die mehrere Baustellen verwalten. Das Tool wird an rund 3.500 Standorten in Israel, den Vereinigten Staaten und Brasilien eingesetzt.

"Unser System darf keine Halluzinationen haben!"

Buildots, ein in Tel Aviv ansässiges Unternehmen, über das die MIT Technology Review bereits im Jahr 2020 berichtete, führt keine Sicherheitsanalysen durch, sondern erstellt ein- bis zweimal wöchentlich visuelle Fortschrittsberichte von Baustellen. Buildots verwendet auch die ältere Methode des maschinellen Lernens mit beschrifteten Trainingsdaten. "Unser System muss zu 99 Prozent funktionieren – wir dürfen keine Halluzinationen haben", sagt Geschäftsführer Roy Danon.

Heute sei es viel einfacher, beschriftete Trainingsdaten zu erhalten, als es 2018 zu Beginn des Projekts der Fall war. Das Sammeln von Videomaterial von Baustellen bedeutet nämlich, dass jedes Objekt, wie etwa eine Steckdose, in vielen verschiedenen Bildern aufgenommen und dann beschriftet werden kann. Aber das Tool ist hochkarätig: Etwa 50 Bauunternehmen, die meisten mit einem Umsatz von über 250 Millionen US-Dollar, nutzen Buildots in Europa, dem Nahen Osten, Afrika, Kanada und den USA. Bislang wurde es bei über 300 Projekten eingesetzt.

Ryan Calo, Spezialist für Robotik und KI-Recht an der University of Washington, ist von der Idee der KI für die Sicherheit im Bauwesen begeistert. Da erfahrene Sicherheitsbeauftragte im Baugewerbe jedoch bereits überlastet sind, befürchtet Calo, dass die Bauunternehmen versucht sein werden, den Menschen ganz aus dem Sicherheitsprozess zu verdrängen. "Ich halte KI und Drohnen zum Aufspüren von Sicherheitsproblemen, die sonst zum Tod von Arbeitern führen würden, für superschlau", sagt er. "Solange sie von einem Menschen überprüft werden."

Dieser Beitrag ist zuerst bei t3n.de erschienen.