Engineering

WARUM "SMART CHUNKING" NICHT REICHT: HYBRID RAG IM SAFETY ENGINEERING

Vom klassischen Retrieval zur strukturierten Navigation durch Normen und Projektdokumente

Engineering8 min LesezeitMai 2026Von Waleed Aman

Im letzten Beitrag ging es um unser Grundprinzip: KI schlaegt vor, Menschen entscheiden. Diese Haltung ist wichtig, aber sie loest nur die halbe Aufgabe. Damit KI in ISO-26262-Workflows wirklich nuetzlich wird, muss sie mit hunderten Seiten Normtext, Projektdokumenten, Tabellen und Querverweisen umgehen können.

Die Illusion des "smarten" Chunkings

Am Anfang haben wir dort begonnen, wo viele Teams beginnen: mit klassischem Vector RAG. Dokumente werden in Chunks zerlegt, eingebettet und per Aehnlichkeitssuche wiedergefunden. Für viele Wissensdatenbanken funktioniert das gut. Safety-Normen sind aber keine gewoehnlichen Wissensdatenbanken.

Normen sind hierarchisch, voller Definitionen, Tabellen, Hinweise, Ausnahmen und Annex-Verweisen. Eine wichtige Regel steht vielleicht in Abschnitt 7, die dazugehoerige Tabelle erst einige Seiten später. Wenn Retrieval diese Teile getrennt oder gar nicht zusammenbringt, wird der Output schnell wackelig.

Wir haben deshalb strukturierte Extraktion ausprobiert: Überschriften, Unterabschnitte, Klauseln und Subklauseln erkennen und daraus bessere Chunks bauen. Das half, loeste das Problem aber nicht. Die harte Wahrheit ist: semantische Aehnlichkeit ist nicht gleich Engineering-Relevanz.

Der Durchbruch: Navigieren statt nur Suchen

Komplexes Safety Engineering braucht nicht nur Suche. Es braucht Navigation. Deshalb bewegen wir uns in Richtung einer PageIndex-basierten Architektur. Ein Standard wird dabei nicht als flache Menge von Textschnipseln behandelt, sondern als strukturierter Dokumentbaum mit Kapiteln, Abschnitten, Unterabschnitten und Beziehungen.

Wenn ein Engineer eine konkrete Safety-Frage stellt, kann das System dadurch zuerst den relevanten Dokumentzweig finden, dann tiefer navigieren und schliesslich die passende Klausel, Tabelle oder Definition extrahieren. Das ist naeher an der Art, wie erfahrene Engineers Normen tatsaechlich lesen.

Die Praxis: Genauigkeit allein reicht nicht

Warum dann nicht alles über strukturelle Navigation loesen? Weil produktive Engineering-Systeme Praezision, Latenz und Abdeckung ausbalancieren müssen. Eine tiefe Baum-Navigation ist genauer, aber oft langsamer. Breite Suche ist schneller, aber weniger verbindlich.

Die Lösung: Gestuftes Hybrid Retrieval

Aegis SafeForge nutzt deshalb eine gestufte Hybrid-Architektur. In Tier 1 Discovery suchen Vector Search und BM25 schnell nach relevanten Kandidaten. In Tier 2 Navigation folgt das System der Dokumentstruktur und extrahiert die konkreten Klauseln, Tabellen, Definitionen und den tragenden Kontext.

Warum das für Safety Engineering zaehlt

In funktionaler Sicherheit reicht "ungefaehr passend" nicht. Ein Hazard, ein ASIL, ein Safety Goal oder ein abgeleitetes Requirement muss auf den Kontext zurückfuehrbar sein, aus dem es entstanden ist. Engineers müssen nicht nur sehen, was die KI vorgeschlagen hat, sondern auch, welche Quelle, Klausel und Annahme dahintersteht.

Genau deshalb ist Retrieval-Architektur kein Nebenthema. Sie entscheidet darüber, ob KI nur Antworten erzeugt oder reviewbare Engineering-Vorschläge mit belastbarer Herkunft liefert.

Design Partner

Wenn Sie KI-gestützte HARA, TARA oder Requirements Traceability an einem eigenen Projektkontext testen möchten, öffnen wir aktuell 5 Design-Partner-Slots für DACH Safety Teams.