Zitat-Disziplin: keine AZs aus dem Gedächtnis.
Die häufigste Halluzination im Mietrechts-RAG ist nicht das erfundene Aktenzeichen — sondern das echte, an die falsche Aussage geheftet. Wave D schließt das.
»Die qualifizierte Rüge nach § 556g BGB erfordert eine Bezifferung der monatlichen Rückforderung.«
Die Failure-Mode, die uns am meisten gekostet hat, war nicht die klassische Halluzination. Es war das echte Aktenzeichen — verifiziert im Corpus, sauber geschrieben, mit allem drum und dran — angeheftet an eine doktrinale Behauptung, die das Urteil so nie getroffen hat. Das Cite-Gate ging durch. Der Output sah aus wie sauberes Mietrecht. War es aber nicht.
Wir nennen das Proposition-Misattribution. Es ist gefährlicher als reine Halluzination, weil es nicht nur Vertrauen kostet — es passt auch durch jeden naiven Verifier durch. Das AZ existiert. Das Urteil ist real. Die Verknüpfung ist falsch.
Was sich geändert hat
Wave D fügt einen zweiten Gate-Layer über die existierende AZ-Verifikation. Jedes emittierte AZ muss jetzt zusätzlich einen Topic-Match-Test bestehen: gleicht das doktrinale Thema, das die Behauptung trägt, dem doktrinalen Thema, das durch das Urteil tatsächlich entschieden wurde?
Konkret: wir haben Regex-Patterns über alle cite_emit-Stellen gezogen und neun Wave-D-Files in Scope gebracht. Binary success criterion — entweder Topic-Match passt, oder das AZ wird nicht emittiert. Keine Konfidenz-Schwellen, keine fuzzy matches.
Was als Nächstes kommt
Citation-Integrity-Audit, geplant nach 24h Pipeline-Stabilität. Strukturelle Prüfung über alle bisher emittierten Drafts: existiert das AZ, sagt das Urteil tatsächlich was der Draft behauptet. Audit-Output wird hier veröffentlicht.
- RAG Reranker-Tuning für Mietpreisbremse-Cluster. Topic-Embeddings priorisieren §§ 556d–g vor allgemeinem Mietrecht.
- UI Befund-Approval: Sidebar-Spacing erhöht. Editorial-Section-Heads jetzt mit Hairline-Top-Rule statt 2px-Ink.
- Spine Stage 01
analyse-documenthandler-coverage von 7 auf 9doc_type-Familien.
- Auth Bug behoben:
accept-inviteerlaubte unter bestimmten Race-Conditions doppelteteam_members-Einträge. Datenbank-Trigger jetzt durchsetzend. - Email Postmark-Bounce-Logs werden bei Soft-Bounces nicht mehr als Hard-Failures markiert.